Site Loader

Лекция «кодирование звуковой информации»

При передаче информации происходит кодирование информации, и мы должны договориться о том, как понимать те или иные обозначения. Человек выражает свои мысли словами. Они являются алфавитным представлением информации. На уроках физики при рассмотрении какого-либо явления мы используем формулы. В этом случае говорят о языке алгебры. Формула — это математический код. Существует язык глухонемых, где символы — мимика и жесты; язык музыки, где символы — ноты и т.д. Основу любого языка составляет алфавит — конечный набор различных символов, из которых складывается сообщение. Одна и та же запись может нести разную смысловую нагрузку. Например, набор цифр 251299 может обозначать: массу объекта; длину объекта; расстояние между объектами; номер телефона; дату 25 декабря 1999 года. Эти примеры говорят, что для представления информации могут использоваться разные коды, и поэтому надо знать законы записи этих кодов, т.е. уметь кодировать.

Код — набор условных обозначений для представления информации.

Кодирование — процесс представления информации в виде кода. Кодирование сводится к использованию совокупности символов по строго определенным правилам. При переходе улицы мы встречаемся с кодированием информации в виде сигналов светофора. Водитель передает сигнал с помощью гудка или миганием фар. Кодировать информацию можно устно, письменно, жестами или сигналами любой другой природы. По мере развития техники появились разные способы кодирования информации. Во второй половине XIX века американский изобретатель Морзе изобрел удивительный код, который служит человечеству до сих пор.
В качестве источников информации может выступать человек, техническое устройство, предметы, объекты живой и неживой природы. Получателей сообщения может быть несколько или один.

В процессе обмена информацией мы совершаем две операции: кодирование и декодирование. При кодировании происходит переход от исходной формы представления информации в форму, удобную для хранения, передачи или обработки, а при декодировании — в обратном направлении. 

Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком. Знак — это элемент конечного множества отличных друг от друга элементов. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.  Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму.

Кодирование звуковой информации— звуковая информация может быть представлена последовательностью элементарных звуков (фонем) и пауз между ними. Каждый звук кодируется и хранится в памяти. Вывод звуков из компьютера осуществляется синтезатором речи, который считывает из памяти хранящийся код звука. Гораздо сложнее преобразовать речь человека в код, т.к. живая речь имеет большое разнообразие оттенков. Каждое произнесенное слово должно сравнивать с предварительно занесенным в память компьютера эталоном, и при их совпадении происходит его распознавание и запись. 

Временная дискретизация звука. Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц). В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки причем для каждого такого участка устанавливается определенная величина амплитуды. Непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».

Глубина кодирования. Каждой «ступеньке» присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.Временная дискретизация звука

Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука. Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно: N = 2

I — 216 = 65 536.

Частота дискретизации.

Качество цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала. Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Качество оцифрованного звука.

Чем больше глубина и частота дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, будет при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим моно). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-СD, будет при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим стерео). Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем высококачественного звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 48 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду и умножить на 2 (стереозвук): 16 бит х 48 000 х 2 = 1 536 000 бит = 192 000 байт = 187,5 Кбайт.

Звуковые редакторы.

Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.). Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV, в формате со сжатием МРЗ.

Тестовое задание на тему «Кодирование звуковой информации»

Тест на тему “Кодирование звуковой информации”

1. Какой формат позволяет с хорошим качеством и степенью сжатия кодировать музыку:

а) WAV

б) MIDI

в) MPEG

г) MP3

2. С увеличением частоты дискретизации …

а) повышается качество оцифровки звукового сигнала

б) повышается разрядность квантования звукового сигнала

в) увеличивается количество обертонов в звуковом сигнале

г) увеличивается интенсивность звука

3. Амплитуда звукового сигнала говорит …

а) о тембре этого сигнала

б) о тоне этого сигнала

в) о громкости этого сигнала

г) о количестве обертонов в этом сигнале

4. В каком формате можно хранить оцифрованный звук без сжатия?

а) МР3

б) WAV

в) AVI

г) MPEG

5. Каково минимальное значение разрядности квантования, обеспечивающее приемлемое качество звука?

а) 4 бита

б) 8 бит

в) 16 бит

г) 20 бит

6. Частота дискретизации звукового сигнала определяется …

а)  количеством выборок мгновенных значений звукового сигнала за секунду

б)  шагом квантования от максимальной громкости сигнала

в)  определённым уровнем громкости звукового сигнала

г)  тембром звукового сигнала

7. В соответствии с теоремой Котельникова, чтобы качественно восстановить аналоговый звук, частота дискретизации должна превышать максимальную частоту спектра сигнала …

а) в 1,2 раза

б) в 1,5 раза

в) в 2 раза

г) в 2,5 раза

8. Каков нижний предел чувствительности человеческого уха

а) 30 дБ

б) 20 дБ

в) 10 дБ

г) 0 дБ

9. Качество оцифрованного звукового сигнала, тем выше, чем …

а) выше частота дискретизации

б) больше глубина кодирования звука

в) больше информационный объём звукового файла

г) меньше разрядность квантования

10. Какое количество информации необходимо для кодирования каждого из 65536 возможных уровней интенсивности звукового сигнала?

а) 256 бит

б) 64 бит

в) 16 бит

г) 8 бит

11. Для чего звуковой сигнал должен быть преобразован в цифровую форму?

а) для увеличения его интенсивности

б) для возможности обработки его компьютером

в) для повышения слышимости звука

г) для повышения тона звука

12. Микрофон осуществляет преобразование …

а)  аналогового звукового сигнала в цифровой электрический сигнал

б)  аналогового звукового сигнала в аналоговый электрический сигнал

в)  цифрового звукового сигнала в цифровой электрический сигнал

г) цифрового звукового сигнала в аналоговый электрический сигнал

Ответы на тест

1 г

7 в

2 а

8 а

3 в

9 а

4 б

10 в

5 в

11 б

6 а

12 б

Кодирование звуковой информации. Подготовка к ЕГЭ

Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.

Цель-мотивация. Подготовка к ЕГЭ.

План урока

1. Просмотр презентации по теме с комментариями учителя. Приложение 1

Материал презентации: Кодирование звуковой информации.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ:

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так

далее). Уровни громкости звука можно рассматривать как набор  возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Аудиоадаптер (звуковая плата) — специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:

  • Частотой дискретизации
  • Разрядностью(глубина звука).

Частота временной дискретизации

— это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра  (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.

Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 28= 256 (216=65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2I = 216 = 65536, где I — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты  дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

Звуковой файл — файл, хранящий звуковую информацию в числовой двоичной форме.

2. Повторяем единицы измерения информации

1 байт = 8 бит

1 Кбайт = 210 байт=1024 байт

1 Мбайт = 210 Кбайт=1024 Кбайт

1 Гбайт = 210 Мбайт=1024 Мбайт

1 Тбайт = 210 Гбайт=1024 Гбайт

1 Пбайт = 210 Тбайт=1024 Тбайт

3. Закрепить изученный материал, просмотрев презентацию, учебник [1]

4. Решение задач

Учебник [1], показ решения на презентации.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

Запись условия

T=1 сек

I=16 бит

H= 48 кГц

Стерео — ×2

V=?

Решение

V= T ×I × H × 2

V=1 ×16 × 48 000 × 2=

1536000 бит/8  =192000 байт/1024 = 187,5 Кбайт

Задача (самостоятельно). Учебник [1], показ решения на презентации.
Определить информационный объем цифрового  аудио файла длительностью звучания которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении 8 битов.

Запись условия

T=10 сек

I=8 бит

H= 22,05 кГц

Моно- ×1

V=?

Решение

V= T ×I × H × 1

V=10 ×8 × 22,05 × 1=

10 × 8 × 22 050 бит/8  = 220500 байт/1024 = 215,332/1024 Кбайт = 0,21 Мбайт

5. Закрепление.  Решение задач дома, самостоятельно на следующем уроке

Учебник [1]

№ 90

Определить объем памяти для хранения цифрового аудио­файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

Запись условия

T=2 мин

I= 16 бит

H= 44,1 кГц

Моно- ×1

V=?

Решение

V= T ×I × H × 2

V=2×60 ×16 × 44,1 × 1=

(120 × 16 × 44 010) бит  = 84672000 бит/8= 10584000байт/1024 = 10335,9375 Кбайт/1024  = 10,09 Мбайт

№ 91

В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретиза­ции и разрядность?

Запись условия

V=2,6 Мб

 T=1 мин

 Моно- ×1

I= ?

H= ?

Решение

V= T ×I × H × 1; I × H= V /  T

I × H= 2,6 Мб/1 мин. = 2,6×1024×1024×8 бит/ 60 сек=21810380,8/60=

363506,237

363506,237/8=45438,3

363506,237/16=22719,15

Ответ.

Если I=8 ,бит, то H=44,1 кГц.

Если I=16 бит, то H=22,05 кГц.

№ 92

Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифро­вого аудиофайла, записанного с частотой дискретизации 22,05 кГц?

№ 93

Одна минута записи цифрового аудиофайла занимает на дис­ке 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?

№ 94

Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

№ 95

Цифровой аудиофайл содержит запись звука низкого качест­ва (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?

№ 96

Две минуты записи цифрового аудиофайла занимают на дис­ке 5,05 Мб. Частота дискретизации — 22 050 Гц. Какова раз­рядность аудиоадаптера?

№ 97

Объем свободной памяти на диске — 0,1 Гб, разрядность зву­ковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

Ответы

№ 92. 124,8 секунды.

№ 93. 22,05 кГц.

№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти — 15,1 Мб.

№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации — 11 кГц, разрядность аудиоадаптера — 8. Длительность звучания равна 60,5 с.

№ 96. 16 битов.

№ 97. 20,3 минуты.

Литература

1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера )

2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.

3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.

Представление нечисловой информации в компьютере

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 10 классы | Планирование уроков на учебный год | Представление звуковой информации в компьютере





Представление звуковой информации в компьютере

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека. Чем больше частота сигнала, тем выше тон. Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz). Человеческое ухо способно воспринимать звуки в диапазоне от 20 Гц до 20 кГц, который называют звуковым.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука. Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц). Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за 1 секунду:

— 1 (одно) измерение в секунду соответствует частоте 1 Гц;
— 1000 измерений в секунду соответствует частоте 1 кГц.

Количество измерений может лежать в диапазоне от 8 кГц до 48 кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, и следовательно, может быть описан кодом. Разложение звуковых сигналов в гармонические ряды и представление в виде дискретных цифровых сигналов (рис. 1.5) выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП).

Рис. 1.5. Преобразование звукового сигнала в дискретный сигнал:
a — звуковой сигнал на входе АЦП; б — дискретный сигнал на выходе АЦП

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука представлен на рис. 1.6. Данный метод кодирования не дает хорошего качества звучания, но обеспечивает компактный код.

Рис 1.6. Преобразование дискретного сигнала в звуковой сигнал:
а — дискретный сигнал на входе ЦАП; б — звуковой сигнал на выходе ЦАП

Таблично-волновой метод (Wave-Table) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д.. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Средства и технологии обработки звуковой информации


Кодирование аудиоинформации

Так как компьютер работает с числами, звуки и музыка должны быть представлены в числовом виде, или, как принято говорить, закодированы. Произвольная аудиоинформация при кодировании занимает много места, поэтому часто используют сжатые аудиоформаты. Музыка занимает меньше места, так как хорошо формализуется – ее можно записать с помощью нот.

Звук представляет собой волну, распространяющуюся в атмосфере, и воспринимаемую человеком с помощью органов слуха. Громкость звука – это его кажущаяся сила. Измеряется громкость в децибелах (дБ). Громкость обычного разговора около 50 дБ, шум на улице часто превышает 70 дБ, а громкость взлетающего самолета составляет 120 дБ. Порог чувствительности человеческого уха около 20 дБ.

Характеризуется звуковая волна изменением во времени частоты и амплитуды сигнала. Графически звуковая волна описывается кривой, задающей зависимость амплитуды от времени. Частота основных колебаний определяет высоту звука. Но звуки одной частоты могут иметь разный тембр.

Чтобы закодировать звук, необходимо измерять амплитуду сигнала через определенные промежутки времени. На каждом временном отрезке определяется средняя амплитуда сигнала. Графически такое преобразование описывается множеством столбиков.

При восстановлении исходной кривой ее вид будет искажен. Искажения тем больше, чем больше ширина столбиков, то есть чем реже определяется текущая амплитуда. Чем промежутки времени меньше, тем выше будет качество закодированного звука. Частота, с которой определяется амплитуда сигнала, называется частотой дискретизации.

Амплитуда сигнала, определенная в каждый момент времени, также должна быть представлена в числовом виде. В простейшем случае можно использовать один бит – есть звук или его нет. Но на практике такое кодирование не имеет смысла. Минимально для кодирования амплитуды сигнала отводятся восемь бит – один байт, что позволяет описать двести пятьдесят шесть уровней громкости. Качество звука при этом получается не слишком высокое. Если и частота дискретизации невелика, то при воспроизведении будут присутствовать сильные искажения. Значительно лучшее качество получается при использовании двух байт, что позволяет задать более шестидесяти пяти тысяч разных значений амплитуды. В большинстве случаев двух байт достаточно для получения высококачественной записи звука, хотя иногда применяют 24 бита – три байта для кодирования амплитуды сигнала.

Для кодирования звуков следует использовать частоту вдвое большую, чем частота кодируемого звука. Объяснение этому довольно простое. Звуковая волна состоит из двух полупериодов: положительного и отрицательного. Поэтому для ее имитации необходимо иметь хотя бы по одной выборке на каждом из полупериодов. Так как человек воспринимает звуки в диапазоне частот от 20 до 20000 Гц, то для качественного кодирования необходимо использовать частоту вдвое большую, чем 20000, то есть 40000 Гц. Тогда сохраненные выборки позволят воспроизводить звуковую волну внутри диапазона, воспринимаемого человеческим ухом. Для качественного кодирования звука принято иметь некоторый запас, поэтому при цифровой звукозаписи используется частота дискретизации 44100 Гц и 48000 Гц. Это означает, что за каждую секунду звукозаписи в цифровом виде записывается более 44000 единиц информации, последовательность которых моделирует звук длительностью в одну секунду.

Для того чтобы записать стереозвук, следует одновременно кодировать два независимых канала звука. При этом чтобы получить хорошее качество, нужно использовать два байта для кодирования и частоту дискретизации 44100 Гц для каждого из каналов. Именно так кодируется звук на компакт-дисках. При этом одна минута закодированного звука займет более 10 Мб. В некоторых случаях можно обойтись более низким качеством, сравнимым с качеством записи диктофона. Для того чтобы закодировать голос, не предъявляя повышенных требований к качеству звучания, можно использовать один байт при кодировании и один монофонический канал. Частоту дискретизации также можно понизить. Чтобы разбирать отдельные слова и понимать их смысл, достаточно частоты дискретизации 8000 Гц. С такими параметрами минута закодированного звука займет менее 480 Кб.

Для повышения качества кодирования используют более высокие частоты дискретизации, до 96000 Гц, однако такое качество требуется исключительно при работе в профессиональных звукозаписывающих студиях.

Современные компьютеры часто используются при создании и воспроизведении музыки. Музыкальное произведение можно закодировать как любой другой звук, однако это займет много места. Кроме того, возникнут трудности при изменении партий отдельных инструментов. Проще указать инструмент и задать, какую ноту и как долго он должен играть. Для воспроизведения музыки компьютер синтезирует разнообразные звуки, которые издают музыкальные инструменты.

В компьютерной музыке используется аббревиатура MIDI, которая расшифровывается как Musical Instrument Digital Interface (Цифровой интерфейс музыкальных инструментов). Имеется стандарт, описывающий основные используемые инструменты, – GM (General MIDI – единый MIDI). В стандарте описаны пятнадцать групп мелодических инструментов и одна группа ударных инструментов. Мелодический набор состоит из пианино, органов, гитар, струнных, духовых и тому подобных инструментов. За всеми инструментами закреплены номера, например, нулевой номер имеет акустический рояль. Кроме GM используются стандарты GS (General Synth – единый синтез), XG (Extended General – единый расширенный), GM2 (General MIDI 2). Все эти стандарты не заменяют собой GM, а лишь дополняют его новыми инструментами и дополнительными параметрами звучания.

Несмотря на то, что инструменты и тембры стандартизированы в GM, а MIDI-файл содержит только номера инструментов и тембров, этот файл по-разному будет воспроизводиться на разных звуковых картах. Это объясняется несколькими причинами. Так, в стандарте описаны только названия инструментов и тембров. Такие параметры звука, как громкость, окраска и другие не определены и выбираются производителями звуковых карт произвольно.

Кроме того, на качество воспроизведения звука сильно сказывается метод, которым этот звук воспроизводится. Применяют два основных метода синтеза звуков. Более простой метод называется частотным синтезом (FM-синтез). Для каждой ноты каждого инструмента определена частота и амплитуда звука, и звуковая плата компьютера синтезирует звук. Однако при этом синтезированные звуки получаются не слишком похожими на звучание реальных инструментов. В современных звуковых платах частотный синтез не используется.

Значительно лучшее качество звучания дают волновые таблицы (Wave Table). В таблице записаны закодированные звуки реальных инструментов. При этом используется метод кодирования амплитуды звукового сигнала через короткие промежутки времени. Например, если требуется воспроизвести удар по тарелке, звуковая плата проигрывает небольшой фрагмент, записанный в определенном месте таблицы. Фрагменты называют сэмплами (samples). Инструменты с малой длительностью звучания обычно записываются полностью, а для остальных может записываться лишь начало, конец звука и небольшая средняя часть, которая затем проигрывается в цикле в течение нужного времени. Такое кодирование обеспечивает предельную реалистичность звучания классических инструментов и простоту получения звука. Однако волновые таблицы могут занимать много места в памяти.

Так как музыка, представленная в цифровом виде, не требует преобразований, к компьютеру напрямую можно подключить цифровые синтезаторы. Наигрывая мелодию на синтезаторе, в компьютер вводится последовательность нот. Также синтезаторы позволяют проигрывать композиции, созданные на компьютере. Загрузив в синтезатор сэмплы из волновой таблицы, можно извлекать самые необычные звуки при нажатии клавиш.

В последнее время стало модным караоке, и в компьютере стали кодировать музыку вместе с текстом. Фактически караоке является вариантом MIDI. Музыка закодирована обычным способом, но дополнительно добавлен текст, заменивший описание одного из инструментов.

Хотя частота дискретизации при кодировании звукового сигнала по компьютерным меркам не очень велика, объем получившихся цифровых данных достаточно большой. Чтобы уменьшить объем, занимаемый цифровыми аудиоданными, применяют различные методы сжатия информации, в частности алгоритмы MPEG. Например, применение сжатия по алгоритму MPEG-1 Layer 3 (МР3) позволяет уменьшить объем данных более чем в десять раз, при сохранении качества звука, близкого к audio-CD. Наряду с МР3 применяется формат сжатия по стандарту WMA (Windows Media Audio), поддерживаемый последними версиями операционных систем Windows.

В обоих стандартах используется метод сжатия по психоакустической модели, то есть из исходного звукового сигнала удаляется информация, малозаметная на слух, после чего сигнал сжимается обычными методами, которые реализованы в программах–архиваторах. При таком методе кодирования неизбежно искажение исходного сигнала, а значит – потеря качества. Степень потери качества можно регулировать, однако при увеличении качества неизбежно растет объем информации. Основным параметром, характеризующим качество записи, является скорость потока данных, поступающих для декодирования. Часто этот параметр называют битрейтом (bitrate – частота битов).

Битрейт измеряется в килобитах в секунду и может составлять до 320 Кбит/с. В большинстве случаев вполне хватает 192 или даже 128 битрейт. Битрейт ниже 48 Кбит/с существенно ухудшит качество и его не следует применять для записи музыки. Для записи речи можно использовать меньший битрейт. Качественную диктофонную запись можно получить при битрейте равном 8 Кбит/с. Искажения при кодировании в форматах MP3 и WMA во многом зависят от характера музыки. Симфоническая музыка требует большего битрейта, а танцевальная – меньшего. Наиболее популярным битрейтом при кодировании музыкальных композиций считается битрейт 128 Кбит/с, дающий хорошее качество записи и позволяющий сжимать исходную информацию более чем в десять раз. Для хранения произвольных звуковых данных чаще всего используются файлы формата wav. В этом формате может храниться моно- или стереозвук, закодированный одним или двумя байтами и с различной частотой дискретизации. Файлы этого формата могут быть сжаты разными способами для достижения меньшего размера, а могут оставаться и несжатыми. Музыкальные файлы используют формат mid, так как цифровой музыкальный интерфейс и способ кодирования музыкальной информации называется MIDI. Сжатые файлы могут иметь расширение wav, а могут расширением указывать на используемый способ сжатия – mp3 или wma. Есть и несколько других форматов звуковых файлов, но они применяются значительно реже.

Звуковое оборудование и программы

За воспроизведение и запись звука в компьютерах отвечают специальные звуковые адаптеры. Звуковой адаптер содержит еще один специализированный процессор, тем самым освобождая основной процессор от функций по управлению воспроизведением звука. С помощью звукового адаптера можно записывать звуковую информацию, воспроизводить речь и музыку.

Звуковой адаптер

Современные звуковые платы позволяют производить обработку звука, монтаж музыкальных композиций. Основным направлением развития современных звуковых плат является поддержка объемного звука. В этом случае появляется возможность позиционирования источников звука в пространстве.

Подавляющее большинство современных компьютеров оборудовано звуковой картой. Хорошие звуковые платы Sound Blaster Audigy различных версий выпускает фирма Creative. Вместе с тем в настоящее время многие материнские платы поддерживают качественный шестиканальный звук.

Для того чтобы создавать собственные музыкальные произведения может понадобиться специальная клавиатура, подключаемая к интерфейсу MIDI. Музыкальные клавиатуры, подключаемые к звуковой карте, различаются количеством октав (обычно от трех до семи), а также количеством клавиш и их размером. Наиболее известными производителями являются фирмы Korg, Roland, Yamaha. Неплохие любительские клавиатуры выпускает фирма Casio.

Музыкальная клавиатура

Для качественной записи голоса нужно использовать соответствующие микрофоны. Простые компьютерные микрофоны не обеспечивают высокое качество звука. Кроме того, микрофонный вход большинства звуковых плат также не обладают хорошим качеством. Поэтому рекомендуется использовать микрофонный усилитель, который подключается к линейному входу звуковой платы. Микрофонный усилитель обеспечит подключение двух микрофонов, что позволит записывать стереофонический звук.

Микрофон

В последнее время широкое распространение получили миниатюрные цифровые проигрыватели, хранящие музыку в формате МР3. Музыка с компьютера записывается в память такого устройства, после чего ее можно прослушать в любом месте через наушники.

Портативный плейер

В качестве дополнительного источника звука для компьютера может рассматриваться компьютерный радиоприемник. Он может быть реализован в качестве дополнительной платы, а может подключаться к порту USB.

Радиоприемник

Конечно, работа со звуком на компьютере немыслима без специальных программ. Простейшие программы для работы со звуком включены в состав всех версий Windows. С их помощью можно настроить громкость разных источников звука, установить чувствительность микрофона и линейного входа. Кроме того, можно записать небольшой звуковой фрагмент, выполнить с ним простые преобразования и записать результат в файл. Также в Windows включены средства проигрывания компакт-дисков и мультимедийных файлов, записи музыки на цифровые плееры, прослушивания музыки из Интернета.

При использовании музыкальной клавиатуры требуется работа со звуком в реальном масштабе времени. Наиболее мощной такой программой является Cakewalk Home Studio, но можно обойтись и более простыми программами.

Для обработки звуков следует использовать звуковой редактор. Лучшими звуковыми редакторами являются программы Sound Forge и WaveLab. Для многоканального монтажа применяется редактор Cool Edit. Для создания и редактирования музыки, а также для добавления вокала к музыке, применяются программы, называемые секвенсорами MIDI и аудио. Лучшими программами этого класса являются Cakewalk Sonar и Cubase VST.

Sound Forge

Пение караоке стало в последнее время достаточно популярным. Существуют несколько программ для создания файлов караоке и для их воспроизведения. Достаточно удобна программа Karaoke GALAXY Maker, позволяющая создавать караоке. Для воспроизведения таких файлов используют программы Karaoke GALAXY Player или vanBasco’s Karaoke Player.

image

Кодирование звуковой информации | Социальная сеть работников образования

 

Кодирование звуковой информации

Компьютер работает с цифровой информацией, которую можно представить в виде серии электрических импульсов — логических нулей и единиц. Но тот звук, который мы слышим,непрерывен. Эта звуковая волна с меняющейся амплитудой и частотой является аналоговым сигналом. Чтобы записать такой звук на диск компьютера его надо преобразовать в цифровую форму. Этим занимается аналого-цифровой преобразователь (АЦП). Для воспроизведения звука, записанного в цифровом виде, цифроаналоговый преобразователь преобразовывает его в аналоговый сигнал.

Дискретизация звука

Непрерывная звуковая волна разбивается на отдельные участки по времени, для каждого устанавливается своя величина амплитуды. Каждой ступеньке присваивается свой уровень громкости звука, который можно рассматривать как набор возможных состояний

Характеристики качества звука:

1. «Глубина» кодирования звука — количество бит на один звуковой сигнал
Современные звуковые карты обеспечивают 16-битную «глубину» кодирования звука. Количество уровней (градаций амплитуды) можно рассчитать по формуле

N = 2I = 216 = 65 536 уровней сигнала
(градаций амплитуды)

2. Частота дискретизации – это количество измерений уровней сигнала за 1 секунду

Одно измерение в 1 секунду соответствует частоте 1 Гц

1000 измерений в 1 секунду — 1 кГц

Количество измерений может лежать в диапазоне от 8000 до 48 000
(8 кГц – 48 кГц)

8 кГц соответствует частоте радиотрансляции,

48 кГц – качеству звучания аудио- CD.

Ухо человека воспринимает звук в диапазоне от ~20 Гц до 20 кГц.

Опыт показывает, что точное соответствие цифрового сигнала аналоговому достигается, если частота дискретизации будет вдвое выше максимальной звуковой частоты, то есть составит не менее 40 кГц.

На практике значения частоты дискретизации, применяемые в звуковых системах, равны 44,1 кГц или 48 кГц. Чем больше частота дискретизации, тем качественнее звук.

При двоичном кодировании непрерывного звукового  сигнала он заменяется серией его отдельных выборок — отсчетов.

Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний.

Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.

Звук — это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.

Такая запись называется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.

 

РСМ
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.

WAV
Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали — это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.

RIFF
Resource Interchange File Format. Уникальная система хранения любых структурированных данных.

IFF
Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga — одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.

MOD
Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.

AIFили AIFF
Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.

MID
Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.

МР3
Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для «обычных немузыкальных» людей потери не ощутимы явно.

VQF
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF — процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.

RA
Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.

 Ввод музыки в компьютер.

Существует несколько способов ввода музыки в компьютер. Выбор будет зависеть от того, в каком виде она находится. Если источником музыки является цифровой музыкальный файл (формата wav или mp3), то он, как правило, вводится в компьютер штатными средствами — например, загружается из Интернета или копируется с компакт-диска (файл mp3 представляет собой сжатый примерно в 10 раз файл формата wav). Файлы формата wav являются «родными» для музыкальных компакт-дисков, они записываются с 16-разрядным сэмплированием с частотой 44 кГц; файл с одной песней обычно имеет размер от 30 до 60 МБ.

Если источником музыки является виниловая пластинка или музыкальный инструмент/другое устройство со стереофоническим линейным выходом, то такая музыка, как правило, вводится с помощью установленной в компьютер звуковой карты. К современной звуковой карте через гнездо линейного входа можно напрямую подключить любой музыкальный инструмент (синтезатор, гитару и т.д.) или устройство воспроизведения (проигрыватель грампластинок, магнитофон и т.п.), после чего ПК может начать запись. Здесь исключительно важную роль играет размер и форма соединительных разъемов — многие современные звуковые карты высшего класса имеют входные разъемы, позволяющие подключать оптические, раздельные кабели и кабели с миништекерами. Существует множество вариантов соединений, каждый из которых обеспечивает определенный уровень качества и соответствует определенному стандарту.

Еще одно средство ввода музыки в персональный компьютер — интерфейс MIDI. Это стандарт электронной музыки, согласно которому звуковая информация представляется в виде единиц и нулей. Обычно через интерфейс MIDI подключаются синтезаторы или отдельные клавиатуры — и тогда ПК «воспринимает» каждую сыгранную ноту как элемент цифровой информации и воспроизводит ее в виде музыки в реальном времени.

Что такое MIDI-синтезатор? Термин «синтезатор» обычно используется применительно к  электронному музыкальному инструменту, в котором звук создается и обрабатывается, меняя свою окраску и характеристики. Естественно, название этого устройства пошло от его основного предназначения – синтеза звука. Основных методов синтеза звука существует всего два: FM (Frequency modulation – частотная модуляция) и WT (Wave Table – таблично-волновой). Опишем лишь основную идею методов. В основе FM-синтеза лежит идея, что любое даже самое сложное колебание является, по сути, суммой простейших синусоидальных. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем изменения частот синусоид получать звуки, похожие на настоящие. Таблично-волновой синтез основывается на другом принципе. Синтез звука при использовании такого метода достигается за счет манипуляций над заранее записанными (оцифрованными) звуками реальных музыкальных инструментов. Эти звуки (они называются сэмплами) хранятся в постоянной памяти синтезатора.

MIDI – это общепринятая спецификация, связанная с организацией цифрового интерфейса для музыкальных устройств, включающая в себя стандарт на аппаратную и программную части.

Эта спецификация предназначена для организации локальной сети электронных  инструментов (рис. 2). К MIDI-устройствам относятся различные аппаратные и музыкальные инструменты, отвечающие требованиям MIDI. Таким образом, MIDI-синтезатор – это музыкальный инструмент, предназначенный обычно для синтеза звука и музыки, а также удовлетворяющий спецификации MIDI. Давайте разберемся кратко, почему выделен отдельный класс устройств, названный MIDI.

Дело в том, что осуществление программной обработки звука часто сопряжено с неудобствами, обусловленными различными техническими особенностями этого процесса. Даже возложив операции по обработке звука на звуковую карту или любую другую аппаратуру, остается множество различных проблем. Во-первых, зачастую желательно пользоваться аппаратным синтезом звучания музыкальных инструментов (как минимум потому, что компьютер – это общий инструмент, часто необходим просто аппаратный синтезатор звуков и музыки, не более). Во-вторых, программная обработка звука часто сопровождается временными задержками, в то время как при концертной работе необходимо мгновенное получение обработанного сигнала. По этим и другим причинам и прибегают к использованию специальной аппаратуры для обработки, а не компьютеров со специальными программами. Однако при использовании аппаратуры возникает необходимость в едином стандарте, который позволил бы соединять устройства друг с другом и комбинировать их. Эти предпосылки и заставили в 1982 году несколько ведущих в области музыкального оборудования компаний утвердить первый MIDI-стандарт, который впоследствии получил продолжение и развивается по сей день. Что же, в конечном счете, представляет собой MIDI-интерфейс и устройства в него входящие с точки зрения персонального компьютера?

  • Аппаратно — это установленные на звуковой карте: синтезатор различных звуков и музыкальных инструментов, микропроцессор, контролирующий и управляющий работу MIDI-устройств, а также различные стандартизованные разъемы и шнуры для подключения дополнительных устройств.
  • Программно — это протокол MIDI, представляющий собой набор сообщений (команд), которые описывают различные функции системы MIDI и с помощью которых осуществляется связь (обмен информацией) между устройствами MIDI. Сообщения можно рассматривать как средство удаленного управления.

Следует отметить, что в отношении синтезаторов звука MIDI устанавливает строгие требования к их возможностям, примененным в них способам синтеза звука, а также к управляющим параметрам синтеза. Кроме того, для того, чтобы музыка созданная на одном синтезаторе могла бы быть легко перенесена и успешно воспроизведена на другом, были установлены несколько стандартов на соответствие инструментов (голосов) и их параметров в различных синтезаторах: стандарт General MIDI (GM),  General Synth (GS) и eXtended General (XG). Базисным стандартом является GM, остальные два являются его логическими продолжениями и расширениями.

В качестве практического примера устройства MIDI, можно рассмотреть обычную MIDI-клавиатуру. Упрощенно, MIDI-клавиатура представляет собой укороченную клавиатуру рояля, в корпусе с которой находится MIDI-интерфейс, позволяющий подключать ее к другим MIDI-устройствам, например, к MIDI-синтезатору, который установлен в звуковой карте компьютера. Используя специальное программное обеспечение (например, MIDI-секвенсор) можно включить MIDI-синтезатор в режим игры, например, на рояле, и нажимая на клавиши MIDI-клавиатуры слышать звуки рояля. Естественно, что роялем дело не ограничивается – в стандарте GM имеются 128 мелодических инструментов и 46 ударных. Кроме того, используя MIDI-секвенсор можно записывать исполняемые на MIDI-клавиатуре ноты в компьютер, для последующего редактирования и аранжировки, либо просто для элементарной распечатки нот.

Надо отметить, что поскольку MIDI-данные – это набор команд, то музыка, которая написана с помощью MIDI, также записывается с помощью команд синтезатора. Иными словами, MIDI-партитура – это последовательность команд: какую ноту играть, какой инструмент использовать, какова продолжительность и тональность ее звучания и так далее. Знакомые многим MIDI-файлы (.MID) есть нечто иное, как набор таких команд. Естественно, что поскольку имеется великое множество производителей MIDI-синтезаторов, то и звучать один и тот же файл может на разных синтезаторах по-разному (потому что в файле сами инструменты не хранятся, а есть лишь только указания синтезатору какими инструментами играть, в то время как разные синтезаторы могут звучать по-разному).

 

Под обработкой звука следует понимать различные преобразования звуковой информации с целью изменения каких-то характеристик звучания. К обработке звука относятся способы создания различных звуковых эффектов, фильтрация, а также методы очистки звука от нежелательных шумов, изменения тембра и т.д. Все это огромное множество преобразований сводится, в конечном счете, к следующим основным типам:

1. Амплитудные преобразования.Выполняются над амплитудой сигнала и приводят к ее усилению/ослаблению или изменению по какому-либо закону на определенных участках сигнала.

2.  Частотные преобразования. Выполняются над частотными составляющими звука: сигнал представляется в виде спектра частот через определенные промежутки времени, производится обработка необходимых частотных составляющих, например, фильтрация, и обратное «сворачивание» сигнала из спектра в волну.

3. Фазовые преобразования. Сдвиг фазы сигнала тем или иным способом; например, такие преобразования стерео сигнала, позволяют реализовать эффект вращения или «объёмности» звука.

4.  Временные преобразования.Реализуются путем наложения, растягивания/сжатия сигналов;  позволяют создать, например, эффекты эха или хора, а также повлиять на пространственные характеристики звука.

Приведу несколько практических примеров использования указанных видов преобразований при создании реальных звуковых эффектов:

  • Echo (эхо)Реализуется с помощью временных преобразований. Фактически для получения эха необходимо на оригинальный входной сигнал наложить его задержанную во времени копию. Для того чтобы человеческое ухо воспринимало вторую копию сигнала как повторение, а не как отзвук основного сигнала, необходимо время задержки установить равным примерно 50 мс. На основной сигнал можно наложить не одну его копию, а несколько, что позволит на выходе получить эффект многократного повторения звука (многоголосного эха). Чтобы эхо казалось затухающим, необходимо на исходный сигнал накладывать не просто задержанные копии сигнала, а приглушенные по амплитуде.
  • Reverberation (повторение, отражение).Эффект заключается в придании звучанию объемности, характерной для большого зала, где каждый звук порождает соответствующий, медленно угасающий отзвук. Практически, с помощью реверберации можно «оживить», например, фонограмму, сделанную в заглушенном помещении. От эффекта «эхо» реверберация отличается тем, что на входной сигнал накладывается задержанный во времени выходной сигнал, а не задержанная копия входного.
  • Chorus (хор).В результате его применения звучание сигнала превращается как бы в звучание хора или в одновременное звучание нескольких инструментов. Схема получения такого эффекта аналогична схеме создания эффекта эха с той лишь разницей, что задержанные копии входного сигнала подвергаются слабой частотной модуляции (в среднем от 0.1 до 5 Гц) перед смешиванием с входным сигналом. Увеличение количества голосов в хоре достигается путем добавления копий сигнала с различными временами задержки.

Практическую обработку сигналов можно разделить на два типа: обработка «на лету» и пост-обработка. Обработка «на лету» подразумевает мгновенное преобразование сигнала (то есть с возможностью осуществлять вывод обработанного сигнала почти одновременно с его вводом). Простой пример – гитарные «примочки» или реверберация во время живого исполнения на сцене. Такая обработка происходит мгновенно, то есть, скажем, исполнитель поет в микрофон, а эффект-процессор преобразует его голос и слушатель слышит уже обработанный вариант голоса. Пост-обработка – это обработка уже записанного сигнала. Скорость такой обработки может быть сильно ниже скорости воспроизведения. Такая обработка преследует те же цели, то есть придание звуку определенного характера, либо изменение характеристик, однако применяется на стадии мастеринга или подготовки звука к тиражированию, когда не требуется спешка, а важнее качество и скрупулезная проработка всех нюансов звучания. Существует множество различных операций над звуком, которые вследствие недостаточной производительности сегодняшних процессоров нельзя реализовать «на лету», поэтому такие преобразования проводят лишь в пост-режиме.

 

Наиболее важный класс программ – редакторы цифрового аудио. Основные возможности таких программ это, как минимум, обеспечение возможности записи (оцифровки) аудио и сохранение на диск. Развитые представители такого рода программ позволяют намного больше: запись, многоканальное сведение аудио на нескольких виртуальных дорожках, обработка специальными эффектами очистка от шумов. Они имеют развитую навигацию и инструментарий в виде спектроскопа и прочих виртуальных приборов, управление/управляемость внешними устройствами, преобразование аудио из формата в формат, генерация сигналов, запись на компакт диски и многое другое. Некоторыеизтакихпрограмм: Cool Edit Pro
рис.8

Специализированные реставраторы аудио играют также немаловажную роль в обработке звука. Такие программы позволяют восстановить утерянное качество звучания аудио материала, удалить нежелательные щелчки, шумы, треск, специфические помехи записей с аудиокассет, и провести другую корректировку аудио. Программыподобногорода: Dart, Clean (отSteinberg Inc.), Audio Cleaning Lab. (от Magix Ent.), Wave Corrector.

Основные возможности реставратора Clean 3.0 (см. рис.9 – рабочее окно программы): устранение всевозможных потрескиваний и шумов, режим автокоррекции, набор эффектов для обработки скорректированного звука, включая функцию «surround sound» с наглядным акустическим моделированием эффекта, запись CD с подготовленными данными, «интеллигентная» система подсказок, поддержка внешних VST плаг-инов и другие возможности.

 

Напоследок следует упомянуть о существовании огромного количества другого аудио ПО: проигрыватели аудио (наиболее выдающиеся: WinAMP, Sonique, Apollo, XMPlay, Cubic Player), подключаемые модули для проигрывателей (из «улучшателей» звучания аудио — DFX, Enhancer, iZotop Ozone), утилиты для копирования информации с аудио CD (ExactAudioCopy, CDex, AudioGrabber), перехватчики аудио потоков (Total Recorder, AudioTools), кодеры аудио (кодеры MP3: Lame encoder, Blade Encoder Go-Go и другие; кодеры VQF: TwinVQ encoder, Yamaha SoundVQ, NTT TwinVQ; кодеры AAC: FAAC, PsyTel AAC, Quartex AAC), конвертеры аудио (для перевода аудио информации из одного формата в другой), генераторы речи и множество других специфических и общих утилит. Безусловно, все перечисленное – только малая толика из того, что может пригодиться при работе со звуком.

 

1.http://websound.ru/  «Цифровой звук – обо всём по порядку»

2.http://edu.internet-academy.org.ge/courses/introduction_to_speciality_2/mm-audio/audio/ «Цифровой звук»

3.http://www.music4sale.ru/id_52/  «Форматы звуковых файлов»

4. http://circ.mgpu.ru/works/65/KrasnovaOA/COD/SOUND/Sound.HTM  «Кодирование звуковой информации»

 



[1]           DSP – Digital Signal Processor(цифровой сигнальный процессор). Устройство (или программный механизм) предназначенное для цифровой обработки сигналов.

Кодирование и обработка звуковой информации

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 8 классы | Планирование уроков на учебный год (по учебнику Н.Д. Угриновича) | Кодирование и обработка звуковой информации



§ 3.1. Кодирование и обработка звуковой информации




Содержание урока

3.1. Кодирование и обработка звуковой информации

Практическая работа 3.1


3.1. Кодирование и обработка звуковой информации

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну (колебания воздуха или другой среды) с непрерывно меняющейся амплитудой и частотой. Человек воспринимает звуковые волны с помощью слуха в форме звука различной громкости и тона. Чем больше амплитуда звуковой волны, тем громче звук, чем больше частота колебаний, тем выше тон звука (рис. 3.1).

Рис. 3.1 .Звуковая волна

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20000 колебаний в секунду (высокий звук). Человек может воспринимать звук в огромном диапазоне амплитуд, в котором максимальная амплитуда больше минимальной в 1014 раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица децибел (дБ). Уменьшение или увеличение громкости звука на 10 дБ соответствует уменьшению или увеличению амплитуды звука в 10 раз (табл. 3.1).

Таблица 3.1. Громкость звука

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенный уровень громкости.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» (рис. 3.2).

Рис. 3.2. Временная дискретизация звука

Частота дискретизации. Для записи аналогового звука и его преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за одну секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую аналогового сигнала.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Частота дискретизации звука измеряется в герцах (Гц) и может лежать в диапазоне от 8000 до 48 ООО измерений громкости звука за одну секунду (от 8000 до 48000 Гц).

Глубина кодирования. Каждой «ступеньке» присваивается определенный уровень громкости звука. Уровни громкости звука можно рассматривать как набор N возможных состояний, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле (1.1). Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2I = 216 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню громкости будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.

Качество оцифрованного звука. Чем больше частота дискретизации и глубина кодирования звука, тем более качественным будет оцифрованный звук. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, будет при частоте дискретизации 8000 раз в секунду, глубине кодирования 8 битов и записи одной звуковой дорожки (режим моно). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, будет при частоте дискретизации 48 000 раз в секунду, глубине кодирования 16 битов и записи двух звуковых дорожек (режим стерео).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания одна секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в одну секунду и умножить на 2 (стереозвук):

16 битов • 24 000 • 2 = 768 000 битов = 96 000 байтов = 93,75 Кбайт.

Контрольные вопросы

1. Объясните, как частота дискретизации и глубина кодирования влияют на качество цифрового звука.

Задания для самостоятельного выполнения

3.1. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней громкости сигнала?

1)65 536 битов
2) 256 битов
3)16 битов
4) 8 битов

3.2. Задание с развернутым ответом. Оцените информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:

а) моно, 8 битов, 8000 измерений в секунду;
б) стерео, 16 битов, 48 000 измерений в секунду.

Cкачать материалы урока


Амплитудная модуляция произвольного сигнала / Habr

Как известно, АМ — вид модуляции, при которой амплитуда несущего сигнала изменяется по закону модулирующего (информационного) сигнала. Существует немало источников с теоретическим и практическим описанием АМ. Описание даётся, прежде всего, для того, чтобы показать частотный состав АМ сигнала. В качестве модулирующего сигнала обычно рассматривают однотональный сигнал. Данный сигнал задаётся простой функцией синуса. У меня всегда спрашивали, да и я задавался вопросом, как описать АМ на случай, если в качестве модулирующего сигнала будет произвольный сигнал. Именно произвольный сигнал, частотный спектр которого состоит из множества компонент, представляет интерес, так как АМ применяется в радиовещании для передачи звука.

Попробуем описать АМ для вышесказанного случая, принимая во внимание, что модулирующий сигнал можно представить, как непрерывную сумму простых однотональных сигналов разных частот с различными амплитудами и фазами. Не вдаваясь в тонкости математического анализа, данный сигнал можно записать как непрерывную сумму (интеграл) Фурье:

где – верхний предел частоты сигнала (полоса модулирующего сигнала), — переменная интегрирования, отвечающая за частоту, причём . Функции и — амплитуда и фаза компоненты сигнала на частоте .

Подынтегральное выражение данной формулы представляет собой т.н. тригонометрическую свёртку в амплитудно-фазовый вид слагаемого ряда Фурье, в который можно разложить сигнал. Интеграл в (1) можно назвать интегралом Фурье, так как, фактически, это непрерывная сумма, т.е. непрерывный ряд Фурье, в который раскладывается исходный сигнал. Разложение сигнала в подобный ряд даёт представление о частотном составе этого сигнала. Таким образом, исходный модулирующий сигнал представлен в виде непрерывной суммы синусоид (в данном случае для удобства — ) различных частот от до , каждая из них имеет свою амплитуду фазовый сдвиг . Функция представляет собой частотный спектр исходного сигнала .

Стоит отметить, что сигнал рассматривается на ограниченном промежутке времени . Вообще говоря, если речь идёт о звуковом сигнале, то, как правило, частотный спектр имеет практический смысл рассматривать для очень коротких фрагментов сигнала. Очевидно, чем больше по времени продолжительность сигнала, тем больше низкочастотных (приближающихся к нулю) компонент будут фигурировать в спектральном составе, что нельзя сопоставить со звуковыми частотами в слышимом диапазоне.

Кроме модулирующего сигнала имеется тональный сигнал, представляющий собой несущее колебание с частотой , амплитудой и нулевой начальной фазой:

причём . Действительно, в радиовещании частота несущей во много раз больше полосы передаваемого сигнала.

Теперь перейдём непосредственно к процессу амплитудной модуляции.

Известно, что АМ сигнал есть результат перемножения сигнала несущей и модулирующего сигнала, предварительно смещённого и «проиндексированного» индексом модуляции , т.е.

Во избежание так называемой перемодуляции .

Подставим исходные данные (1) и (2) в выражение (3), раскроем скобки, внесём под интеграл независящие от переменной интегрирования некоторые множители:

Применим известную школьную тригонометрическую формулу преобразования произведения для подынтегральных функций:

Данная формула носит ключевой характер при АМ и подчёркивает эти самые «две боковые» в спектральном составе АМ сигнала.

Продолжив равенство, разобьём интеграл получившейся суммы на сумму двух интегралов, раскроем скобки и вынесем за скобку нужные множители в аргументах функций:

Три получившихся слагаемых соответственно представляют собой, как видно из равенства, сигнал несущей, сигналы «нижней» и «верхней» боковой. Прежде чем дать конкретное пояснение, продолжим равенство, применив метод замены переменной в следующей конфигурации:

Воспользуемся этой самой заменой:

Поменяв в первом интеграле пределы интегрирования местами (в результате чего изменится знак перед интегралом на противоположный), можно два интеграла объединить в один. Более того, туда же можно внести и первое слагаемое, описывающее сигнал несущей. При этом, естественно, подынтегральные функции амплитуды и фазы необходимо обобщить. Это всё делается условно и для более детальной наглядности, не вдаваясь в тонкости математического анализа. Таким образом, получится:

где

и

Таким образом, были введены новые кусочнозаданные функции (4) и (5), описывающие изменение амплитуды и фазы в зависимости от частоты. Глядя на компоненты функции (4), можно заметить, что третья компонента получена путём параллельного переноса функции на , а первая — ещё и с предварительным зеркальным разворотом. Множители-константы перед функциями, уменьшающие амплитуду, я не беру во внимание. То есть, в спектре АМ сигнала имеются три компоненты: несущая, верхняя боковая и нижняя боковая, что и было отражено в (4).

В заключение стоит отметить, что АМ можно описать, применяя более сложный подход, основанный на комплексных сигналах и комплексных числах. Обычный сигнал, о котором шла речь в этой статье, не имеет мнимой компоненты. Принимая во внимание представление с помощью векторных диаграмм на комплексной плоскости, сигнал без мнимой компоненты складывается из двух комплексных сигналов с обоими компонентами. Это очевидно, если представлять однотональный сигнал в виде суммы двух векторов, которые вращаются в противоположные стороны симметрично относительно оси x (Re). Скорость вращения данных векторов эквивалентна частоте сигнала, а направление — знаку частоты (положительная или отрицательная). Из этого следует, что частотный спектр сигнала без мнимой компоненты имеет не только положительную, но и отрицательную составляющую. И, конечно же, он симметричен относительно нуля. Именно при таком представлении можно утвердить, что в процессе амплитудной модуляции спектр модулирующего сигнала переносится по шкале частот вправо от нуля на частоту несущей (и влево тоже). При этом «нижняя боковая» не возникает, она в исходном модулирующем сигнале уже существует, правда располагается в отрицательной области частот. Звучит на первый взгляд странно, так как в природе, казалось бы, не существует отрицательных частот. Но математика преподносит немало сюрпризов.

alexxlab

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *