Представление звуковых данных в двоичном коде

Звук — это упругая продольная волна в воздушной среде. Чтобы ее представить в виде, читаемом компьютером, необходимо выполнить следующие преобразования. Звуковой сигнал преобразовать в электрический аналог звука с помощью микрофона. Электрический аналог получается в непрерывной форме и не пригоден для обработки на цифровом компьютере. Чтобы перевести сигнал в цифровой код, надо пропустить его через аналого-цифровой преобразователь (АЦП). При воспроизведении происходит обратное преобразование — цифро-аналоговое (через ЦАП). Позже будет показано, что конструктивно АЦП и ЦАП находятся в звуковой карте компьютера.

Во время оцифровки сигнал дискретизируется по времени и по уровню. Дискретизация по времени выполняется следующим образом: весь период времени Т разбивается на малые интервалы времени Dt, точками t1, t2, … tn. Предполагается, что в течение интервала Dt уровень сигнала изменяется незначительно и может с некоторым допущением считаться постоянным. Величина v = I/Dt называется- частотой дискретизации.Она измеряется в герцах (Гц) — количество измерений в течение секунды. Дискретизация по уровню называется квантованиеми выполняется так: область изменения сигнала от самого малого значения Xmin до самого большого значения Хмах разбивается на N равных квантов, промежутков величиной

DХ = (Хмах – Xmin)/N.

Точками Х1, Х2, … Хп. Xi = Xmin.+ DХ • (i – 1).

Каждый квант связывается с его порядковым номером, т.е. целым числом, которое легко может быть представлено в двоичной системе счисления. Если сигнал после дискретизации по времени (напомним, его принимаем за постоянную ОСлирну) попадает в промежуток Xi-1 < X < Xi , то ему в соответствие ставится код i.

Возникают две задачи:

o первая: как часто по времени надо измерять сигнал,

o вторая: с какой точностью надо измерять сигнал, чтобы получить при воспроизведении звук удовлетворительного качества.

Ответ на первую задачу дает теорема Найквиста, которая утверждает, что, если сигнал оцифрован с частотой v, то высшая «слышимая» частота будет не более v/2.

Вторая задача решается подбором числа уровней так, чтобы звук не имел высокого уровня шума и «электронного» оттенка звучания (точнее, это характеризуется уровнем нелинейных искажений). Попутно заметим, что число уровней берется как 2n. Чтобы измерение занимало целое число байт; v выбирают n = 8 или n = 16, т.е. каждое измерение занимает один или два байта.

Высокое качество воспроизведения получается в формате лазерного аудиодиска при следующих параметрах оцифровки: частота дискретизации — 44,1 кгц, квантование — 16 бит, т.е. DХ = (Хмах – Xmin)/ 216. Таким образом, 1 с стереозвука займет 2 байт * 44100байт/с *2 кан * 1 с = 176 400 байт дисковой памяти. Качество звука при этом получается очень высоким.

Для телефонных переговоров удовлетворительное качество получается при частоте дискретизации 8 кгц и частоте квантования 255 уровней, т.е. 1 байт, при этом 1 с звуковой записи займет на диске

1 байт * 8000 байт/с * 1 с = 8000 байт.

 








Дата добавления: 2015-08-08; просмотров: 856;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.