Представление звука в ЭВМ
Звук – это механические колебания среды: воздуха, воды и т.д, воспринимаемые слуховым аппаратом человека. То, что мы слышим – это звуковые волны колеблют барабанную перепонку, эти колебания обрабатываются нервной системой. Вне среды переноса звуковых волн звук не существует. Однако звуковые колебания можно перевести на другой носитель, т.е. изменить представление информации, не теряя ее фактически. Обычно звуковые колебания переносят на сигналы радиоволн. В дальнейшем, после передачи их на расстояние, осуществляется преобразование обратно, в звуковую форму.
Все слышимые звуки являются результатом воздействия звуковых волн. На магнитной ленте, виниловой пластинке звук сохраняется в виде непрерывного электрического сигнала, определяющего изменение звуковых волн. Звук, создаваемый звуковыми волнами, называют аналоговым.
Звук может храниться на цифровых носителях, т.е. быть представленным в виде набора цифр. Любая цифровая техника работает со звуком, представленным в цифровом виде. Таким образом, для переноса звука на цифровой носитель, необходимо осуществить его аналогово-цифровое преобразование.
На практике преобразования звуковой информации из непрерывной формы в дискретную и наоборот выполняются устройствами, называемыми аналого-цифровыми преобразователями (АЦП) и цифро-аналоговыми преобразователями (ЦАП). В современных звуковых картах они обеспечивают кодирование с различным уровнем сигнала – от 16-битного до 128-битного, т.е., например, кодирование выборки 216 = 65536 уровней сигнала. Количество выборок в секунду может быть в диапазоне от 4000 до 192000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 4 до 192 кГц, это определяет количество информации, записываемой в цифровой форме, и, следовательно, качество звукового сигнала. При частоте 8 кГц качество соответствует радиотрансляции, при частоте 48 кГц – AudioCD. Следует также учитывать, что используются как моно-, так и стерео-режимы, во втором случае берутся несколько независимых каналов и кодируются раздельно. Чаще встречаются двухканальные стереорежимы, но вообще допускается использование до 255 каналов.
Можно оценить информационный объем моно-аудио-файла длительностью звучания 1 секунду при среднем качестве звука (16 бит, 24 кГц). Для этого количество бит на одну выборку необходимо умножить на количество выборок в 1 секунду:
16 бит × 24000 = 384000 бит/с = 48000 байт/с ≈ 47 Кбайт/с ≈ 2,8 Мбайт/мин.
Иными словами, битрейт такого звука составляет 47 Кбайт/с.
Чем выше качество записи, тем больше места занимает звуковой файл. Несжатый стереозвук качества AudioCD занимает, соответственно,
16 бит × 48000 × 2 = 1536000 бит/с = 192000 байт/с ≈ 192 Кбайт/с ≈ 11,5 Мбайт/мин.
В современных информационных технологиях несжатый звук используется в основном в звукорежиссерских задачах. В подавляющем большинстве других областей применяется сжатый звук. Однако методы сжатия звука без потерь малоэффективны, в лучшем случае они дают трехкратный выигрыш при значительной затрате вычислительных ресурсов. Поэтому широкое распространение нашли методы психоакустического сжатия.
В 1994 г. в научно-исследовательском институте интегральных схем общества Фраунгофера (нем. Fraunhofer IIS) был разработан формат сжатия звука, получивший коммерческое название MP3. Суть метода состоит в следующем. Предполагается, что при одновременном звучании двух сигналов одной частоты, но разной громкости человеческое ухо воспринимает только громкий, не замечая более тихий. При том, что полный звуковой спектр содержит все сигналы. Сжатие достигается тем, что предположительно неслышимые сигналы удаляются из спектра, тем самым уменьшается количество информации, которую нужно сохранять. Такой подход позволяет уменьшить размер звукового файла до 10 раз, при этом для большинства слушателей качество звука практически не изменяется. Однако сжатие с потерями делает нецелесообразным дальнейшее использование такого звука в звукорежиссуре, а кроме того, психоакустическая модель не очень хорошо работает с насыщенной звуковой палитрой, как, например, в классической музыке.
Полное название формата MP3 – MPEG-1/2/2.5 Layer 3, что означает уровень 3 стандартов MPEG первого и второго поколений. MPEG – более общий стандарт, включающий в себя форматы сжатия и передачи цифровой видео и аудио информации.
Кроме MP3 существуют и другие методы сжатия, использующие психоакустическую модель, такие как WMA, OGG, AAC и др.
Дата добавления: 2019-10-16; просмотров: 689;