Аудио MPEG-1

Стандарт MPEG-1 сжатия видеофильмов состоит из двух основных частей: сжатия видео и сжатия звука.

Стандарт, описывающий MPEG-1, имеет нормативный и описательный разделы. Нормативный раздел содержит спецификации стандарта: таблицы с различными параметрами и кодами Хаффмана, которые используются в стандарте MPEG. Описательный раздел иллюстрирует выбранные концепции, объясняет причины выбора того или иного подхода, содержит необходимые базовые сведения, например, алгоритм задающий психоакустическую модель. Основной принцип сжатия аудиоданных основан на сжатии с потерями. Общий принцип таков: в исходном WAV файле, как известно, хранится полная информация об исходном звуке, оцифрованном и проквантованном с частотой 44 кГц. Именно эта информация и хранится на обычных аудио-CD. В соответствии с теоремой Котельникова, этой информации абсолютно достаточно для воспроизведения всех частот исходного сигнала, меньших половины частоты квантования. Т.е. все частоты до 22кГц включительно воспроизводятся так же, как они звучали при оцифровке. Для сжатия аудио данных самое удачное решение было найдено, разработано и запатентовано учеными из немецкого университета имени Фраунгофера. Формат файлов, (и стандарт) который они разработали, носил название MPEG Layer-3 (сокращенно MP3). Благодаря тому, что лицензия позволяла неограниченное и бесплатное некоммерческое использование формата, он приобрел широкое распространение и популярность и является доминирующим форматом сжатия до сих пор. При кодировании в MP3 исходный звуковой файл режется на фрагменты, длительностью по 50 миллисекунд, каждый из которых анализируется отдельно. При анализе фрагмент раскладывается на гармоники по методу Фурье, из которых в соответствии с теорией восприятия звука человеческим ухом выбрасываются те гармоники, которые человек не воспринимает или воспринимает хуже на фоне остальных. Кроме того, выбрасываются звуки, замаскированные вследствие инертности слуха. Информация об оставшихся

после фильтрации гармониках и записывается в MP3 файл, который в результате получается гораздо меньше по размеру, чем исходный WAV. При воспроизведении производится обратное преобразование, при котором оставшиеся гармоники вновь преобразуются в звуковую волну.

Получающийся звук не совпадает с исходным, но поскольку отбрасывались

малозначимые и не слышимые звуки, отличить сигнал от исходного для человеческого уха достаточно сложно. Смысл понятия "битрейт". Битрейт (англ. bitrate) — буквально, скорость прохождения битов информации. Битрейт принято использовать при измерении эффективной скорости передачи информации по каналу, то есть скорости передачи «полезной информации» (помимо таковой по каналу может передаваться служебная информация, например, стартовые и стоповые символы при асинхронной передаче, или контрольные символы при избыточном

кодировании). Термин битрейт используется в двух основных значениях [7]:

1. Характеристика канала или устройства – максимальное количество

бит, которое можно передать в единицу времени

2. Величина потока данных передаваемого в реальном времени (минимальный размер канала, который сможет пропустить этот поток без

задержек). Частный случай – битрейт сжатого звука или видео.

Чем меньше битрейт, тем меньший размер имеют файлы с одинаковой по

времени длине. С другой стороны, чем он меньше, тем большее количество "лишних" гармоник приходится отбрасывать. При очень низких битрейтах (16-24 килобита/с) музыку сложно воспринимать, а голос, хотя и остается разборчивым, приобретает весьма "психоделическую" окраску.

Переменный битрейт позволяет уменьшить размер файла при таком же качестве за счет устранения избыточности. Иначе говоря, нет необходимости кодировать тишину с битрейтом 256 кбит/с, если ее с точно таким же качеством можно воспроизвести с битрейтом 64 кбит/с. Качество аудиотреков в MPEG-1 может варьироваться в очень больших пределах – от высококачественного до крайне низкого. Окончательно все форматы сжатия аудиоданных были стандартизированы в 1992 году европейской комиссией по стандартам ISO. В зависимости от используемого кодера и степени сжатия аудиоинформация видеоролика может быть представлена в следующем виде: моно, dual mono, стерео, интенсивное стерео (стереосигналы, чьи частоты превышают 2 кГц объединяются в моно), m/s стерео (один канал - сумма сигналов, другой - разница) и по частоте дискретизации могут быть: 48, 44.1 и 32 кГц.

<76 77 787980 81 82 >

Дата добавления: 2015-04-07; просмотров: 1036;