Представление звуков
Существует два подхода к хранению звуковых файлов – это MIDI (Music Interface Digital Instrument) и подобные, и оцифрованный звук.
В формате MIDI звук генерируется синтезатором, который порождает звуки различного тембра, высоты, длительности и громкости. Тембры, как правило, соответствуют тембрам распостраненных музыкальных инструментов. Вместо звука в данном случае хранится последовательность команд синтезатора. Используя данный подход, можно хранить фонемы человеческого языка и воспроизводить речь. Достоинством данного формата является его компактность, а недостатком – зависимость качества звучания от качества синтезатора, реализованного в конкретной звуковой карте.
Оцифрованный звук является результатом аналого-цифрового преобразования реального звука. Его характеристиками являются частота дискретизации, разрешение АЦП и количество каналов. Например, в формате цифрового звука лазерных дисков есть два канала (стереозвук), частота дискретизации 44,1 КГц, количество бит АЦП на канал – 16. Для записи речи вполне хватает частоты дискретизации 22 КГц, а просто для разборчивости произносимых фраз без узнавания говорящего – и 10 КГц. Поскольку данные в этом формате занимают много памяти (в формате лазерного аудиодиска одна минута – это примерно 9 МБт данных), то используются упакованные данные. Наиболее применяемым в настоящее время является формат MPEG-3.
Дата добавления: 2015-09-29; просмотров: 509;