Компандирование заключается в компрессии (сжатии) по амплитуде исходного звукового сигнала и последующем его восстановлении с помощью экспандера (расширителя).

Компрессия — это сжатие динамического диапазона сигнала, когда слабые звуки усиливаются сильнее, а сильные— слабее. На слух это воспринимается как уменьшение различия между тихим и громким звучанием исходного сигнала.

Установлено, что, если повышать громкость звука в 2, 4, 8 и т. д. раз, то человеческое ухо будет воспринимать этот процесс как линейное увеличение интенсивности звука. Изменение уровня громкости с 1 единицы до 2 единиц столь же заметно для человеческого уха, как и изменение громкости

от 50 до 100 единиц. В то же время изменение громкости от 100 единиц до 101 единицы человеком практически не ощущается.

Таким образом, ухо человека логарифмирует громкость слышимых звуков.

При компандировании значение амплитуды звука заменяется логарифмом этого значения.Полученные числа округляются, и для их записи требуется меньшее число разрядов.

При 16-битном кодировании звука максимальное значение кода не превышает значение 2¹⁶. Логарифм этого числа по основанию 2 равен 16. Последнее число может быть закодировано пятью двоичными разрядами (16₁₀ = 1ОООО₂). Таким образом, для представления информации вместо 16 битов можно использовать лишь 5 битов. Этим достигается сжатие информации. Для воспроизведения компрессированного сигнала его подвергают обратному по сравнению с логарифмированием преобразованию — потенцированию.

Еще один способ сжатия звуковой информации заключается в том, что исходный звуковой сигнал очищается с помощью фильтров от неслышимых компонентов (например, убирают низкие басовые шумы). Затем производится более сложный анализ сигнала: вычисляются и удаляются замаскированные частоты, заглушенные другими мощными сигналами. Таким образом, можно исключить до 70% информации из сигнала, практически не изменив качество его звучания.

Сжатие сигнала также можно получить за счет еще одного приёма. Если исходный сигнал является стереофоническим, то его можно преобразовать в так называемый совмещенный стереофонический сигнал. Установлено, что слуховой аппарат человека может определить местоположение источника звука лишь на средних частотах, а высокие и низкие частоты звучат как бы отдельно от источника звука. Таким образом, высокие и низкие частоты можно представить в виде монофонического сигнала (т. е. без разделения на два стереофонических канала). Это позволяет вдвое уменьшить объём информации, передаваемой на низких и высоких частотах.

Еще одна возможность сжатия звукового сигнала связана с наличием двух потоков информации для левого и правого каналов. Например, если в правом канале наблюдается какое-то время полная тишина, то это пустующее место используется для повышения качества звучания левого канала или туда помещают данные, которые не уместились в компрессированный поток в предыдущие моменты времени.

Ещё один метод сжатия звуковой информации заключается в устранении её избыточности путём учёта свойств слуха человека – явления маскировки звуков и явления адаптации слуха человека.

Одно из свойств человеческого слуха заключается в маскировании тихого звука, следующего сразу за громким звуком. Так после выстрела пушки в течение некоторого времени трудно услышать тиканье наручных механических часов или стрекот кузнечиков.

Исследования показали, что качество, разборчивость и натуральность звучания речи обеспечивается в полосе 0,3-3,4 кГц.

Диапазон по мощности при произнесении звуков:

0,01 мкВт – 10 000 мкВт ≈ 50-60 дБ.

Это требует сложной аппаратуры и увеличения её стоимости.

На практике динамический диапазон без потери качества прослушивания воспроизводимых аппаратурой звуковых сигналов может быть ограничен уровнем 25-30 дБ.

Преобразуют речевой сигнал микрофоны.

Он поступает в кс не непрерывно - ≈ 50 % t.

Средняя мощность звучания речи на интервалах активности 88 мкВт, а с учетом пауз и сигналов управления –32 мкВт.

Наиболее интенсивные составляющие по энергии в речи от 200 до 300 Гц.

Установлено, что в среднем в речи 75 % занимают паузы.

Средняя скорость речи 12-15 звуков 1/с.

Средняя длительность пауз в непрерывной речи –16 %.

Звуковые колебания, воспринимаемые человеком, ограничены и по амплитуде.

Средняя минимальная интенсивность ощущения звука на f = 1000 Гц будет ~10 ^-12 Вт/м²,

Средняя максимальная интенсивность без боли ~ 1 Вт/м².

процесс слухового восприятия сопровождается эффектами адаптации слуха и маскировки звука.

М А С К И Р О В К А:

При одновременном воздействии на ухо нескольких звуков наблюдается явление ослабления слышимости, хотя интенсивность звуков выше порога слышимости. Это явление маскировки.

Физиологическая сущность явления маскировки в том, что повышается порог слышимости полезного звука на частоте и смежных частотных областях маскирующего звука.

З А К О Н Ы Я В Л Е Н И Я М А С К И Р О В К И:

1. звук с более высоким уровнем ощущения маскирует звук с более низким уровнем ощущения;

2. маскирующий эффект возрастает по мере усиления маскирующего звука;

3. эффект маскировки возрастает при приближении частот маскирующего и маскируемого звуков, а при неодинаковых частотах он сильнее, если f маскирующего звука ниже f маскируемого;

4. маскирующий эффект возрастает при наличии шума со сплошным спектром.

А Д А П Т А Ц И Я:

Если на ухо длительное время воздействует звук, то его чувствительность понижается (появляется во всем диапазоне слышимых звуков одинаково).

Способность слуха изменять свою чувствительность в зависимости от громкости воспринимаемых звуков называется явлением адаптации слуха.

Адаптация происходит не мгновенно, а с запаздыванием во времени по отношению к принимаемому сигналу.

После снятия звука чувствительность уха восстанавливается.

При сжатии звукового сигнала замаскированный, почти неслышимый звук не сохраняется в памяти и не передается через каналы связи. Например, громкий звук длительностью 0,1 с может замаскировать тихие последующие звуки, запаздывающие на время до 0,5 с, а значит, их не надо сохранять. Такая процедура исключения сигнала, следующего за громким звуком, называется маскированием во временной области.

Для человеческого уха характерно также и явление маскирования в частотной области,заключающееся в том, что постоянно звучащий громкий синусоидальный сигнал маскирует («глушит») тихие сигналы, которые близко лежат на оси частот к громкому сигналу.

При техническом использовании таких физиологических особенностей человеческого слуха уплотняемый сигнал переносят с помощью быстрого преобразования Фурье из временной области в частотную область. Затем удаляют спектральные составляющие, замаскированные громким сигналом, и делают обратное преобразование Фурье.

Еще одна возможность компрессии основывается на следующей особенности человеческого слуха. Экспериментально установлено, что в диапазонах частот 20—200 Гц и 14—20 кГц чувствительность человеческого слуха существенно ниже, чем на частотах 0,2—14 кГц. По этой причине допустимо более грубое квантование сигналов в указанных диапазонах частот. На этих частотах для представления непрерывных сигналов двоичными числами требуется меньшее число уровней, а значит и меньшее число битов. Так в среднем диапазоне частот амплитуды кодируются 16 битами, а на частотах, где ухо менее чувствительно — 6 и даже 4 битами.

Биоакустические свойства человеческого слуха не позволяют сжать звуковой сигнал, если он представляет собой однотонные звуки с постоянным уровнем громкости.

В этом случае наряду с рассмотренными приёмами сжатия дают эффект традиционные методы архивации информации (например, алгоритм Хаффмана).

Дата добавления: 2015-09-28; просмотров: 1843;