Компрессия речи
Задача минимизации используемой полосы пропускания канала связи является одной из важнейших в IP сетях при передаче речевых сигналов. Существенно уменьшить требующую полосу можно с помощью компрессии речи. Для передачи речи с использованием кодоимпульсной модуляции PCM (метод компрессии G 711) потребуется полоса 64 кбит/с.
В одном из наиболее давно используемых алгоритмов сжатия речи, который использует адаптивно-дифференциальную кодоимпульсной модуляцию ADPCM (метод компрессии G726), можно получить такое же качество воспроизведения речи при уменьшении полосы в 2 раза. Метод основан на кодировании не самой амплитуды при аналогово-цифровом преобразовании сигнала, а ее изменении по сравнению с предыдущим значением, благодаря чему для кодирования изменения уровня можно использовать не восемь, как в предыдущем случае, а четыре двоичных разряда. Более эффективное сжатие можно получить, используя кодеки с параметрическим кодированием, которые берут начало от метода кодирования с линейным предсказанием LPC (Linear Predictive Coding).
При таком сжатии кодирование применяется не к отдельным цифровым элементам, а к определенным блокам данных. Для каждого блока данных вычисляются такие параметры, как частота, амплитуда. Такое решение требует мощных специальных процессоров цифровой обработки сигналов DSP. Метод связан с увеличением задержки, поскольку кодирование осуществляется над набором данных, которые накапливаются в буфере. Одним из наиболее чаще применяемых из описанных выше принципов компрессии является метод LD-CELP (Low Delay Code Excited Linear Predictive), реализованный в кодеке G 728. Он применяется к последовательности цифр, состоящей из 5 элементов, которая кодируется одним 10- битным блоком. Реализация этого метода требует использования процессора, имеющего производительность 44 MIPS.
В 1993 году был введен стандарт G 723, использующий сжатие по методу наибольшего правдоподобия MP-MLQ (Multi Pulse-Maximum Likelihood Quantization). Закодировав сигнал, процессор пытается восстановить его форму, сравнивая результаты с исходным сигналом, подбирая параметры, добиваясь наилучшего совпадения.
Приведем в таблице 7.1 основные параметры алгоритмов компрессии речи:
Таблица 7.1
Алгоритм | Полоса | Производительность | Качество | |
G 711 | PCM | 64 кбит/с | - | Отличное |
G 726 | ADPCM | 32 кбит/с | 8 MIPS | Хорошее |
G 728 | LD-CELP | 16 кбит/с | 20 MIPS | Удовлетворительное |
G 729 | CS-ACELP | 8 кбит/с | 44 MIPS | ----//---- |
G 723 | MP-MLO | 6,3 кбит/с | 60 MIPS | Хорошее |
Дата добавления: 2015-02-16; просмотров: 941;