Компрессия речи

 

Задача минимизации используемой полосы пропускания канала связи является одной из важнейших в IP сетях при передаче речевых сигналов. Существенно уменьшить требующую полосу можно с помощью компрессии речи. Для передачи речи с использованием кодоимпульсной модуляции PCM (метод компрессии G 711) потребуется полоса 64 кбит/с.

В одном из наиболее давно используемых алгоритмов сжатия речи, который использует адаптивно-дифференциальную кодоимпульсной модуляцию ADPCM (метод компрессии G726), можно получить такое же качество воспроизведения речи при уменьшении полосы в 2 раза. Метод основан на кодировании не самой амплитуды при аналогово-цифровом преобразовании сигнала, а ее изменении по сравнению с предыдущим значением, благодаря чему для кодирования изменения уровня можно использовать не восемь, как в предыдущем случае, а четыре двоичных разряда. Более эффективное сжатие можно получить, используя кодеки с параметрическим кодированием, которые берут начало от метода кодирования с линейным предсказанием LPC (Linear Predictive Coding).

При таком сжатии кодирование применяется не к отдельным цифровым элементам, а к определенным блокам данных. Для каждого блока данных вычисляются такие параметры, как частота, амплитуда. Такое решение требует мощных специальных процессоров цифровой обработки сигналов DSP. Метод связан с увеличением задержки, поскольку кодирование осуществляется над набором данных, которые накапливаются в буфере. Одним из наиболее чаще применяемых из описанных выше принципов компрессии является метод LD-CELP (Low Delay Code Excited Linear Predictive), реализованный в кодеке G 728. Он применяется к последовательности цифр, состоящей из 5 элементов, которая кодируется одним 10- битным блоком. Реализация этого метода требует использования процессора, имеющего производительность 44 MIPS.

В 1993 году был введен стандарт G 723, использующий сжатие по методу наибольшего правдоподобия MP-MLQ (Multi Pulse-Maximum Likelihood Quantization). Закодировав сигнал, процессор пытается восстановить его форму, сравнивая результаты с исходным сигналом, подбирая параметры, добиваясь наилучшего совпадения.

Приведем в таблице 7.1 основные параметры алгоритмов компрессии речи:

Таблица 7.1

Алгоритм Полоса Производительность Качество
G 711 PCM 64 кбит/с - Отличное
G 726 ADPCM 32 кбит/с 8 MIPS Хорошее
G 728 LD-CELP 16 кбит/с 20 MIPS Удовлетворительное
G 729 CS-ACELP 8 кбит/с 44 MIPS ----//----
G 723 MP-MLO 6,3 кбит/с 60 MIPS Хорошее

 








Дата добавления: 2015-02-16; просмотров: 900;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.