МЕТОДЫ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ.

Введение. Одним из методов повышения разборчи­вости речи является снижение уровней шумов и помех. Но в большинстве случаев они бывают заданными и не зависят от нас, хотя иногда можно снизить помехи от диффузного звука (путем уменьшения акустического отношения), от шумов, проникающих под заглушки, и т. п. Остается возможность манипулирования уровня­ми речи у слушателя по прямому звуку. Это возможно следующим образом: повышением уровня голоса гово­рящего, приближением микрофона ко рту и уменьше­нием неравномерности озвучения (путем приближения минимального уровня прямого звука к максимально­му), увеличением индекса тракта. Последний способ возможен только при условии, что в системах звуко­усиления не достигнут предельный индекс тракта, а в других системах — рациональный. И, наконец, есть еще способ повышения разборчивости речи — способ такой компрессии динамического диапазона речевого сигнала, при которой происходит повышение уровней слабых звуков речи при сохранении уровней громких звуков речи. Для систем с обратной акустической связью этот метод непригоден, так как возникает самовозбуждение системы. А в остальных системах сла­бые уровни речи повышаются на величину компрессии динамического диапазона.

Из компрессоров наиболее применимы ограничите­ли уровня, действие которых сводится к выравниванию пиковых уровней громких звуков, при этом не изменя­ются соотношения между уровнями слабых звуков. Подробно об этом будет сказано в курсе «Радиове­щание».

Амплитудное ограничение. Рассмотрим предельный случай компрессии речи — предельное амплитудное ограничение, при котором речевой сигнал превращается в последовательность прямоугольных импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами. При моду­ляции сигнала передатчика таким речевым сигналом получается телеграфный режим работы. А это означает, что все звуки речи будут иметь одинаковый и притом максимальный уровень на приеме. Если при передаче неограниченной речи слабые звуки маскировались по­мехами, то при таком способе передачи они окажутся выше уровней помех и разборчивость будет выше, чем при приеме неограниченной речи. Правда, качество зву­чания и разборчивость речи в отсутствие помех будут ниже, чем для неограниченной речи, но остаются еще в допустимых пределах. Оказывается, что предельно ог­раниченный речевой сигнал для слуха будет иметь распределение по частоте и по уровням, не очень силь­но отличающееся от распределений неограниченной ре­чи. На рис. 10.1 приведено среднее распределение уров­ней для предельного ограничения речи (кривая 2) и без него (кривая 1), крутизна кривой изменяется толь­ко вдвое, а на рис. 10.3 приведены спектральные оги­бающие звуков речи также для обоих условий (полу­чаются несколько сглаженные форманты). Это объяс­няется тем, что слух имеет «комплект» узкополосных фильтров и, когда в одном или нескольких фильтрах уровень в данный момент повышается, то в других он уменьшается и наоборот, в результате чего в каждом из них процесс происходит с переменным уровнем.

В случае непредельного ограничения или компрес­сии результат получается промежуточный между пре­дельным ограничением и передачей неограниченной, некомпрессированной речи.

Вокодерная связь. Вокодер представляет со­бой устройство, в передающей части которого из речевого сигнала выделяются параметры, определяющие информативность речи. К этим параметрам относятся спектральные огибающие звуков речи и параметры ос­новного тона речи, т. е. признаки звуков речи, медлен­но изменяющиеся во времени. Параметр основного тона управляет частотой генератора основного тона, на­ходящегося в приемной части вокодера.

 

Рис. 10.3. Спектраль­ные огибающие зву­ков речи до ограничения (сплошные кри­вые) и после (пунктирные) : а) звука «э»; б) зву­ка «м»

 

Напряжение от этого генератора, создающего импульсы, сходные с им­пульсами гортани, подается на сложный фильтр, ими­тирующий акустическую систему речевого тракта для звонких звуков речи. При синтезе глухих звуков речи генератор создает шумовое напряжение, подаваемое на фильтры, имитирующие систему для глухих звуков речи. Параметрами этих фильтров и уровнем звуков речи управляют параметры, выделенные на передаю­щем конце, в результате чего восстанавливается спект­ральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются до­статочно высокими.

В зависимости от типа выделяемых параметров ре­чевого сигнала есть вокодеры полосные, гармониче­ские, формантные и фонемные. В полосных выделяется комплекс ординат спектра в узких полосках, в гармо­нических — коэффициенты Фурье от разложения спек­тральной огибающей в сумму гармоник, в формантных — частоты и амплитуды формант, в фонемных — какой звук произнесен. Так как эти параметры изменя­ются во времени со скоростью произнесения звуков речи (8—10 звуков в секунду), то частотный диапазон каждого параметра не превышает 20—25 Гц. Кроме то­го, в каждом из перечисленных типов вокодеров выде­ляется параметр (частота) основного тона голоса.

В полосных вокодерах берут 12—18 полос. Динами­ческий диапазон каждого параметра не превышает 25 дБ, поэтому при переводе параметров в импульсную форму достаточен четырехзначный код (16 значений по 1,5 дБ), а во времени достаточно 50 отсчетов в се­кунду. Необходимая пропускная способность для спект­ральных параметров требуется 18х4х50=3600 имп/с Ш на передачу основного тона еще 1200 имп/с, а всего 4800 имп/с. В настоящее время уже достигнуто высокое значение разборчивости речи и качества ее при скоро­сти в 2400 имп/с. В гармоническом вокодере требуемая скорость передачи несколько меньшая.

В наиболее распространенном типе формантного вокодера выделяются четыре формантных частоты и четыре формантных уровня. Динамический диапазон этих параметров — не более 20 дБ, поэтому достаточ­ны трехзначный код (8 значений по 2,5 дБ) и 40 отсче­тов в секунду. Всего получается 8х3х40 = 960 имп/с и 240 имп/с отводится на передачу мелодии основного тона. Требуемая скорость передачи параметров полу­чается равной 1200 имп/с.

Для фонемного вокодера требуемая скорость пере­дачи пока еще не ниже 300 имп/с, при этом теряется информация об индивидуальности говорящего.

Применение вокодеров дает повышение разборчи­вости речи в условиях радиопомех, так как сигналы пе­редаются в телеграфном режиме со специальным по­мехоустойчивым кодированием. Речь, передаваемая с помощью вокодерной связи, идет с высоким уровнем и хорошей разборчивостью даже при наличии сильных помех и замираний. Хорошая помехоустойчивая радиосвязь получается при формантном кодировании. Ее при­меняют на линиях KB связи.

Импульсная форма сигнала дает возможность коди­рования речи [5] аналогично кодированию телеграфной передачи. Такую закодированную речь невозможно под­слушать современными методами. Кроме того, вокодерная связь дает возможность значительного увеличения числа каналов в импульсных системах связи. Для обыч­ного речевого сигнала требуется пропускная способ­ность около 50 000 имп/с. В этом канале можно разме­стить около десяти передач при использовании полосно­го вокодера и около 40 при использовании формантного.

 








Дата добавления: 2016-02-16; просмотров: 1049;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.01 сек.