МЕТОДЫ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ.

Введение. Одним из методов повышения разборчивости речи является снижение уровней шумов и помех. Но в большинстве случаев они бывают заданными и не зависят от нас, хотя иногда можно снизить помехи от диффузного звука (путем уменьшения акустического отношения), от шумов, проникающих под заглушки, и т. п. Остается возможность манипулирования уровнями речи у слушателя по прямому звуку. Это возможно следующим образом: повышением уровня голоса говорящего, приближением микрофона ко рту и уменьшением неравномерности озвучения (путем приближения минимального уровня прямого звука к максимальному), увеличением индекса тракта. Последний способ возможен только при условии, что в системах звукоусиления не достигнут предельный индекс тракта, а в других системах — рациональный. И, наконец, есть еще способ повышения разборчивости речи — способ такой компрессии динамического диапазона речевого сигнала, при которой происходит повышение уровней слабых звуков речи при сохранении уровней громких звуков речи. Для систем с обратной акустической связью этот метод непригоден, так как возникает самовозбуждение системы. А в остальных системах слабые уровни речи повышаются на величину компрессии динамического диапазона.

Из компрессоров наиболее применимы ограничители уровня, действие которых сводится к выравниванию пиковых уровней громких звуков, при этом не изменяются соотношения между уровнями слабых звуков. Подробно об этом будет сказано в курсе «Радиовещание».

Амплитудное ограничение. Рассмотрим предельный случай компрессии речи — предельное амплитудное ограничение, при котором речевой сигнал превращается в последовательность прямоугольных импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами. При модуляции сигнала передатчика таким речевым сигналом получается телеграфный режим работы. А это означает, что все звуки речи будут иметь одинаковый и притом максимальный уровень на приеме. Если при передаче неограниченной речи слабые звуки маскировались помехами, то при таком способе передачи они окажутся выше уровней помех и разборчивость будет выше, чем при приеме неограниченной речи. Правда, качество звучания и разборчивость речи в отсутствие помех будут ниже, чем для неограниченной речи, но остаются еще в допустимых пределах. Оказывается, что предельно ограниченный речевой сигнал для слуха будет иметь распределение по частоте и по уровням, не очень сильно отличающееся от распределений неограниченной речи. На рис. 10.1 приведено среднее распределение уровней для предельного ограничения речи (кривая 2) и без него (кривая 1), крутизна кривой изменяется только вдвое, а на рис. 10.3 приведены спектральные огибающие звуков речи также для обоих условий (получаются несколько сглаженные форманты). Это объясняется тем, что слух имеет «комплект» узкополосных фильтров и, когда в одном или нескольких фильтрах уровень в данный момент повышается, то в других он уменьшается и наоборот, в результате чего в каждом из них процесс происходит с переменным уровнем.

В случае непредельного ограничения или компрессии результат получается промежуточный между предельным ограничением и передачей неограниченной, некомпрессированной речи.

Вокодерная связь. Вокодер представляет собой устройство, в передающей части которого из речевого сигнала выделяются параметры, определяющие информативность речи. К этим параметрам относятся спектральные огибающие звуков речи и параметры основного тона речи, т. е. признаки звуков речи, медленно изменяющиеся во времени. Параметр основного тона управляет частотой генератора основного тона, находящегося в приемной части вокодера.

Рис. 10.3. Спектральные огибающие звуков речи до ограничения (сплошные кривые) и после (пунктирные) : а) звука «э»; б) звука «м»

Напряжение от этого генератора, создающего импульсы, сходные с импульсами гортани, подается на сложный фильтр, имитирующий акустическую систему речевого тракта для звонких звуков речи. При синтезе глухих звуков речи генератор создает шумовое напряжение, подаваемое на фильтры, имитирующие систему для глухих звуков речи. Параметрами этих фильтров и уровнем звуков речи управляют параметры, выделенные на передающем конце, в результате чего восстанавливается спектральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются достаточно высокими.

В зависимости от типа выделяемых параметров речевого сигнала есть вокодеры полосные, гармонические, формантные и фонемные. В полосных выделяется комплекс ординат спектра в узких полосках, в гармонических — коэффициенты Фурье от разложения спектральной огибающей в сумму гармоник, в формантных — частоты и амплитуды формант, в фонемных — какой звук произнесен. Так как эти параметры изменяются во времени со скоростью произнесения звуков речи (8—10 звуков в секунду), то частотный диапазон каждого параметра не превышает 20—25 Гц. Кроме того, в каждом из перечисленных типов вокодеров выделяется параметр (частота) основного тона голоса.

В полосных вокодерах берут 12—18 полос. Динамический диапазон каждого параметра не превышает 25 дБ, поэтому при переводе параметров в импульсную форму достаточен четырехзначный код (16 значений по 1,5 дБ), а во времени достаточно 50 отсчетов в секунду. Необходимая пропускная способность для спектральных параметров требуется 18х4х50=3600 имп/с Ш на передачу основного тона еще 1200 имп/с, а всего 4800 имп/с. В настоящее время уже достигнуто высокое значение разборчивости речи и качества ее при скорости в 2400 имп/с. В гармоническом вокодере требуемая скорость передачи несколько меньшая.

В наиболее распространенном типе формантного вокодера выделяются четыре формантных частоты и четыре формантных уровня. Динамический диапазон этих параметров — не более 20 дБ, поэтому достаточны трехзначный код (8 значений по 2,5 дБ) и 40 отсчетов в секунду. Всего получается 8х3х40 = 960 имп/с и 240 имп/с отводится на передачу мелодии основного тона. Требуемая скорость передачи параметров получается равной 1200 имп/с.

Для фонемного вокодера требуемая скорость передачи пока еще не ниже 300 имп/с, при этом теряется информация об индивидуальности говорящего.

Применение вокодеров дает повышение разборчивости речи в условиях радиопомех, так как сигналы передаются в телеграфном режиме со специальным помехоустойчивым кодированием. Речь, передаваемая с помощью вокодерной связи, идет с высоким уровнем и хорошей разборчивостью даже при наличии сильных помех и замираний. Хорошая помехоустойчивая радиосвязь получается при формантном кодировании. Ее применяют на линиях KB связи.

Импульсная форма сигнала дает возможность кодирования речи [5] аналогично кодированию телеграфной передачи. Такую закодированную речь невозможно подслушать современными методами. Кроме того, вокодерная связь дает возможность значительного увеличения числа каналов в импульсных системах связи. Для обычного речевого сигнала требуется пропускная способность около 50 000 имп/с. В этом канале можно разместить около десяти передач при использовании полосного вокодера и около 40 при использовании формантного.

<48 495051 52 53 54 >

Дата добавления: 2016-02-16; просмотров: 1107;