ФОРМАНТНЫЙ МЕТОД ОПРЕДЕЛЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ.
Был предпринят ряд попыток для нахождения непосредственной связи между разборчивостью речи, с одной стороны, характеристиками трактов передачи речи и условиями ее приема и передачи, с другой, но не было получено приемлемых результатов. Только при посредстве формантной теории, разработанной Флетчером и Коллардом, удалось установить эту связь.
Форманты звуков речи заполняют весь частотный диапазон от 150 до 7000 Гц. Средняя вероятность появления формант в том или ином участке диапазона для каждого языка вполне определенна. Условились делить весь частотный диапазон на 20 таких полос, чтобы в каждой из них вероятность появления формант была одинаковой. Соответствующие полосы назвали полосами равной разборчивости. Они определены для ряда языков, в том числе и для русского. Оказалось, что при достаточно большом количестве передаваемого материала вероятности появления формант подчиняются правилу аддитивности. Вследствие этого вероятность появления формант в каждой полосе равной разборчивости равна 0,05.
Если слушать речь в условиях шумов и помех, то ее разборчивость получается меньшей, чем в их отсутствие. Дело в том, что форманты имеют различные уровни интенсивности: у громких звуков выше, чем у глухих. Поэтому при увеличении уровня шумов сначала маскируются форманты с низкими уровнями, а затем с более и более высокими. Вследствие этого по мере увеличения уровня шумов и помех вероятность восприятия формант постепенно уменьшается. Коэффициент, определяющий это уменьшение, называют коэффициентом восприятия или коэффициентом разборчивости w. Таким образом, в каждой полосе равной разборчивости вероятность приема формант будет ΔА = 0,05 w.
Так как в основном вся энергия звуков речи сосредоточена в формантах, то уровни формант практически совпадают с уровнями звуков речи. На рис. 10.1 показано распределение уровней речи, т. е. интегральная вероятность появления уровня не менее заданного в зависимости от разности между средним уровнем речи, определенным за длительный интервал времени, и заданным уровнем. Эта вероятность практически совпадает с вероятностью распределения формант. Заметим, что это распределение почти не зависит от частоты.
Порог слышимости в шумах (см. § 2.7) определяется спектральными уровнями шумов. Для флуктуационных шумов величина порога слышимости почти не зависит от времени. Вследствие этого разность между средним спектральным уровнем речи и спектральным уровнем шумов будет определять вероятность появления формант выше уровня шумов . Но разность между уровнем сигнала и уровнем порога слышимости называют уровнем ощущения. Следовательно, коэффициент разборчивости w определяется уровнем ощущения формант
(10.1)
где Bр — средний спектральный уровень речи; Вш — спектральный уровень шумов.
Коэффициент разборчивости может быть определен с помощью графика рис. 10.1. Для примера на этом рисунке показаны уровень ощущения Е и соответствующий ему коэффициент разборчивости w.
Между формантной и другими видами разборчивости экспериментально были найдены зависимости. Для слоговой разборчивости такая зависимость приведена на рис. 10.2. Интересно отметить, что при формантной разборчивости, равной 0,5 (принимается только половина всех формант), слоговая разборчивость равна 80%, т. е. получается почти полная понятность речи
Это характеризует избыточность речи и комбинационную способность человеческого мозга.
Рис. 10.1. Интегральное распределение уровней речи: 1 — для непреобразованного сигнала; 2 — для предельно-ограниченного по амплитуде
Рис. 10.2. Зависимость слоговой разборчивости от формантной
Звуковые единицы характеризуются различными свойствами в зависимости от различных факторов их рассмотрения. Образованию звуковых единиц соответствует артикуляционный фактор, который называют анатомо-физиологическим. Акустический фактор относится к свойствам звуковых единиц в результате работы произносительных органов и определяет звучание речи. Восприятие звуков человеком относится к персептивному фактору. Первоначально описания звуковых систем осуществлялось на основеанализа артикуляций. Но с развитием техники акустического анализа звуков исследователи приходят к выводу, что акустические характеристики речи наиболее важны. Современная фонетика учитывает тесную связь и взаимообусловленность между артикуляционными и акустическими характеристиками речи. Исследования восприятия речевых единиц показывает, что они воспринимаются не так, как любые другие звуки. Это объясняется, как способностью человека преобразовывать их в соответствующие артикуляции, так и функциональными свойствами речевых звуковых единиц. Звуки речи являются сложными звуками в основном из-за того, что процесс речеобразования сопровождается резонансными явлениями, собственные частоты которых изменяются в зависимости от того, какой звук в данный момент произносится. Источник звука вызывает в системе резонаторов речеобразующего тракта собственные колебания. Звуки на собственных частотах резонаторов являются наиболее усиленными. Собственные частоты резонаторов называют формантами звука, так как они формируют характерное звучание гласных и согласных. Частоты формант определяются конфигурацией речевого тракта и свойства источника звука на них не влияет. Это одно из важнейших положений акустической теории речеобразования. Это положение позволяет связывать частоты формант только со спецификой артикуляции и по частотам формант судить о положении артикуляционных органов. Число формант, существенно характеризующих определенный звук речи, исследователи определяют по разному, но в большинстве случаев исследователи считают, что в образовании определенного звука участвуют четыре форманты.
Основные параметры звукового поля. Устанавливается следующий минимальный набор критериев, характеризующих параметры звукового поля, формируемого СЗО (системой звукового обеспечения) :
· показатель разборчивости речи;
· диапазон эффективно воспроизводимых звуковых частот;
· неравномерность поля уровней на озвучиваемой поверхности;
· номинальный уровень звукового давления (УЗД).
Электроакустический расчет выполняется для всей озвучиваемой поверхности. Под озвучиваемой поверхностью подразумевается плоскость параллельная полу помещения, а в случае озвучивания открытых пространств - параллельной поверхности земли. Высота этой поверхности относительно уровня пола при наличии сидячих зрительских мест принимается равной 1.2 м, а для стоящих слушателей - 1.6 м.
Конечным критерием оценки разборчивости речи является ее понятность. Она представляет собой субъективную категорию с 5 градациями, указанными в графе 1 табл.1. При определении понятности следует исходить из ее связи с расчетными (или измеренными) критериями. В графах 2 и 3 табл. 1. данная связь показана для слоговой разборчивости русской речи и для быстрого индекса передачи речи (RASTI) .
Таблица 1
Понятность | Отлич ная | Хоро шая | Удовлетвори тельная | Плохая | Недопустимо плохая |
Слоговая разборчивость S,% /Справочник [1989]./ | 80-100 | 55-80 | 44-55 | 25-40 | >25 |
RASTI /МЭК 268-16/ | 0.75-1.00 | 0.60-0.75 | 0.45-0.60 | 0.30-0.45 | >0.30 |
Для проектируемых СЗО должна быть обеспечена разборчивость речи, соответствующая ее понятности не хуже "хорошей".
В отдельных случаях, оговоренных в ТЗ на проектирование, допускается обеспечение "удовлетворительной" понятности речи. Такой подход допустим лишь в тех случаях, когда особенности очень гулкого помещения не позволяют снизить значение его времени реверберации на средних частотах менее чем до 2.0-2.5 с. Типичным примером таких помещений являются залы-памятники архитектуры, а также культовые сооружения.
Расчет разборчивости речи производится для всех озвучиваемых поверхностей. Помимо электроакустических и геометрических параметров СЗО, к исходным данным для расчета разборчивости речи относятся время реверберации озвучиваемого помещения (RT60, с) и ожидаемый в нем уровень акустических шумов (LN, дБ). Оба эти показателя устанавливаются в виде набора значений на частотах стандартного октавного ряда в пределах эффективно воспроизводимого диапазона частот. Значения RT60 и LN заимствуются из соответствующих разделов проекта, посвященных акустическому решению помещений и их защите от шума. При отсутствии этих данных в указанных разделах проекта, значения RT60 должны быть вычислены отдельно, а значения LN могут быть приняты как допустимые значения октавных УЗД, указанных в нормативной документации на данный тип помещений (например, согласно МГСН 2.04-97). При расчете RT60 может быть использована традиционная методика.
Диапазон эффективно воспроизводимых частот определяется как участок амплитудно-частотной характеристики с неравномерностью не более ± 3 дБ в октавных полосах.
Неравномерность поля уровней на озвучиваемой поверхности DL в дБ определяется отдельно в октавных полосах в заданном для данного типа СЗО по выражению:
где LMAX и LMIN соответственно максимальные и минимальные значения общих уровней звукового давления (с учетом прямого звука и диффузной составляющей поля) на озвучиваемой поверхности, вычисляемые при работе СЗО на установленных для отдельных акустических излучателей значениях подводимой электрической мощности, которые не должны превышать значений номинальной электрической мощности, оговоренных в ТУ на данный вид акустического излучателя.
Речевые СЗО.
Основным требованием к речевой СЗО является обеспечение достаточной разборчивости речи на всей озвучиваемой поверхности.
Расчет электроакустических параметров следует проводить для октавных полос со среднегеометрическими частотами 500, 1000 и 2000 Гц.
Минимально допустимые регламентируемые настоящим Руководством параметры поля речевой СЗО приведены в табл. 2
Таблица 2.
Параметр звукового поля | Уровень комфорта | |
I | II | |
разборчивость | отл. | хор. |
диапазон эффективно воспроизводимых частот | 200 - 4000 Гц | 200 - 6300 Гц |
неравномерность поля уровней на озвучиваемой площади | 2 дБ | 3 дБ |
уровень звукового давления | см. п. 5.2.11 (минимальное допустимое значение - 80 дБ) | |
Дата добавления: 2016-02-16; просмотров: 2620;