Субъективные методы оценки разборчивости
Оценка процента разборчивости (артикуляции) зависит от ряда факторов, основные из которых следующие:
- выбор для прослушивания элементов речи (звуки, слоги, слова, фразы), наиболее полно отражающих статистику данного языка;
- подбор состава экспертов и степень их тренированности;
- качество голоса диктора, его дикция, интонация и др.;
- требования к помещению и условиям в нем (уровню шумов и др.)
- методика проведения измерений и методы статис-тической обработки результатов.
Именно эти требования и задаются в различных стандартах, так как только при их точном соблюдении можно получить повторяемость результатов.
Для регламентации таких испытаний введены отечественные стандарты: ГОСТ 25902-83. "Зрительные залы. Методы определения разборчивости речи", ГОСТ51061-97 "Параметры качества речи и методы ее измерения", международные стандарты ISO/TR4870, IEC 268-16. Сейчас разрабатывается новый стандарт AES, а также многочисленные национальные стандарты, например американский стандарт ANSI S3.2-1989 - "Method for measurement the Intelligibility of Speech Over Communication Systems" (имеется новая редакция R-1999) .
Стандартизованные правила прежде всего касаются отбора испытательного материала: специально составленных таблиц фраз, слов или слогов, которые записываются или передаются диктором для оценки помещения, системы звукоусиления, или других систем коммуникации. В зависимости от типа используемых при испытаниях элементов речи различается разборчивость звуковая, слоговая, словесная и фразовая. Все эти виды разборчивости при испытании одной и той же системы будут выражаться разными числовыми величинами, так как процент правильных оценок для предсказуемого сообщения всегда выше, чем для непредсказуемого. Степень предсказуемости при прослушивании фразы выше, чем при слушании отдельных слов или слогов, поскольку если часть фразы не услышана, то можно догадаться по смыслу о ее содержании. В связи с этим находятся и соотношения соответствующих видов разборчивости: фразовая - выше словесной, словесная - выше слоговой, слоговая - выше фонемной.
На рисунке 7а показана зависимость фразовой разборчивости от словесной, на рисунке 7б - словесной от слоговой. Из-за наличия таких связей для оценки разборчивости можно использовать различные элементы речи, однако в отечественных стандартах чаще используется оценка слоговой разборчивости, поскольку она имеет ряд преимуществ (меньшую запоминаемость, удобство при обработке и др.).
При проведении таких испытаний специально подобранные дикторы (с хорошей дикцией, правильной речью, с хорошим слухом) зачитывают в определенном ритме стандартизованные слоговые таблицы в выбранном помещении - с естественной акустикой или через звукоусилительную систему. Желательно, чтобы эксперты были незнакомы с дикторами, так как. разборчивость у знакомых дикторов выше за счет запоминания экспертами их интонации, дикции и др. Количество дикторов должно быть не менее четырех, причем желательно, чтобы они имели минимальную разницу по акустическим характеристикам голосов. Для проведения испытаний группа слушателей размещается в разных местах помещения и записывает прослушиваемый текст. Отношение правильно записанных на слух фонетических элементов к общему количеству переданных и определяет процент разборчивости.
Рис. 7а - связь фразовой и словесной разборчивости; 7б - связь словесной и слоговой разборчивости |
Для получения статистически достоверных результатов необходимо привлечение достаточно большого числа слушателей. В стандарте ГОСТ 25902-83 принята численность группы слушателей в 20 человек, позволяющая получить статистически надежные результаты. Для зала вместимостью более двух тысяч человек привлекаются две группы слушателей, а если вместимость зала более пяти тысяч человек - три группы слушателей, по 20 человек в каждой группе. Для сокращения времени испытаний в каждой группе проводится цикличная смена мест, при которой каждый слушатель с занимаемого им места переходит на место другого эксперта. Цикл заканчивается, когда все слушатели побывают на всех местах испытаний. Места, на которых определяется разборчивость, должны быть равномерно распределены по залу, а их количество должно соответствовать числу участвующих в испытаниях слушателей.
Большое влияние на результаты определения разборчивости речи оказывает не только количественный состав группы слушателей, но и другие факторы: образование, профессия, социальная принадлежность, а также память и сообразительность. Все слушатели должны обладать нормальным слухом, быть носителями данного языка, и должны быть знакомы со всеми тестовыми словами. Возрастной состав ограничен 35 годами. В процессе испытаний могут привлекаться как тренированная бригада экспертов, показания которой проверены на эталонной системе, так и нетренированные слушатели (при этом их количество должно быть больше).
Для ориентировочной оценки результатов испытаний в стандарте приведены классы средних значений разборчивости речи, указанные в таблице.
Класс | Условия | Средние значения слоговой разборчивости в % |
I | отличные | Свыше 90 |
II | хорошие | от 80 до 90 |
III | удовлетворительные | от 70 до 80 |
IV | плохие | Ниже 70 |
Наряду с разборчивостью, часто указываются и другие субъективные факторы, влияющие на качество восприятия речи. К ним относятся: громкость речи, эхо, порхающее эхо, нарушение локализации, тембровые искажения, повышенный уровень шума и плохие акустические условия в зоне расположения источника звука. Следует заметить, что громкость, эхо и шум являются факторами, которые непосредственно определяют разборчивость речи и косвенно оцениваются при субъективной оценке разборчивости.
В отечественных стандартах по оценке качества передачи речи по каналам связи (ГОСТ Р 50840-95 и ГОСТ 51061-97) также используется измерение слоговой разборчивости речи методом артикуляционных испытаний, и измерение фразовой разборчивости при нормальном и ускоренном темпах произнесения. При этом отбор экспертов, выбор слоговых таблиц и методы статистической оценки происходят практически по тем же правилам, только количество экспертов составляет 4:5 человек. Требования к каналам связи высшего качества составляют не менее 93% слоговой разборчивости.
В международных стандартах, в частности ANSI S3.2-89, предлагается использовать пять дикторов и пять экспертов, удовлетворяющих указанным выше требованиям, но процедура предъявления речевого материала значительно сложнее.
Таким образом, процедура организации субъективных экспертиз по оценке разборчивости речи - дело сложное, длительное и достаточно дорогостоящее, хотя и наиболее достоверное. Поэтому за последние годы большое внимание было уделено созданию объективных методов оценки разборчивости, что позволило внедрить в практику целый ряд новых достаточно эффективных компьютерных методов расчета разборчивости речи в различных условиях.
<== предыдущая лекция | | | следующая лекция ==> |
Образование согласных звуков | | | Подкожная клетчатка - |
Дата добавления: 2015-10-29; просмотров: 1109;