ПЕРВИЧНЫЙ РЕЧЕВОЙ СИГНАЛ.

Речь с физической точки зрения состоит из последовательности звуков с паузами между их группами. При нормальном темпе речи паузы появляются между отрывками фраз, так как при этом слова произносятся слитно (хотя слух, как правило, воспринимает слова по отдельности). При замедленном темпе речи, например, при диктовке, паузы могут делаться между словами и даже их частями. Предлоги, союзы звучат всегда слитно с последующим словом.

Один и тот же звук речи разные люди произносят по-разному. Произношение звуков речи зависит от ударения, соседних звуков и т. п. Но при всем многообразии в их произношении они являются физическими реализациями (произнесением) ограниченного числа обобщенных звуков речи, называемых фонемами. Фонема — это то, что человек хочет произнести, а звук речи — это то, что человек фактически произносит. Фонема по отношению к звуку речи играет ту же роль, что и образцовая буква по отношению к ее рукописной форме в конкретном написании.

B русском языке насчитываются 41 основная и 3 неясно зву­чащих фонемы: 6 гласных (а, о, у, э, и, ы), 1 полугласная (й) и 34 согласных. Гласные буквы я, ю, ё, е (соответствуют или состав­ным фонемам: йа, йу, йо, йэ, или служат для смягчения предыду­щей согласной. Согласных фонем больше, чем согласных букв, так как род согласных букв соответствует двум фонемам: мягкой и твердой. Только твердых фонем 3 (ш, ж, ц), только мягких—1 (ч). Остальные l6 существуют в обоих видах: твердом и мягком.

Если связки тонкие и сильно напряжены, то период получается коротким и частота основного тона — высокой; для толстых, слабонапря­женных связок частота основного тона низкая. Эта ча­стота для всех голосов лежит в пределах от 70 до 450 Гц. При произнесении речи она непрерывно изме­няется в соответствии с ударением и подчеркиванием звуков и слов, а также для проявления эмоций (воп­рос, восклицание, удивление и т. д.). Изменение часто­ты основного тона называют интонацией. У каждого человека свой диапазон изменения частоты основного тона (обычно он бывает немногим более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости говорящего. Основной тон, интона­ция, устный «почерк» и тембр (окраска) голоса могут служить для опознавания человека. При этом степень достоверности опознавания выше, чем по отпечаткам пальцев. Это свойство используют в разработанной в последнее время аппаратуре, срабатывающей только от определенных голосов.

Импульсы основного тона имеют пилообразную форму, и поэтому при их периодическом повторении по­лучается дискретный спектр с большим числом гармо­ник (до 40), частоты которых кратны частоте основно­го тона. Огибающая спектра основного тона имеет спад в сторону высоких частот с крутизной около 6 дБ/окт. Например, для мужского голоса уровень гар­моник на частоте 3000 Гц ниже уровня на 100 Гц при­мерно на 30 дБ.

Звуки речи делят на звонкие и глухие. Звонкие зву­ки образуются с участием голосовых связок, в этом случае находящихся в напряжении. Под напором воз­духа, идущего из легких, они периодически раздвига­ются, в результате чего создается прерывистый поток воздуха. Импульсы потока воздуха, создаваемые голо­совыми связками с достаточной точностью, могут счи­таться периодическими. Соответствующий период пов­торения импульсов называют периодом основного тона голоса То. Обратную величину fo=1\T называют час­тотой основного тона.

При произнесении глухих звуков голосовые связки находятся в расслабленном состоянии и поток воздуха из легких свободно проходит в полость рта. Встречая на своем пути различные преграды в виде языка, зу­бов, губ, он образует завихрения, создающие шум со сплошным спектром.

По способу образования согласные делят на сонорные, щеле­вые, взрывные и аффрикаты (комбинация глухих взрывных и щеле­вых). Сонорные (л, ль, р, рь, м, мь, н, нь) по звучанию похожи на гласные, но отдельно не произносятся и поэтому отнесены к согласным. Щелевые (в, вь, з, зь, ж, ф, фь, с, сь, ш, х, хь) обра­зуются путем проталкивания потока воздуха в виде импульсов шума через узкие щели, создаваемые языкам и нёбом, губами, зубами, гортанью. Взрывные (п, пь, т, ть, к, кь, б, 6ъ, д, дь, г, гь) образуются путем (резкого проталкивания .потока (воздуха через гу­бы, зубы, гортань. По месту образования фонемы делят на губные, зубные, нёбные, гортанные, передние и задние.

При произнесении звуков речи язык, губы, зубы, нижняя челюсть, голосовые связки должны находиться для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляциейорганов речи. При этом в речеобразующем тракте соз­даются определенные для данной фонемы резонансные полости, а для слитного звучания фонем в речи — и оп­ределенные переходы от одной формы тракта к другой.

Через речевой тракт при произнесении звуков прохо­дят или тональный импульсный сигнал, или шумовой, или тот и другой вместе. Речевой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа и носоглотки, т. е. с помощью артикуляционных органов речи. Вследствие этого тональный или шумовой спектры с монотонной огибающей превращаются в спектры с рядом максиму­мов и минимумов.

Форманта — термин фонетики, обозначающий акустическую характеристику звуков речи (прежде всего гласных), связанную с уровнем частоты голосового тона и образующую тембр звука. Форманта может характеризоваться либо занимаемой ею частотной полосой, либо средней частотой, соответствующей максимуму амплитуды или энергии составляющих в формантной полосе, и средним уровнем этой энергии. Большинство звуков речи имеет одну или две форманты, что обусловлено участием в образовании этих звуков основных резонаторов голосового аппарата - полости глотки и носоглотки.

Максимально в отдельных звуках замечено до 6 усиленных частотных областей. Однако далеко не все они являются формантами. Некоторые из них никакого значения для распознавания звуков не имеют, хотя и несут в себе довольно значительную энергию.

Формантными являются одна или две частотные области. Исключение из передачи любой из этих областей вызывает искажение передаваемого звука, т. е. либо превращение его в другой звук, либо вообще потерю им признаков звука человеческой речи. рукописной форме в конкретном напи­сании.

Максимумы спектра называют формантами, а нулевые значения — антиформантами. Оги­бающая спектра для каждой фонемы имеет индивиду­альную и вполне определенную форму (рис. 3.3). При произнесении речи спектр ее непрерывно изменяется, в результате чего образуются формантные переходы. Ча­стотный диапазон речи находится в пределах 70 — 7000 Гц.

Звонкие звуки речи, особенно гласные, имеют высо­кий уровень интенсивности, глухие — низкий. В процес­се произнесения речи ее громкость непрерывно изменя-

ется, особенно резко при взрывных звуках речи. Дина­мический диапазон уровней звуков речи находится в пределах 35—45 дБ. Гласные звуки имеют в среднем длительность около 0,15 с, согласные —около 0,08 с, звук «п» — около 30 мс. Большая длительность гласных звуков необходима для перестройки артикуляционных органов, так как иначе язык будет «заплетаться».

Звуки речи неодинаково информативны. Так, глас­ные звуки содержат меньшую информацию о смысле ре­чи, чем глухие. Поэтому разборчивость речи снижается при действии шумов, в пер­вую очередь из-за маскировки глухих звуков.

Известно, что для передачи одного и того же сооб­щения по телеграфу и по речевому тракту требуется различная пропускная способность тракта: для телегра­фного сообщения не более 100 бит/с, а для речевого — около 100 000 бит/с (полоса равна 7000 Гц, динамичес­кий диапазон 42 дБ, т. е. требуется семизначный код, откуда имеем: 2х7000х7 = 98000 бит/с), т. е. в 1000 раз большая. Может показаться, что речевой сигнал имеет огромную избыточность. Это неверно и вот почему.

.В результате спектральной модуляции изменяется соотношение между частотными составляющими несу­щей, т. е. изменяется форма огибающей ее спектра (по­являются форманты и антиформанты). Почти вся ин­формация о звуках речи заключается в этой спектраль­ной огибающей и ее временном изменении. Эти измене­ния происходят медленно( в темпе произнесения звуков), поэтому передача сведений об огибающей и ее из­менении не требует пропускной способности тракта бо­лее 100 бит/с. Но для передачи широкополосной несу­щей с ее широким динамическим диапазоном требуется очень большая пропускная способность. Кроме того, речевой сигнал при образовании в речевом тракте приобретает много информации, не относящейся к смыслу передаваемой речи (например, фазовую информацию). Эта информация называется сопутствующей. Для ее пе­редачи также расходуется пропускная способность трак­та. Из этого следует, что избыточность речевого сигна­ла лишь немного превышает избыточность телеграфно­го сигнала с таким же сообщением: речевой сигнал от­личается от телеграфного лишь информацией об эмоци­ях и личности говорящего.

Поэтому для передачи смысла достаточно переда­вать сведения о форме огибающей спектра речи, а так­же об изменении основного тона речи и переходов тон-шума. Эти сигналы идут от речевого центра мозга.

 

- Частично информация о звуках речи заключена в переходах от тонального спектра к шумовому и обратно (т. е. в переходах от звонких звуков к глухим и обратно), а информация о сигнале — еще и в интонации. По фонетической теории информация заклю­чается только в скорости изменения спектральных уровней.

- Речевой сигнал можно уподобить водоему, в котором нахо­дится рыба. Водоем может иметь большой объем, а полезной ин­формации (рыбы) в нем может быть немного.

 

ВТОРИЧНЫЙ СИГНАЛ.

Вторичный сигнал должен точно воспроизводить первичный, но это не всегда требуется, так как слух человека может и не заметить их несо­ответствие. К тому же на практике точное соответствие их часто невозможно или очень трудно осуществить. При художественном вещании, телевидении и звукоза­писи надо стремиться к этому соответствию в пределах, при которых слуховое ощущение, создающееся у слуша­теля, было бы близко к тому ощущению, которое он по­лучает, находясь в месте исполнения данной программы при условии достаточно хороших акустических условий в этом месте. Для информационных программ вещания и телефонной связи этого соответствия добиваются в первую очередь для получения полной понятности речи, а затем для достаточно высокого качества звучания. Только в этом случае необходимо стремиться к более точному соответствию вторичного сигнала первичному, В обоих случаях существенную роль играют экономиче­ские соображения.

Нарушение точности передачи, замечаемое слухом, бывает самого разнообразного вида. Рассмотрим основ­ные из них: потерю акустической перспективы, смеще­ние уровней, ограничение динамического и частотного Диапазона сигнала, помехи, искажения.

Потеря акустической перспективы. При передаче звукового сигнала по одноканальной системе получается ощущение слушания одним ухом, даже при наличии нескольких микрофонов в помещении, откуда ведется передача, и при разнесенных вторичных источниках звука. Источник звука для слуха будет всегда казаться находящимся в некотором среднем положении по отношению к фактическим вторичным источникам, по­скольку временной сдвиг и разность уровней для обоих ушей слушателя не зависят от местонахождения пер­вичного источника звука. Этот дефект может быть до некоторой степени исправлен с помощью стереофониче­ской системы передачи, основанной на многоканальной системе передачи сигнала .

Смещение уровней. Поскольку по тракту передачи сигналов не передается информация об абсолют­ных уровнях звучания первичного сигнала, то слушатель (а при массовом слушании — оператор на прием­ном конце) по своему усмотрению устанавливает уровень вторичного сигнала. При этом не всегда можно восстановить нужный уровень первичного сигнала из-за недостаточной мощности аппаратуры на приемном кон­це, а также из-за условий слушания (например, в квар­тирах с плохой звукоизоляцией).

Смещение уровней приводит к изменению соотношения между громкостями низкочастотных и среднечастотных составляющих первичного и вторичного сигна­лов, так как смещение среднего уровня вторичного сиг­нала вверх по отношению к среднему уровню первично­го приводит к субъективному повышению громкости низкочастотных составляющих, смещение вниз — к их ослаблению.

Ограничение динамического диапазона. Поскольку динамический диапазон канала ограни­чен снизу шумами, а сверху — перегрузкой и нелинейно­стью отдельных звеньев канала передачи, то во избежа­ние искажений его сжимают в начале тракта (во вся­ком случае до звена, в котором скорее всего может ог­раничиться или исказиться сигнал). Этот дефект мо­жет быть частично исправлен путем расширения дина­мического диапазона сигнала на конце тракта, что не всегда возможно, так как на приемном конце может быть неизвестно, насколько был сжат этот диапазон. Кроме того, попытка расширить диапазон (применени­ем экспандеров) усложняет аппаратуру.

Ограничение частотного диапазона. По­скольку тракт передачи акустических сигналов не про­пускает весь их частотный диапазон, говорят об огра­ничении частотного диапазона.

Помехи. При передаче на сигнал накладываются различного рода помехи, в том числе шумы электриче­ского и акустического происхождения. Последние име­ются как в месте нахождения первичного источника, звука, так и в месте нахождения слушателя.

Искажения. По сути дела все перечисленные несоответствия первичного и вторичного сигналов явля­ются искажениями в широком смысле этого понятия. Но обычно под этим термином понимают более узкий тип искажений. К ним относятся линейные, нелинейные, па­раметрические и переходные (временные) искажения.

 

ШУМЫ И ПОМЕХИ

Одна из наиболее серьезных причин, мешающих высококачественному воспроизведению передаваемой программы, - помехи, возникающие в тракте звукопередачи. Особенно неприятны на слух помехи в паузах, а также на тихих местах исполнения, когда они не маскируются полезным сигналом и потому существенно мешают восприятию звука.

Помехи по своему характеру и происхождению разделяются на фон, шум и различного характера внешние наводки. Влияние шумов и помех сводится к маскировке вторич­ного акустического сигнала независимо от их происхож­дения (акустического или электрического). Шумы сдви­гают порог слышимости, который не зависит от време­ни, если шумы относятся к «гладким», т. е. имеют пик-фактор, не превышающий 6 дБ. К этим шумам относят­ся различные флуктуационные шумы, например шумы; дробового эффекта, речевые шумы от нескольких голо­сов, звучащих одновременно. Импульсные шумы созда­ют порог слышимости, изменяющийся во времени в зависимости от пик-фактора шума и длительности им­пульсов. Из-за наличия постоянной времени у слуха ощущение кратковременных импульсов получается сгла­женным: происходит выравнивание временной зависи­мости порога слышимости. Импульсные шумы не толь­ко маскируют полезный сигнал, но и искажают его, со­здавая комбинационные частоты шума и сигнала. Полу­чается нечто похожее на взаимную модуляцию сигнала и шума.

Спектр шумов электрического происхождения, как; правило, близкий к равномерному, а акустического про­исхождения — ближе к речевому. Поэтому частотная за­висимость порога слышимости для первых имеет тен­денцию роста к высоким частотам, так как ширина кри­тических полосок растет с увеличением частоты. Для ре­чевых шумов порог слышимости почти не зависит от частоты.

Индустриальные, атмосферные и станционные поме­хи, кроме тональных, могут быть отнесены и к импуль­сным, и к гладким, с равномерным или низкочастотным спектром. Кроме этих помех, приходится иногда считаться с помехами от самомаскировки речи, т. е. с мас­кировкой слабых звуков, следующих за громкими.

Фон проявляется обычно в виде прослушиваемого низкого однотонного гудения с частотой 50 или 100 Гц. Причина фона может быть двоякой: чаще всего это плохая фильтрация переменной составляющей напряжения, выпрямленного в источнике питания и используемого для питания транзисторов или электронных ламп усилителей. Но могут проявиться и внешние наводки, т.е. возбуждения в самом усилителе или в присоединенных к нему проводах и линиях колебаний, появляющиеся за счет электромагнитной связи этих цепей с посторонними источниками электрических и магнитных полей (например, трансформаторов, силовых электрических кабелей, театральных софитов и т.п. Таким же путем, т.е. путем электромагнитных наводок на токоведущие цепи канала передачи звукового сигнала, могут проникнуть в канал и, так называемые, "внятные" помехи, например, посторонние программы близко расположенных мощных радиовещательных станций и т.п. Для борьбы с наводками любого характера следует тщательно защищать, применяя экранировку, те цепи, по которым протекают слабые токи ( например, микрофонные провода).

Принцип действия экранов следующий. Провод, по которому передаются токи звуковой частоты, заключаются в гибкую и достаточно густую металлическую сетку , обязательно заземленную. Электрические заряды, образующиеся на экране из-за влияния внешних полей, стекают на землю, не наводя помех на токоведущие части схемы.

Экранами снабжаются также все используемые в схемах трансформаторы и катушки индуктивности - потенциальные источники сильных помех. Эти экраны, выполненные в виде кожухов из железа, пермаллоя или других подобных магнитных материалов, выполняют двоякую роль: предохраняют трансформатор от воздействия внешних магнитных полей и, кроме того, не дают возможности полю рассеяния самого трансформатора оказывать нежелательное влияние на соседние детали схемы.

Еще более неприятен на слух и трудно устраним собственный шум транзисторов, электронных ламп и резисторов, входящих в схему. Это характерное шипение, с физической точки зрения - тот же звук с непрерывным спектром, его энергия распределена на широком участке диапазона звуковых частот. На практике часто встречаются шумы, отличающиеся один от другого не только по интенсивности, но и по тембру и ритму. Но самым характерным и типичным шумом является шум, не имеющий ни определенного тона, ни ритма, у которого, следовательно, ни одна частотная полоса не отличается от другой по энергии и ни один отрезок, выделенный во времени, не отличается от другого по частотному составу. Такой шум называют "белым" по аналогии с принятым в оптике наименованием белого цвета, который можно, как известно получить, смешивая в одинаковых пропорциях все цвета солнечного спектра.

Борьба с акустическими шумами ведется путем уст­ранения (или ослабления) действия источников шума, а также путем повышения звукоизоляции помещений. Учет их действия на прием речевого сигнала делается при расчете и измерении разборчивости речи.

 








Дата добавления: 2016-02-16; просмотров: 3912;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.013 сек.