ПЕРВИЧНЫЙ РЕЧЕВОЙ СИГНАЛ.
Речь с физической точки зрения состоит из последовательности звуков с паузами между их группами. При нормальном темпе речи паузы появляются между отрывками фраз, так как при этом слова произносятся слитно (хотя слух, как правило, воспринимает слова по отдельности). При замедленном темпе речи, например, при диктовке, паузы могут делаться между словами и даже их частями. Предлоги, союзы звучат всегда слитно с последующим словом.
Один и тот же звук речи разные люди произносят по-разному. Произношение звуков речи зависит от ударения, соседних звуков и т. п. Но при всем многообразии в их произношении они являются физическими реализациями (произнесением) ограниченного числа обобщенных звуков речи, называемых фонемами. Фонема — это то, что человек хочет произнести, а звук речи — это то, что человек фактически произносит. Фонема по отношению к звуку речи играет ту же роль, что и образцовая буква по отношению к ее рукописной форме в конкретном написании.
B русском языке насчитываются 41 основная и 3 неясно звучащих фонемы: 6 гласных (а, о, у, э, и, ы), 1 полугласная (й) и 34 согласных. Гласные буквы я, ю, ё, е (соответствуют или составным фонемам: йа, йу, йо, йэ, или служат для смягчения предыдущей согласной. Согласных фонем больше, чем согласных букв, так как род согласных букв соответствует двум фонемам: мягкой и твердой. Только твердых фонем 3 (ш, ж, ц), только мягких—1 (ч). Остальные l6 существуют в обоих видах: твердом и мягком.
Если связки тонкие и сильно напряжены, то период получается коротким и частота основного тона — высокой; для толстых, слабонапряженных связок частота основного тона низкая. Эта частота для всех голосов лежит в пределах от 70 до 450 Гц. При произнесении речи она непрерывно изменяется в соответствии с ударением и подчеркиванием звуков и слов, а также для проявления эмоций (вопрос, восклицание, удивление и т. д.). Изменение частоты основного тона называют интонацией. У каждого человека свой диапазон изменения частоты основного тона (обычно он бывает немногим более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости говорящего. Основной тон, интонация, устный «почерк» и тембр (окраска) голоса могут служить для опознавания человека. При этом степень достоверности опознавания выше, чем по отпечаткам пальцев. Это свойство используют в разработанной в последнее время аппаратуре, срабатывающей только от определенных голосов.
Импульсы основного тона имеют пилообразную форму, и поэтому при их периодическом повторении получается дискретный спектр с большим числом гармоник (до 40), частоты которых кратны частоте основного тона. Огибающая спектра основного тона имеет спад в сторону высоких частот с крутизной около 6 дБ/окт. Например, для мужского голоса уровень гармоник на частоте 3000 Гц ниже уровня на 100 Гц примерно на 30 дБ.
Звуки речи делят на звонкие и глухие. Звонкие звуки образуются с участием голосовых связок, в этом случае находящихся в напряжении. Под напором воздуха, идущего из легких, они периодически раздвигаются, в результате чего создается прерывистый поток воздуха. Импульсы потока воздуха, создаваемые голосовыми связками с достаточной точностью, могут считаться периодическими. Соответствующий период повторения импульсов называют периодом основного тона голоса То. Обратную величину fo=1\T называют частотой основного тона.
При произнесении глухих звуков голосовые связки находятся в расслабленном состоянии и поток воздуха из легких свободно проходит в полость рта. Встречая на своем пути различные преграды в виде языка, зубов, губ, он образует завихрения, создающие шум со сплошным спектром.
По способу образования согласные делят на сонорные, щелевые, взрывные и аффрикаты (комбинация глухих взрывных и щелевых). Сонорные (л, ль, р, рь, м, мь, н, нь) по звучанию похожи на гласные, но отдельно не произносятся и поэтому отнесены к согласным. Щелевые (в, вь, з, зь, ж, ф, фь, с, сь, ш, х, хь) образуются путем проталкивания потока воздуха в виде импульсов шума через узкие щели, создаваемые языкам и нёбом, губами, зубами, гортанью. Взрывные (п, пь, т, ть, к, кь, б, 6ъ, д, дь, г, гь) образуются путем (резкого проталкивания .потока (воздуха через губы, зубы, гортань. По месту образования фонемы делят на губные, зубные, нёбные, гортанные, передние и задние.
При произнесении звуков речи язык, губы, зубы, нижняя челюсть, голосовые связки должны находиться для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляциейорганов речи. При этом в речеобразующем тракте создаются определенные для данной фонемы резонансные полости, а для слитного звучания фонем в речи — и определенные переходы от одной формы тракта к другой.
Через речевой тракт при произнесении звуков проходят или тональный импульсный сигнал, или шумовой, или тот и другой вместе. Речевой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа и носоглотки, т. е. с помощью артикуляционных органов речи. Вследствие этого тональный или шумовой спектры с монотонной огибающей превращаются в спектры с рядом максимумов и минимумов.
Форманта — термин фонетики, обозначающий акустическую характеристику звуков речи (прежде всего гласных), связанную с уровнем частоты голосового тона и образующую тембр звука. Форманта может характеризоваться либо занимаемой ею частотной полосой, либо средней частотой, соответствующей максимуму амплитуды или энергии составляющих в формантной полосе, и средним уровнем этой энергии. Большинство звуков речи имеет одну или две форманты, что обусловлено участием в образовании этих звуков основных резонаторов голосового аппарата - полости глотки и носоглотки.
Максимально в отдельных звуках замечено до 6 усиленных частотных областей. Однако далеко не все они являются формантами. Некоторые из них никакого значения для распознавания звуков не имеют, хотя и несут в себе довольно значительную энергию.
Формантными являются одна или две частотные области. Исключение из передачи любой из этих областей вызывает искажение передаваемого звука, т. е. либо превращение его в другой звук, либо вообще потерю им признаков звука человеческой речи. рукописной форме в конкретном написании.
Максимумы спектра называют формантами, а нулевые значения — антиформантами. Огибающая спектра для каждой фонемы имеет индивидуальную и вполне определенную форму (рис. 3.3). При произнесении речи спектр ее непрерывно изменяется, в результате чего образуются формантные переходы. Частотный диапазон речи находится в пределах 70 — 7000 Гц.
Звонкие звуки речи, особенно гласные, имеют высокий уровень интенсивности, глухие — низкий. В процессе произнесения речи ее громкость непрерывно изменя-
ется, особенно резко при взрывных звуках речи. Динамический диапазон уровней звуков речи находится в пределах 35—45 дБ. Гласные звуки имеют в среднем длительность около 0,15 с, согласные —около 0,08 с, звук «п» — около 30 мс. Большая длительность гласных звуков необходима для перестройки артикуляционных органов, так как иначе язык будет «заплетаться».
Звуки речи неодинаково информативны. Так, гласные звуки содержат меньшую информацию о смысле речи, чем глухие. Поэтому разборчивость речи снижается при действии шумов, в первую очередь из-за маскировки глухих звуков.
Известно, что для передачи одного и того же сообщения по телеграфу и по речевому тракту требуется различная пропускная способность тракта: для телеграфного сообщения не более 100 бит/с, а для речевого — около 100 000 бит/с (полоса равна 7000 Гц, динамический диапазон 42 дБ, т. е. требуется семизначный код, откуда имеем: 2х7000х7 = 98000 бит/с), т. е. в 1000 раз большая. Может показаться, что речевой сигнал имеет огромную избыточность. Это неверно и вот почему.
.В результате спектральной модуляции изменяется соотношение между частотными составляющими несущей, т. е. изменяется форма огибающей ее спектра (появляются форманты и антиформанты). Почти вся информация о звуках речи заключается в этой спектральной огибающей и ее временном изменении. Эти изменения происходят медленно( в темпе произнесения звуков), поэтому передача сведений об огибающей и ее изменении не требует пропускной способности тракта более 100 бит/с. Но для передачи широкополосной несущей с ее широким динамическим диапазоном требуется очень большая пропускная способность. Кроме того, речевой сигнал при образовании в речевом тракте приобретает много информации, не относящейся к смыслу передаваемой речи (например, фазовую информацию). Эта информация называется сопутствующей. Для ее передачи также расходуется пропускная способность тракта. Из этого следует, что избыточность речевого сигнала лишь немного превышает избыточность телеграфного сигнала с таким же сообщением: речевой сигнал отличается от телеграфного лишь информацией об эмоциях и личности говорящего.
Поэтому для передачи смысла достаточно передавать сведения о форме огибающей спектра речи, а также об изменении основного тона речи и переходов тон-шума. Эти сигналы идут от речевого центра мозга.
- Частично информация о звуках речи заключена в переходах от тонального спектра к шумовому и обратно (т. е. в переходах от звонких звуков к глухим и обратно), а информация о сигнале — еще и в интонации. По фонетической теории информация заключается только в скорости изменения спектральных уровней.
- Речевой сигнал можно уподобить водоему, в котором находится рыба. Водоем может иметь большой объем, а полезной информации (рыбы) в нем может быть немного.
ВТОРИЧНЫЙ СИГНАЛ.
Вторичный сигнал должен точно воспроизводить первичный, но это не всегда требуется, так как слух человека может и не заметить их несоответствие. К тому же на практике точное соответствие их часто невозможно или очень трудно осуществить. При художественном вещании, телевидении и звукозаписи надо стремиться к этому соответствию в пределах, при которых слуховое ощущение, создающееся у слушателя, было бы близко к тому ощущению, которое он получает, находясь в месте исполнения данной программы при условии достаточно хороших акустических условий в этом месте. Для информационных программ вещания и телефонной связи этого соответствия добиваются в первую очередь для получения полной понятности речи, а затем для достаточно высокого качества звучания. Только в этом случае необходимо стремиться к более точному соответствию вторичного сигнала первичному, В обоих случаях существенную роль играют экономические соображения.
Нарушение точности передачи, замечаемое слухом, бывает самого разнообразного вида. Рассмотрим основные из них: потерю акустической перспективы, смещение уровней, ограничение динамического и частотного Диапазона сигнала, помехи, искажения.
Потеря акустической перспективы. При передаче звукового сигнала по одноканальной системе получается ощущение слушания одним ухом, даже при наличии нескольких микрофонов в помещении, откуда ведется передача, и при разнесенных вторичных источниках звука. Источник звука для слуха будет всегда казаться находящимся в некотором среднем положении по отношению к фактическим вторичным источникам, поскольку временной сдвиг и разность уровней для обоих ушей слушателя не зависят от местонахождения первичного источника звука. Этот дефект может быть до некоторой степени исправлен с помощью стереофонической системы передачи, основанной на многоканальной системе передачи сигнала .
Смещение уровней. Поскольку по тракту передачи сигналов не передается информация об абсолютных уровнях звучания первичного сигнала, то слушатель (а при массовом слушании — оператор на приемном конце) по своему усмотрению устанавливает уровень вторичного сигнала. При этом не всегда можно восстановить нужный уровень первичного сигнала из-за недостаточной мощности аппаратуры на приемном конце, а также из-за условий слушания (например, в квартирах с плохой звукоизоляцией).
Смещение уровней приводит к изменению соотношения между громкостями низкочастотных и среднечастотных составляющих первичного и вторичного сигналов, так как смещение среднего уровня вторичного сигнала вверх по отношению к среднему уровню первичного приводит к субъективному повышению громкости низкочастотных составляющих, смещение вниз — к их ослаблению.
Ограничение динамического диапазона. Поскольку динамический диапазон канала ограничен снизу шумами, а сверху — перегрузкой и нелинейностью отдельных звеньев канала передачи, то во избежание искажений его сжимают в начале тракта (во всяком случае до звена, в котором скорее всего может ограничиться или исказиться сигнал). Этот дефект может быть частично исправлен путем расширения динамического диапазона сигнала на конце тракта, что не всегда возможно, так как на приемном конце может быть неизвестно, насколько был сжат этот диапазон. Кроме того, попытка расширить диапазон (применением экспандеров) усложняет аппаратуру.
Ограничение частотного диапазона. Поскольку тракт передачи акустических сигналов не пропускает весь их частотный диапазон, говорят об ограничении частотного диапазона.
Помехи. При передаче на сигнал накладываются различного рода помехи, в том числе шумы электрического и акустического происхождения. Последние имеются как в месте нахождения первичного источника, звука, так и в месте нахождения слушателя.
Искажения. По сути дела все перечисленные несоответствия первичного и вторичного сигналов являются искажениями в широком смысле этого понятия. Но обычно под этим термином понимают более узкий тип искажений. К ним относятся линейные, нелинейные, параметрические и переходные (временные) искажения.
ШУМЫ И ПОМЕХИ
Одна из наиболее серьезных причин, мешающих высококачественному воспроизведению передаваемой программы, - помехи, возникающие в тракте звукопередачи. Особенно неприятны на слух помехи в паузах, а также на тихих местах исполнения, когда они не маскируются полезным сигналом и потому существенно мешают восприятию звука.
Помехи по своему характеру и происхождению разделяются на фон, шум и различного характера внешние наводки. Влияние шумов и помех сводится к маскировке вторичного акустического сигнала независимо от их происхождения (акустического или электрического). Шумы сдвигают порог слышимости, который не зависит от времени, если шумы относятся к «гладким», т. е. имеют пик-фактор, не превышающий 6 дБ. К этим шумам относятся различные флуктуационные шумы, например шумы; дробового эффекта, речевые шумы от нескольких голосов, звучащих одновременно. Импульсные шумы создают порог слышимости, изменяющийся во времени в зависимости от пик-фактора шума и длительности импульсов. Из-за наличия постоянной времени у слуха ощущение кратковременных импульсов получается сглаженным: происходит выравнивание временной зависимости порога слышимости. Импульсные шумы не только маскируют полезный сигнал, но и искажают его, создавая комбинационные частоты шума и сигнала. Получается нечто похожее на взаимную модуляцию сигнала и шума.
Спектр шумов электрического происхождения, как; правило, близкий к равномерному, а акустического происхождения — ближе к речевому. Поэтому частотная зависимость порога слышимости для первых имеет тенденцию роста к высоким частотам, так как ширина критических полосок растет с увеличением частоты. Для речевых шумов порог слышимости почти не зависит от частоты.
Индустриальные, атмосферные и станционные помехи, кроме тональных, могут быть отнесены и к импульсным, и к гладким, с равномерным или низкочастотным спектром. Кроме этих помех, приходится иногда считаться с помехами от самомаскировки речи, т. е. с маскировкой слабых звуков, следующих за громкими.
Фон проявляется обычно в виде прослушиваемого низкого однотонного гудения с частотой 50 или 100 Гц. Причина фона может быть двоякой: чаще всего это плохая фильтрация переменной составляющей напряжения, выпрямленного в источнике питания и используемого для питания транзисторов или электронных ламп усилителей. Но могут проявиться и внешние наводки, т.е. возбуждения в самом усилителе или в присоединенных к нему проводах и линиях колебаний, появляющиеся за счет электромагнитной связи этих цепей с посторонними источниками электрических и магнитных полей (например, трансформаторов, силовых электрических кабелей, театральных софитов и т.п. Таким же путем, т.е. путем электромагнитных наводок на токоведущие цепи канала передачи звукового сигнала, могут проникнуть в канал и, так называемые, "внятные" помехи, например, посторонние программы близко расположенных мощных радиовещательных станций и т.п. Для борьбы с наводками любого характера следует тщательно защищать, применяя экранировку, те цепи, по которым протекают слабые токи ( например, микрофонные провода).
Принцип действия экранов следующий. Провод, по которому передаются токи звуковой частоты, заключаются в гибкую и достаточно густую металлическую сетку , обязательно заземленную. Электрические заряды, образующиеся на экране из-за влияния внешних полей, стекают на землю, не наводя помех на токоведущие части схемы.
Экранами снабжаются также все используемые в схемах трансформаторы и катушки индуктивности - потенциальные источники сильных помех. Эти экраны, выполненные в виде кожухов из железа, пермаллоя или других подобных магнитных материалов, выполняют двоякую роль: предохраняют трансформатор от воздействия внешних магнитных полей и, кроме того, не дают возможности полю рассеяния самого трансформатора оказывать нежелательное влияние на соседние детали схемы.
Еще более неприятен на слух и трудно устраним собственный шум транзисторов, электронных ламп и резисторов, входящих в схему. Это характерное шипение, с физической точки зрения - тот же звук с непрерывным спектром, его энергия распределена на широком участке диапазона звуковых частот. На практике часто встречаются шумы, отличающиеся один от другого не только по интенсивности, но и по тембру и ритму. Но самым характерным и типичным шумом является шум, не имеющий ни определенного тона, ни ритма, у которого, следовательно, ни одна частотная полоса не отличается от другой по энергии и ни один отрезок, выделенный во времени, не отличается от другого по частотному составу. Такой шум называют "белым" по аналогии с принятым в оптике наименованием белого цвета, который можно, как известно получить, смешивая в одинаковых пропорциях все цвета солнечного спектра.
Борьба с акустическими шумами ведется путем устранения (или ослабления) действия источников шума, а также путем повышения звукоизоляции помещений. Учет их действия на прием речевого сигнала делается при расчете и измерении разборчивости речи.
Дата добавления: 2016-02-16; просмотров: 3934;