Дискретизация речевых, аудио и видеосигналов.
Рассмотрим вытекающие из теоремы отсчетов требования к дискретизации речевых, аудио- и видеосигналов.
Ухо человека слышит в диапазоне частот 16…20000 Гц. Некоторые животные, например, собаки, могут слышать более высокие частоты. При этом интенсивность акустической волны воспринимается ухом логарифмически, т.е. ощущение в два раза громче означает двукратное увеличение логарифма отношения амплитуд звукового сигнала, а не просто отношения амплитуд. Поэтому сила звука измеряется в логарифмах отношения амплитуд, чаще всего в децибелах (1 дБ равен 0,1 Бел)
.
Нижний предел слышимости звукового давления (порог слышимости) для человека составляет 3*10-5 Па (около 0,0003 дин/см2). Если этот уровень принять за 0 дБ (т.е. отношение ), то громкость обычного разговора составляет 50 дБ, болевой предел для слуха составляет около 120 дБ, что соответствует отношению амплитуд . Т.е., диапазон воспринимаемых ухом человека отношений звукового давления составляет 106!
Примером оцифрованного звука является сигналы цифровой телефонной связи. Телефонный сигнал имеет частотный диапазон 300…3400 Гц. Составляющие сигнала с частотами выше 3400 Гц подавляются перед АЦП с помощью предфильтра.
Поэтому для телефонной связи достаточна частота отсчетов 8 кГц. Обычно используются 8-битовые АЦП. Скорость передачи данных равна 8*8000=64 Кбит/с.
При записи аудиокомпакт – дисков звуковой сигнал оцифровывается с частотой дискретизации 44,1 кГц. Поэтому в соответствии с теоремой отсчетов такие сигналы имеют частоту Найквиста 22,05 кГц, и верхняя граничная частота звукового сигнала составляет 22 кГц. Используются 16-битовые АЦП (CD-стандарт), поэтому пропускная способность составляет 16*44100=705,6 кбит/с для монофонического сигнала и 1,411 Мбит/с для стереофонического. Это в 22 раза выше скорости передачи телефонных сообщений. Емкость стандартного CD- диска составляет :
2*44100*16*60*70 /8 /1024^2= 706.5582≈700 Мбайт. Пояснение: 2-х канальный стереозвук, частота дискретизации 44,1КГц, 16 бит/канал, 70 мин. звучания.
В цифровом радиовещании частота дискретизации составляет 22050 Гц. В стандарте цифровой аудиозаписи DAT используется частота дискретизации 48 000 Гц, в стандарте DVD-Audio (MLP 5.1) - 96 000 Гц, в стандарте DVD-Audio (MLP 2.0) —192 000 Гц.
Для уменьшения потока информации в бит/с при записи звука применяют алгоритм сжатия с потерями МР3. При сжатии с потерями часть звуковой информации (потока) теряется и не может быть восстановлена. Принцип сжатия заключается в разделении звукового файла с помощью полосовых фильтров на отдельные частотные диапазоны, далее определяется мощности отдельных частотных составляющих сигнала и часть сигнала с мощностью ниже порога слышимости отбрасывается. Оставшаяся часть подвергается квантованию по уровню и кодируется кодом Хаффмана.
Стандарт МР3 позволяет сжимать оцифрованный звуковой сигнал примерно в 5 – 20 раз. Степень сжатия при записи звука по стандарту МР3 можно варьировать, выбирая значения так называемого «битрейта» из интервала 8 - 320 кбит/с. Битрейт означает количество передаваемой за единицу времени информации. Чем выше значение битрейта, тем выше качество звука, но тем меньше сжатие данных.
О частоте дискретизации (оцифровки) видеосигналов. Сетчатка глаза человека обладает инерционностью, поэтому изображение, появившееся на сетчатке, остается на ней на 2-3 миллисекунды до исчезновения. Если последовательность одинаковых или близких по содержанию изображений появляется и исчезает с достаточно высокой частотой, то глаз человека не замечает мелькания изображения. Частота, при которой глаз человека перестает замечать мигание яркости, т.е. смену изображений, составляет около 50 Гц.
Все видеосистемы (кино и телевидение) используют инерционность зрения для создания двигающихся изображений, т.е. формирования изменяющихся (двигающихся) изображений из дискретных кадров. В разных странах используются различные стандарты разбиения двумерного изображения на элементы. В Северной и Южной Америке и Японии принят стандарт NTSC. В телевидении стандартной четкости экран разбивается на 525 горизонтальных линий развертки, частота кадров – 30 кадров в сек. Современные стандарты телевидения высокой четкости(ТВЧ) предусматривают количество строк 720 и 1080с частотой кадров 50 или 60 кадров/с, что обеспечивает высокое качество изображения.
В Европе и в России в телевидении стандартной четкости принята система PAL/SECAM c 625 строками и 25 кадрами в секунду. Многие люди при частоте 25 кадров в секунду замечают мигание изображений, поэтому для улучшения качества изображений используется чересстрочная развертка, при которой в одном кадре линии развертки на экране телевизора показываются через одну: сначала все нечетные, а потом все четные. За счет чересстрочной развертки получается скорость кадров 50 кадров/сек., при которой мерцание кадров становится незаметным.
Оценим полосу частот для передачи черно-белого телевизионного сигнала для стандарта PAL/SECAM. Общее число градаций яркости видеосигнала за секунду составляет в этом случае N = 625 *650*25=10156250 бит/с, при этом 650 – это число элементов изображения (пикселов) в строке. По теореме должно удовлетворяться условие , и верхняя граничная частота видеосигнала ≈ 5,1 МГц.
Различные стандарты телевизионного вещания обычной (стандартной) четкости используют несколько разные полосы частот сигнала в диапазоне от 5 до 6 МГц. Такая полоса примерно в 150 раз выше, чем при оцифровке звука.
В цифровом цветном телевидении кадр экрана состоит из прямоугольной сетки элементов – пикселов. Каждый из трех RGB- цветов кодируется 8-ю битами, что в сумме дает 24 бита напиксел. Это обеспечивает 224 ≈ 16 млн. цветовых градаций, которых более чем достаточно для человеческого глаза с его возможностями различать цвета.
Оценим пропускную способность в бит/с, необходимую для передачи цветного цифрового видеосигнала. При разрешении 1024*768 пикселов (XGA стандарт), 24 – битах напиксел и 25 кадрах в секунду необходима скорость передачи данных 1024*768*24*25 = 471859200 Гц ≈ 472 Мбит/с. За одну минуту при этом будет передано ≈ 3,5 Гбайт., за 1 час -210 Гбайт. Для стандартов цифрового телевидения высокой четкости (HDTV) необходимая скорость передачи ещё в несколько раз выше.
Без использования специальных алгоритмов сжатия передавать такой поток информации становится технически сложно и дорого. Поэтому разработано и используется ряд алгоритмов сжатия видеоинформации, например, алгоритм сжатия MPEG -4. Алгоритмы сжатия построены на использовании пространственной и временной избыточности видеосигналов. Для таких систем требуется два устройства: одно для сжатия (компрессии) данных на стороне источника информации (кодирование, кодек), другой – для декомпрессии у получателя (декодирование, декодер). Операции кодирования/декодирования производятся в реальном времени.
Сжатие видео на порядки снижает требования к ширине полосы канала передачи, при этом качество изображения остаётся приемлемым.
Заключение
При дискретизации сигналов, и, следовательно, в цифровой обработке аналоговых сигналов важнейшую роль играет теорема отсчетов. Теорема утверждает, что частотно – ограниченный сигнал x(t) со спектром для однозначно определяется своими отсчетами x(nT), если угловая частота отсчетов .
Частотно – ограниченный сигнал может быть дискретизирован без потери информации.
Если частота отсчетов , то происходит наложение спектров дискретного сигнала и искажение сигнала при его восстановлении по отсчетам. Для гармонических сигналов при этом возникает подмена (наложение, алиасинг, aliasing) частот гармоник.
Для устранения наложения спектров реальные аналоговые сигналы перед аналого-цифровым преобразованием подвергаются низкочастотной фильтрации, чтобы удалить (уменьшить до допустимого уровня)) частотные компоненты сигнала с частотами выше .
Дата добавления: 2015-12-26; просмотров: 2176;