Г. Стабилизация скорости цифрового потока в канале связи
Общий цифровой поток после мультиплексора Мп поступает на вход буферного запоминающего устройства БЗУ (рис.5.49), работающего по принципу: “первым вошел – первым вышел”.
Необходимость введения в систему БЗУ объясняется следующими обстоятельствами. В зависимости от детальности движения и характера передаваемого движения в существенной степени может меняться скорость цифрового потока на выходе блока кодирования с переменной длиной. При возрастании в изображении уровня ВЧ компонентов, при быстроменяющихся сюжетах скорость потока данных на выходе компрессора возрастает. Это возрастание может приводить к превышению возможностей канала передачи по его пропускной способности. Ограничение скорости кодированного цифрового потока осуществляется реализацией обратной связи, в которую включена буферная память и квантователь.
Для оптимизации работы системы желательно поддерживать уровень заполнения БЗУ приблизительно постоянным. Если БЗУ переполняется, то будет происходить потеря данных, то есть ухудшение качества изображения. Если БЗУ освобождается, то по каналу связи передаются “пустые” блоки, что приводит к снижению эффективности использования канала связи. Обратная
связь степеньзаполнения БЗУ поддерживает постоянной.
Сущность действия обратной связи (ОС) заключается в следующем. Если передается мелкоструктурное изображение и заполнение БЗУ увеличивается (память переполняется), то под воздействием ОС увеличивается параметр квантования ρ коэффициентов ДКП (формула 5.8). При этом число бит на каждый коэффициент уменьшается, и уровень потока данных поддерживается примерно постоянным. Наоборот, при передаче “гладких” изображений квантование становится более точным (параметр ρ в формуле 5.8 уменьшается, а коэффициенты квантования - табл.5.3 - увеличиваются). Такой метод соответствует свойствам человеческого зрения: на мелкоструктурных изображениях менее заметны неточности в пределах уровней яркости. Конечно, изменение масштаба квантования в зависимости от содержания изображения отражается на качестве воспроизводимого изображения, изменяется уровень шумов квантования. Включенное в цепь обратной связи устройство управления коэффициентом сжатия УКС повышает ее быстродействие. В результате, благодаря действию обратной связи, степень заполнения буферной памяти (БЗУ) в среднем поддерживается постоянной.
5.19.2. Уровни и профили стандарта MPEG-2 [10]
Стандарт MPEG-2 определяет кодирование, охватывающее требования широкого круга сферы производства и распределения телевизионных программ. Для наиболее эффективного применения и обеспечения высокой степени эксплуатационной совместимости устройств, работающих в стандарте MPEG-2, в нем выделено несколько подмножеств, называемых профилями. В каждом профиле выделено несколько уровней, определяемых совокупностью ограничений, наложенных на параметры цифрового потока. Профиль – подмножество стандарта для специализированного применения, задающее алгоритмы и средства компрессии.
MPEG-2 охватывает весьма широкий диапазон сложности кодирования и качества изображения – от простых I-кадров до сложных ГВК, от низкого разрешения до ТВЧ. В процессе разработки стало ясно, что построить декодер, удовлетворяющий одновременно всем требованиям стандарта, возможно, но неэкономично, так как он окажется весьма сложным и дорогим, и в то же время будет обладать большой избыточностью по отношению к более простым приложениям. Разработчики стандарта разделили все средства и инструменты обработки видеосигналов на несколько Профилей (Profile), поддерживающих обратную совместимость и различающихся использованием тех или иных элементов синтаксиса. Как правило, каждый Профиль добавляет один или несколько инструментов к имеющимся у нижележащего профиля.
На сегодняшний день в стандарте приняты пять основных и один дополнительный, профессиональный Профиль “4:2:2”, введенный позднее [табл. 5.5]. Внутри каждого Профиля выделены Уровни (Level), определяющие допустимые пределы изменения основных параметров цифрового потока. Таких Уровней четыре, и в таблице 5.6 приведены установленные для них пределы скорости потока и разрешающей способности.
Таблица 5.5. Основные параметры кодирования для интерфейса формата 4:2:2
Параметры | Система 525 строк 60 полей | Система 625 строк 50 полей |
Кодируемые сигналы Y,CR,CB | Данные сигналы получаются из основных сигналов RGB, подвергнутых предварительной коррекции | |
Числа отсчетов на полную длину строки для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) | ||
Структура дискретизации | Ортогональная сетка из яркостных и цветоразностных отсчетов; цветоразностные отсчеты CR и CB в каждой строке совпадают с нечетными отсчетами (1,3 и т.д.) сигнала яркости Y | |
Частоты дискретизации*, МГц, для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) | 13,5 6,75 | 13,5 6,75 |
Форма кодирования | Импульсно-кодовая модуляция с однородным квантованием (8 бит на отсчет), для сигналов яркости и каждого из цветоразностных сигналов | |
Числа отсчетов на активную цифровую строку для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) | ||
Соотношение временной синхронизации по горизонтали между цифровыми и аналоговым сигналом: от конца активной цифровой строки до 0н | 16 яркостных тактовых интервалов (NTSC) | 12 яркостных тактовых интервалов (PAL, SECAM) |
Соотношение между уровнями видеосигнала и квантования для сигналов: -яркости (Y) -каждого из цветоразностных (CR,CB) | 0…225 | |
220 уровней квантования; уровню черного соответствует 16-й уровень; пиковому уровню белого – 235-й уровень. Допускаются отдельные выбросы за уровень 235 | ||
225 уровней квантования в центральной части шкалы квантования; нуль сигнала соответствует 128 уровню | ||
Использование кодовых слов, соответствующих уровням квантования | 0 и 225 используются исключительно для синхронизации. С 1 по 254 доступны для видеосигналов |
*Допуски на частоту дискретизации должны соответствовать допускам на частоту строк соответствующего стандарта системы цветного телевидения.
Табл.5.6. Пределы изменения параметров цифрового потока для различных уровней Основного профиля MPEG-2
Уровень | Параметр | Ограничение |
Высокий MP@HL | Число отсчетов на строку | |
Число строк на кадр | ||
Частота кадров, Гц | ||
Частота отсчетов сигнала яркости, отсч/с | ||
Скорость потока, Мбит/с | ||
Размер буфера, бит | ||
Высокий MP@H1440 | Число отсчетов на строку | |
Число строк на кадр | ||
Частота кадров, Гц | ||
Частота отсчетов сигнала яркости, отсч/с | ||
Скорость потока, Мбит/с | ||
Размер буфера, бит | ||
Основой MP@ML | Число отсчетов на строку | |
Число строк на кадр | ||
Частота кадров, Гц | ||
Частота отсчетов сигнала яркости, отсч/с | ||
Скорость потока, Мбит/с | ||
Размер буфера, бит | ||
Низкий MP@LL | Число отсчетов на строку | |
Число строк на кадр | ||
Частота кадров, Гц | ||
Частота отсчетов сигнала яркости, отсч/с | ||
Скорость потока, Мбит/с | ||
Размер буфера, бит |
Уровень “Высокий-1440” был введен для планировавшейся европейской системы с разложением 1440×1152 пикс. и форматом кадра 4:3. Отметим, что в принятой Рекомендации ВТ.709 по ТВЧ форматам такой формат не предусмотрен. Не все Профили определены при всех Уровнях, допустимые сочетания указаны в таблице 5.7.
Табл.5.7. Уровни и профили стандарта MPEG-2
Уровни | Профили | Простой (Simple) | Основной (Main) | Масштабируемый по отношению сигнал-шум (SNR) | Пространственно-масштабируемый (Spatial) | Высокий (High) | Профессиональный 4:2:2 (Professional 4:2:2) |
Типы кадров | I, P | I, P, B | I, P, B | I, P, B | I, P, B | I, P, B | |
Дискретизация сигнала цветности | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 или 4:2:2 | 4:2:0 или 4:2:2 | |
Высокий (High) | Число отсчетов на строку | ||||||
Число строк на кадр | |||||||
Частота кадров, Гц | |||||||
Скорость потока, Мбит/с | |||||||
Высокий- (High-1440) | Число отсчетов на строку | ||||||
Число строк на кадр | |||||||
Частота кадров, Гц | |||||||
Скорость потока, Мбит/с | |||||||
Основной (Main) | Число отсчетов на строку | ||||||
Число строк на кадр | |||||||
Частота кадров, Гц | |||||||
Скорость потока, Мбит/с | |||||||
Низкий (low) | Число отсчетов на строку | ||||||
Число строк на кадр | |||||||
Частота кадров, Гц | |||||||
Скорость потока, Мбит/с |
Примечание: режим 4:2:2 P@ предлагаемым стандартом HL введен SMPTE-308M.
Затенением в таблице выделен режим “4:2:2P@HL”, отсутствующий в стандарте MPEG-2 и предложенный позднее проектом стандарта SMPTE-308M по инициативе вещательных компаний. Этот режим удобно использовать при производстве программ. Он допускает максимальную скорость потока 300 Мбит/с со следующими ограничениями: на скорости от 230 до 300 Мбит/с допускаются только I-кадры, на скорости от 175 до 230 Мбит/с – I-, IP-, IB-кадры, на меньших скоростях – ГВК любой конфигурации, не противоречащей стандарту MPEG-2. Декодеры, поддерживающие определенный Уровень определенного Профиля, должны работать также и при всех более низких Уровнях и Профилях. В англоязычной литературе принято обозначать сочетания Профиля и Уровня первыми буквами, разделенные знаком @. Например, сочетание “Основной профиль – Основной уровень” записывается как MP@ML (Main Profile@Main Level). Режим MP@ML стал наиболее распространенным и широко употребительным, он обеспечивает полную разрешающую способность 720×576 пикс., предусмотренную Рекомендаций ВТ.601, и это сочетание признано наиболее подходящим для цифрового вещания. Максимальная скорость потока видеоданных 15 Мбит/с заведомо достаточна для достижения качества изображения, превышающего возможности аналоговых стандартов PAL, SECAM и NTSC. Масштабирование в Основном профиле не применяется.
Простой профиль (SP – Simple Profile), не поддерживающий двунаправленное предсказание и B-кадры, предназначался первоначально для массовых применений при обработке компьютерных изображений и в других приложениях, не требующих высокого качества изображения, однако стоимость микросхем, разработанных для Основного профиля, оказалась так низка, что разработка специальных изделий для Простого профиля была признана целесообразной. Он применяется лишь в простейших программных MPEG-кодерах.
Масштабируемые профили пока широко не используются, хотя в некоторых приложениях для них просматриваются возможные области применения (например, в наземном цифровом вещании). Масштабируемостью называют способность кодека (кодера и декодера) формировать и обрабатывать упорядоченный набор из нескольких цифровых потоков. Минимально необходимый набор потоков называется базовым слоем, каждый из остальных – улучшающим слоем. Базовый слой передает сигнал пониженного качества с более высоким отношением сигнал-шум, или сигнал с пониженным пространственным разрешением, который может приниматься декодером низкого профиля, а в улучшающих слоях передается дополнительная информация, используя которую, кодеры более высокого профиля восстанавливают улучшенное изображение. Синтаксис MPEG-2 поддерживает до двух слоев масштабирования. Принцип работы масштабирующего кодека показан на рис.5.52. Из рисунка видно, что при передаче сигнала изображения используют два потока данных, образующих так называемый базовый и расширенный слои. Базовый слой несет информацию об “ухудшенной” версии изображения, расширенный – об информации, дополняющей “базовое” изображение до полного качества.
Рис.5.52.Принцип работы масштабирующего кодера: а) кодер; б) декодер
В ходе разработки было признано нецелесообразным объединять все виды масштабирования в один Профиль, и разработали две схемы – с масштабированием отношения сигнал-шум и с пространственным масштабированием.
В схеме, масштабирующей отношение сигнал-шум (SNR (Signal-to-Noise Ratio) Profile), в базовом слое передаются грубо квантованные коэффициенты ДКП. Они передаются с низкой скоростью, что несколько повышает шумы квантования, но улучшает помехоустойчивость. Улучшающий слой кодирует и передает разницу между неквантованными и грубо квантованными значениями коэффициентов, которую декодер SNR профиля использует для уточнения значений коэффициентов. Можно использовать этот подход и для изменения пространственного разложения, если в базовом слое передавать самые нижние M×N (M<8, N<8) коэффициентов ДКП, а в улучшающем слое – остальные (64 - M×N).
Профиль с пространственным масштабирование (Spatial Scalable Profile), был введен в стандарт для обеспечения доступа декодерам стандартной четкости к программам ТВЧ. Привязкой к ТВЧ объясняется довольно большая скорость цифрового потока, предусмотренная в этом Профиле. В базовом слое такой системы передается после прореживания информация, соответствующая стандартному разрешению, а в улучшающем слое – дополнительные отсчеты, отфильтрованные в базовом слое.
Профиль “Высокий”, предусматривающий все инструменты нижних профилей, в настоящее время пока не используется по нескольким причинам, в том числе, по-видимому, из-за отсутствия интегральных микросхем с достаточными ресурсами производительности.
Несколько особняком, вне иерархии, стоит профиль “Профессиональный 4:2:2”, предназначенный ля обеспечения совместимости с цифровым студийным оборудованием видеопроизводства. В этом формате работают, например, перевозимые комплекты цифровых систем сбора новостей, передающие сигнал через спутники для последующей записи и монтажа. Профиль “4:2:2” должен обеспечивать качество изображения, сравнимое с цифровой видеозаписью формата D1, и возможность многократного MPEG кодирования-декодирования сигнала. Его основными свойствами являются структура дискретизации “4:2:2” (в отличие от обычной в MPEG-2 “4:2:0”), увеличенное число строк – 608 в отличие от 576, и возможность работы с повышенными скоростями до 50 Мбит/с вместо 15 Мбит/с, обеспечиваемых Основным профилем. Последнее требование связано с более короткими группами видеокадров, используемыми при видеомонтаже. Предложенный недавно Высокий уровень этого профиля позволит расширить область использования MPEG-2 при подготовке ТВЧ программ.
Для профессиональных применений очень важна способность оборудования разных производителей работать совместно (по-английски это свойство называется interoperability, в русском языке наиболее близка “совместная работоспособность”). Хотя MPEG-2 должен обеспечивать полную совместимость во всех режимах работы, организация Pro-MPEG Forum, занимающаяся внедрением стандартов MPEG, предложила использовать в профессиональных системах для стыков аппаратуры ограниченное число режимов, в которых заведомо должны выполняться все требования к цифровому потоку. В качестве таких режимов выбраны:
1. 4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, любая разрешенная структура ГВК.
2. 4:2:2P@ML, ТСЧ, скорость до 50 Мбит/с, только I-кадры.
3а. 4:2:2P@HL, ТВЧ, скорость до 80 Мбит/с, любая разрешенная структура ГВК.
3б. 4:2:2P@HL, ТВЧ, скорость до 175 Мбит/с, любая разрешенная структура ГВК.
4. 4:2:2P@HL, ТВЧ, скорость до 300 Мбит/с, только I-кадры.
5.19.3. Отличия MPEG-1 и MPEG-2 [8]
Стандарт MPEG-2 является развитием и расширением стандарта MPEG-1. Поток видеоданных MPEG-2 содержит составляющие, которых нет в MPEG-1. По-видимому, наиболее важным отличием двух стандартов является наличие в MPEG-2 масштабируемости и всех связанных с ней особенностей.
В стандарте MPEG-1 нет принципиальных ограничений на размеры кодируемых изображений и на использование чересстрочной развертки по сравнению с MPEG-2. Тем не менее, MPEG-1 предназначен для сжатия движущихся изображений с прогрессивной разверткой, частотой кадров до 30 Гц, количеством строк до 576 и количеством элементов в строке до 720. При этом получается поток данных со скоростью передачи данных символов до 1856000 бит/с.
Далее, MPEG-1 допускает кодирование телевизионных сигналов с чересстрочной разверткой только в кадровом режиме, а в MPEG-2 имеется полевой режим, более эффективный при наличии существенных изменений изображения от первого поля кадра ко второму.
В этом режиме два поля кадра кодируются независимо. Например, I-кадр может кодироваться как два I-поля или как I-поле и P-поле. Эти возможности придают дополнительную гибкость кодированию, что позволяет достичь боле высокой эффективности сжатия.
На практике MPEG-1 обычно используется для сжатия движущихся изображений размером 360×240 элементов с прогрессивной разверткой (формат SIF). Такое сжатие позволяет записывать видеопрограммы с некоторой потерей четкости на компакт-диски и воспроизводить их на ПК, выполняя декодирование в реальном времени чисто программными средствами. В то же время MPEG-2 является основой быстро развивающихся и распространяющихся систем цифрового телевизионного вещания, а также применяется для записи кинофильмов и другой видеоинформации на диски стандарта DVD, обеспечивающие высокое качество изображения и звука.
Группа MPEG начинала работу над стандартом MPEG-3, определяющим методы сжатия для телевидения высокой четкости (ТВЧ). Однако в процессе работ над стандартом MPEG-2 в него были включены уровни, соответствующие ТВЧ, поэтому необходимость в стандарте MPEG-3 отпала.
5.20. Искажения изображения при сжатии по стандартам MPEG. Достижимые степени сжатия [8]
Далее приведен перечень характерных искажений изображений, возникающих в результате кодирования по стандартам MPEG-1 или MPEG-2 при достаточно больших степенях сжатия. Искажения при внутрикадровом кодировании легко можно посмотреть на персональном компьютере, например, с помощью популярной программы Adobe Photoshop.
Искажения, создаваемые внутрикадровым кодированием:
1. Заметность границ блоков (блокинг - эффект). Так как соседние блоки кодируются и декодируются независимо друг от друга, то при больших степенях сжатия после квантования и деквантования в них могут получаться заметно различающиеся коэффициенты ДКП, соответствующие постоянным и низкочастотным составляющим. В результате изображения в соседних блоках могут сильно отличаться друг от друга по яркости, цвету, характеру деталей и текстуры.
2. Размытие изображения (“замыливание”). Наблюдается при большом коэффициенте сжатия изображения. Обусловлено ограничением либо полным занулением коэффициентов ДКП, соответствующих высоким пространственным частотам, в результате чего мелкие детали изображения становятся размытыми или полностью пропадают.
3. Появление окантовок на резких переходах яркости изображения. Этот эффект обусловлен значительными искажениями либо полным подавлением высокочастотных составляющих пространственного спектра.
4. Размытие цветов. Имеет ту же причину, что и эффект окантовки на границах, но проявляется на участках изображения с резкими скачками в сигнале яркости.
5. Эффект ступенек. Возникает как результат неправильного восстановления или передачи краев изображений внутри блока. Эффект проявляется, как правило, при восстановлении изображения в увеличенном масштабе.
Искажения, создаваемые межкадровым кодированием.
1. Ложные границы. Наблюдаются при компенсации движения. Этот эффект является прямым следствием межкадрового кодирования видеосигнала.
2. Эффект “комаров”. Проявляется как флуктуация яркости или цветности в блоке на границе между движущимся объектом и фоном. Эффект возникает вследствие изменения параметров квантования разности действительного и предсказанного изображений от кадра к кадру.
3. Зернистый шум в стационарной области. Проявляется как медленно движущиеся мерцающие шумы низкой интенсивности в областях, в которых имеется лишь малое движение либо движение отсутствует полностью.
4. Появление неправильных цветов в макроблоке по отношению к его исходным цветам и к цветам окружающей области.
5. Появление следов за движущимися объектами, которые могут сохраняться сравнительно долго.
Какие же степени сжатия реально достижимы при использовании MPEG-2? В соответствии с Рекомендацией 601 при дискретизации 4:2:2 получается скорость передачи двоичных символов 216 Мбит/с. При переходе к формату 4:2:0, который используется для телевизионного вещания “Main Profile @ Main Level”, скорость передачи двоичных символов сокращается до величины 162 Мбит/с, относительно которой и будем определять степень сжатия.
В технических журналах отмечалось, что на практике для получения студийного качества принятого изображения можно сжимать видеоинформацию до скорости передачи 9 Мбит/с, т.е. в 18 раз. Для получения качества изображения, сравнимого с обычным изображением по системе PAL, - до 4…5Мбит/с, т.е. в 30…40 раз. Качество изображения, сопоставимое с получаемым при воспроизведении видеозаписей стандарта VHS, достигается при сжатии до уровня около 1,5 Мбит/с, т.е. более чем в 100 раз.
5.21. Вейвлет – преобразование
Вейвлет-преобразование используется в системах видеокомпрессии для сокращения избыточности телевизионного изображения. Главное отличие его от БПФ-анализа (быстрого преобразования Фурье) заключается в том, что вейвлет-волны разлагают сигнал по разным частотам с различным разрешением, то есть, на множество малых групп волн, отсюда и название – вейвлет, элементарные волны. Алгоритмы вейвлет-преобразования обрабатывают данные в различных масштабах и с различным разрешением.
Вейвлет-анализ позволяет разглядеть и отдельные детали, и глобальное изображение.
Вейвлет-анализ хорошо подходит для аппроксимации данных с резкими границами, в то время как ДКП мало пригодно для очень резких черно-белых переходов. Вейвлет-сжатие преобразует полное изображение, а не его секции (блоки) 8*8, как это происходит в JPEG и является более естественным. Основное преимущество вейвлет-сжатия над JPEG – это более высокие коэффициенты сжатия (уплотнения) до 300 раз при таком же качестве изображения.
До настоящего времени вейвлет-преобразование использовалось как лучший инструмент для сжатия данных в таких областях наук, как астрономия и сейсмические исследования, но для систем охранного телевидения оно представляет собой относительно новый и очень привлекательный алгоритм сжатия.
Вейвлет-преобразование сводится к совокупности процессов фильтрации и децимации (рис. 5.53) [48].
Преобразуемый сигнал подвергается фильтрации с помощью фильтров нижних и верхних частот, которые делят диапазон частот исходного сигнала на две половины. И НЧ- и ВЧ- компоненты сигнала, полученные при фильтрации, имеют в два раза более узкую полосу частотных составляющих. Далее цифровой сигнал после НЧ- и ВЧ- фильтрации с помощью цифровых фильтров подвергается прореживанию (децимации). Таким образом, частота дискретизации в каждом поддиапазоне уменьшается в два раза. Далее сигналы проходят кодирующие устройства (кодеры) К1,К2 и К3, на выходах которых получаются кодированные сигналы частотных поддиапазонов. Количество двоичных символов, используемых для передачи сигналов таких поддиапазонов, сокращается.
Затем сигналы объединяются в мультиплексоре в один кодированный цифровой сигнал, который передается по каналу связи КС. Скорость передачи двоичных символов выходного сигнала y(n) по каналу связи КС меньше, чем для передачи исходного цифрового сигнала с ИКМ. Вместо канала связи (КС) в системе может присутствовать носитель информации, на который осуществляется запись сигнала y(n).
После прохождения канала связи кодированный y(n) в демультиплексоре ДМП разделяется на кодированные сигналы частотных поддиапазонов y1(n), y2(n), y3(n)….
Каждый из этих сигналов декодируется в соответствующем блоке декодирования ДК1, ДК2, ДК3…. В процессе декодирования восстанавливается количество двоичных разрядов в данных (деквантование).
Так как при кодировании могли возникнуть необратимые потери информации, то декодированные сигналы поддиапазонов Z1(n), Z2(n), z1(n)…могут отличаться от исходных сигналов поддиапазонов x1(n), x2(n), x3(n)…Далее выполняется восстановление количества отсчетов в сигналах поддиапазонов ( интерполяция: ↑2,↑2,↑2 ), в результате которой между каждыми двумя отсчетами сигналов Z1(n), Z2(n), Z3(n)….выставляется нуль. Растянутая компонента подвергается фильтрации и на место нулевых отсчетов помещаются интерполированные величины. После проведенной интерполяции сигналы частотных поддиапазонов объединяются в сумматоре. В результате формируется выходной сигнал Z(n), имеющий такую же частоту дискретизации и занимающий такую же полосу частот, как исходный сигнал x(n).
Эффективным средством разделения исходных сигналов на частотные поддиапазоны и синтеза выходного сигнала и сигналов частотных поддиапазонов являются квадратурные зеркальные фильтры (КЗФ), работа которых описана в литературе [8,28,48].
Видеокомпрессия на базе Wavelet-преобразования в принципе осуществляется так же, как и компрессия на базе дискретного косинусного преобразования. компоненты видеосигнала, полученного после вейвлет-преобразования, так же подвергаются квантованию и энтропийному кодированию. Принципиальное отличие от компрессии на базе ДКП заключается в способе получения частотных компонент изображения. ДКП позволяет получать частотные компоненты, занимающие равные полосы при всех средних частотах. Вейвлет-преобразование дает компоненты, полосы частот которых уменьшаются в два раза по мере уменьшения средней частоты (например, 1/2, 1/4,1/8 от максимальной частоты сигнала и т. д.)
Вейвлет-преобразование не требует формирования блоков, поэтому артефакты видеокомпрессии на его основе более «естественны», то есть выглядят менее чужеродными на типичных изображениях, чем, например, блочная структура в виде просвечивающей через изображение шахматной доски. Однако надо отметить, что подобная картина наблюдается при очень большой степени компрессии, практически не используемой в телевизионном вещании. При небольших степенях сжатия преимущества компрессии на базе вейвлет-преобразования не столь заметны [48]. А самый весомый аргумент в пользу компрессии на базе ДКП - ее международная стандартизация в виде систем JPEG и MPEG. Нет сомнения, что вейвлет-преобразование и компрессия на его основе будут развиваться и найдут применение в прикладных системах телевидения, например, в охранных системах телевидения, так как оно обеспечивает более высокий коэффициент сжатия неподвижных изображений при сохранении их приемлемого качества, чем широко используемый стандарт JPEG. Кроме того, следует отметить, что компрессия на базе вейвлет-преобразования более сложна с точки зрения технической реализации, чем ДКП, в частности JPEG.
Дата добавления: 2015-03-20; просмотров: 1540;