Стандарты видеокомпрессии
Кодеры, работающие по стандартам MPEG, устраняют пространственную и временную избыточности телевизионного изображения, избыточность телевизионного сигнала и психофизическую избыточность. Методы сокращения пространственной и психофизической избыточностей совпадают с методами стандарта JPEG – это дискретно-косинусное преобразование, квантование на разное количество уровней и кодирование с переменной длинной слова. Временная избыточность сокращается использованием дифференциальной импульсно-кодовой модуляции и компенсации движения при предсказании.
Разработаны несколько стандартов компрессии MPEG. Наиболее известные из них: MPEG-1, MPEG-2, MPEG-4.
MPEG-1 – кодирование изображения и звука при скоростях данных до 1,5Мбит/с. Такой скорости потока не достичь без уменьшения четкости телевизионного изображения. Поэтому четкость изображения в стандарте MPEG-1 в два раза меньше и по вертикали и по горизонтали, чем в вещательном телевидении 288 строк, 352 строки.
MPEG-2 – обобщенное кодирование изображения и звука с вещательным качеством и качеством телевидения высокой четкости (ТВЧ). Для ТВЧ разрабатывался отдельный стандарт MPEG-3, но на каком-то этапе развития он был объединен со стандартом MPEG-2 и как самостоятельный не существует.
MPEG-4 – кодирование аудиовизуальных объектов. Разрабатывался для организации телеконференций по низкоскоростным линиям связи. По методу компрессии, MPEG-4 стоит на ступень выше первых двух стандартов, т.к. работает не с блоками изображений, а с объектами, т.е. с участками изображений одинаковой яркости и цветности. Ясно, что здесь форма блоков изображений будет произвольной и выбираться самим кодером исходя из условий оптимального кодирования. При этом на приемный конец необходимо передавать информацию о форме блока изображения (при внутрикадровом кодировании) и о изменении этой формы (при межкадровом кодировании). Но количество информации, необходимое для описания яркости (цветности) блока, будет минимальным.
MPEG-2
Наиболее известный из проектов группы MPEG – стандарт MPEG-2. Он определяет кодирование, охватывающее требования широкого круга приложений сферы производства и распределения телевизионных программ и насчитывает уже более 10 спецификаций. Из них можно выделить три:
1. Systems;
2. Video;
3. Audio.
Системная спецификация описывает правила объединения данных видео и звука и объединения данных нескольких программ в единый поток.
Спецификация Видео описывает кодовое представление и процесс декодирования компрессированных изображений (основные методы кодирования описаны в главе Видеокомпрессия).
Спецификация Аудио определяет кодовое представление сигналов звукового сопровождения.
Спецификация Video
Как показывает практика, передача и прием сигнала даже в рамках одной системы, ведется на разных уровнях качества. Жесткие и узкие допусковые интервалы лишают вещательную систему жизнеспособности. MPEG-2 – это целое семейство совместимых и взаимосогласованных цифровых стандартов, предназначенных для передачи и приема цифрового сигнала в различных условиях.
Градации качества изображения для цифровых вещательных систем устанавливаются с помощью четырех уровней и шести профилей. Профили задают алгоритмы и средства компрессии, а уровни параметры компрессируемого изображения (таблица 13.1).
Низкий уровень (Low) – телевидение ограниченной четкости: в кадре 288 активных строк, и по 352 отсчета сигнала яркости в каждой строке. Основной уровень (Main) – телевидение обычной четкости: 576 активных строк и по 720 отсчетов в строке. Высокий-1920 (High) и высокий-1440(High-1440) – телевидение высокой четкости: 1152 активных строк и по 1440 отсчетов в строке (формат изображения 4/3) или 1920 отсчетов в строке (формат изображения 16/9). Высокие уровни определяют прогрессивное разложение изображения.
Шесть профилей задают шесть наборов функциональных операций по обработке видеоданных. Профиль, в котором используется наименьшее число возможных операций по обработке данных называется простым (Simple): используются ДКП и ДИКМ с компенсацией движения (только I и Р изображения). Следующий профиль – основной (Main), добавилась еще одна операция – предсказание по направлению (двунаправленное предсказание), используются кадры I, P и В.
Следующие два профиля – масштабируемые. Масштабируемость показывает возможность обмена одних показателей системы на другие, т.е. возможность сохранять работоспособность системы при неблагоприятных условиях.
Таблица 13.1 Профили и уровни стандарта MPEG-2
Профиль | Simple | Main | SNR | Spatial | High | ||
Уровень | Изображения | I и P | I, P и B | I, P и B | I, P и B | I, P и B | I, P и B |
Формат | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 | 4:2:0 4:2:2 | 4:2:2 | |
High | Отсчётов в строке | ||||||
Строк в кадре | |||||||
Кадров в секунду | |||||||
Макс. скорость потока, Мбит/с | |||||||
High-1440 | Отсчётов в строке | ||||||
Строк в кадре | |||||||
Кадров в секунду | |||||||
Макс. скорость потока, Мбит/с | |||||||
Main | Отсчётов в строке | ||||||
Строк в кадре | |||||||
Кадров в секунду | |||||||
Макс. скорость потока, Мбит/с | |||||||
Low | Отсчётов в строке | ||||||
Строк в кадре | |||||||
Кадров в секунду | |||||||
Макс. скорость потока, Мбит/с |
SNR – профиль с масштабируемым коэффициентом сигнал-шум. Цифровой поток в этом случае состоит из двух слоев: нижнего (базового) и верхнего. При неблагоприятных условиях приема (комнатная антенна или приемник находится на подвижном объекте), принимается базовый слой, который мощно защищен от помех. Он несет основную информацию. Верхний слой в этом случае просто отключится, он несет информацию об ошибках квантования в базовом слое и менее защищен от помех. Это приведет к увеличению уровня шума, но система останется работоспособной. При благоприятных условиях приема верхний слой дополнит базовый и уровень шума будет низким.
Следующий профиль – специально масштабируемый (Spatial). Кроме используемых операций в предыдущем профиле, добавлена еще одна - разделение потока видеоданных по четкости. Весь поток состоит из трех слоев. Первый несет информацию о телевидении обычной четкости, второй дополняет ее до ТВЧ, а третий доводит уровень шумов на приемном конце до необходимого уровня. Здесь, как и в предыдущем профиле, слои по разному кодируются от ошибок. И, в зависимости от условий приема будут использованы один, два, или все три слоя.
Четыре первых профиля работают с сигналами, представленными в формате 4:2:0. Пятый профиль (High) работает с сигналами в формате 4:2:2.
Профиль 422 – студийный, обеспечивает полное разрешение, монтаж с точностью до кадра и возможность многократной перезаписи сигнала.
Четыре профиля и шесть уровней дают 24 возможных комбинации, в таблице 6 указаны те из них, которые уже нашли применение в современной технике. Для них показаны максимальные скорости данных, при которых изображение на приемном конце будет свободно от каких-либо дефектов.
В настоящее время большинство кодеров, выпускаемых промышленностью, работают в основном профиле и основном уровне (MP@ML).
Дата добавления: 2015-12-26; просмотров: 1825;