Стандарты видеокомпрессии

Кодеры, работающие по стандартам MPEG, устраняют пространственную и временную избыточности телевизионного изображения, избыточность телевизионного сигнала и психофизическую избыточность. Методы сокращения пространственной и психофизической избыточностей совпадают с методами стандарта JPEG – это дискретно-косинусное преобразование, квантование на разное количество уровней и кодирование с переменной длинной слова. Временная избыточность сокращается использованием дифференциальной импульсно-кодовой модуляции и компенсации движения при предсказании.

Разработаны несколько стандартов компрессии MPEG. Наиболее известные из них: MPEG-1, MPEG-2, MPEG-4.

MPEG-1 – кодирование изображения и звука при скоростях данных до 1,5Мбит/с. Такой скорости потока не достичь без уменьшения четкости телевизионного изображения. Поэтому четкость изображения в стандарте MPEG-1 в два раза меньше и по вертикали и по горизонтали, чем в вещательном телевидении 288 строк, 352 строки.

MPEG-2 – обобщенное кодирование изображения и звука с вещательным качеством и качеством телевидения высокой четкости (ТВЧ). Для ТВЧ разрабатывался отдельный стандарт MPEG-3, но на каком-то этапе развития он был объединен со стандартом MPEG-2 и как самостоятельный не существует.

MPEG-4 – кодирование аудиовизуальных объектов. Разрабатывался для организации телеконференций по низкоскоростным линиям связи. По методу компрессии, MPEG-4 стоит на ступень выше первых двух стандартов, т.к. работает не с блоками изображений, а с объектами, т.е. с участками изображений одинаковой яркости и цветности. Ясно, что здесь форма блоков изображений будет произвольной и выбираться самим кодером исходя из условий оптимального кодирования. При этом на приемный конец необходимо передавать информацию о форме блока изображения (при внутрикадровом кодировании) и о изменении этой формы (при межкадровом кодировании). Но количество информации, необходимое для описания яркости (цветности) блока, будет минимальным.

MPEG-2

Наиболее известный из проектов группы MPEG – стандарт MPEG-2. Он определяет кодирование, охватывающее требования широкого круга приложений сферы производства и распределения телевизионных программ и насчитывает уже более 10 спецификаций. Из них можно выделить три:

1. Systems;

2. Video;

3. Audio.

Системная спецификация описывает правила объединения данных видео и звука и объединения данных нескольких программ в единый поток.

Спецификация Видео описывает кодовое представление и процесс декодирования компрессированных изображений (основные методы кодирования описаны в главе Видеокомпрессия).

Спецификация Аудио определяет кодовое представление сигналов звукового сопровождения.

Спецификация Video

Как показывает практика, передача и прием сигнала даже в рамках одной системы, ведется на разных уровнях качества. Жесткие и узкие допусковые интервалы лишают вещательную систему жизнеспособности. MPEG-2 – это целое семейство совместимых и взаимосогласованных цифровых стандартов, предназначенных для передачи и приема цифрового сигнала в различных условиях.

Градации качества изображения для цифровых вещательных систем устанавливаются с помощью четырех уровней и шести профилей. Профили задают алгоритмы и средства компрессии, а уровни параметры компрессируемого изображения (таблица 13.1).

Низкий уровень (Low) – телевидение ограниченной четкости: в кадре 288 активных строк, и по 352 отсчета сигнала яркости в каждой строке. Основной уровень (Main) – телевидение обычной четкости: 576 активных строк и по 720 отсчетов в строке. Высокий-1920 (High) и высокий-1440(High-1440) – телевидение высокой четкости: 1152 активных строк и по 1440 отсчетов в строке (формат изображения 4/3) или 1920 отсчетов в строке (формат изображения 16/9). Высокие уровни определяют прогрессивное разложение изображения.

Шесть профилей задают шесть наборов функциональных операций по обработке видеоданных. Профиль, в котором используется наименьшее число возможных операций по обработке данных называется простым (Simple): используются ДКП и ДИКМ с компенсацией движения (только I и Р изображения). Следующий профиль – основной (Main), добавилась еще одна операция – предсказание по направлению (двунаправленное предсказание), используются кадры I, P и В.

Следующие два профиля – масштабируемые. Масштабируемость показывает возможность обмена одних показателей системы на другие, т.е. возможность сохранять работоспособность системы при неблагоприятных условиях.

Таблица 13.1 Профили и уровни стандарта MPEG-2

	Профиль	Simple	Main	SNR	Spatial	High
Уровень	Изображения	I и P	I, P и B	I, P и B	I, P и B	I, P и B	I, P и B
Формат	4:2:0	4:2:0	4:2:0	4:2:0	4:2:0 4:2:2	4:2:2
High	Отсчётов в строке
Строк в кадре
Кадров в секунду
Макс. скорость потока, Мбит/с
High-1440	Отсчётов в строке
Строк в кадре
Кадров в секунду
Макс. скорость потока, Мбит/с
Main	Отсчётов в строке
Строк в кадре
Кадров в секунду
Макс. скорость потока, Мбит/с
Low	Отсчётов в строке
Строк в кадре
Кадров в секунду
Макс. скорость потока, Мбит/с

SNR – профиль с масштабируемым коэффициентом сигнал-шум. Цифровой поток в этом случае состоит из двух слоев: нижнего (базового) и верхнего. При неблагоприятных условиях приема (комнатная антенна или приемник находится на подвижном объекте), принимается базовый слой, который мощно защищен от помех. Он несет основную информацию. Верхний слой в этом случае просто отключится, он несет информацию об ошибках квантования в базовом слое и менее защищен от помех. Это приведет к увеличению уровня шума, но система останется работоспособной. При благоприятных условиях приема верхний слой дополнит базовый и уровень шума будет низким.

Следующий профиль – специально масштабируемый (Spatial). Кроме используемых операций в предыдущем профиле, добавлена еще одна - разделение потока видеоданных по четкости. Весь поток состоит из трех слоев. Первый несет информацию о телевидении обычной четкости, второй дополняет ее до ТВЧ, а третий доводит уровень шумов на приемном конце до необходимого уровня. Здесь, как и в предыдущем профиле, слои по разному кодируются от ошибок. И, в зависимости от условий приема будут использованы один, два, или все три слоя.

Четыре первых профиля работают с сигналами, представленными в формате 4:2:0. Пятый профиль (High) работает с сигналами в формате 4:2:2.

Профиль 422 – студийный, обеспечивает полное разрешение, монтаж с точностью до кадра и возможность многократной перезаписи сигнала.

Четыре профиля и шесть уровней дают 24 возможных комбинации, в таблице 6 указаны те из них, которые уже нашли применение в современной технике. Для них показаны максимальные скорости данных, при которых изображение на приемном конце будет свободно от каких-либо дефектов.

В настоящее время большинство кодеров, выпускаемых промышленностью, работают в основном профиле и основном уровне (MP@ML).

<41 42 434445 46 47 >

Дата добавления: 2015-12-26; просмотров: 1886;