Введение. Термин сжатие данных означает уменьшение объема данных, используемого для представления определенного количества информации
Термин сжатие данных означает уменьшение объема данных, используемого для представления определенного количества информации. При этом между понятиями данные и информация существуют четкие различия. Данные являются тем средством, с помощью которых информация передается, и для представления одного и того же количества информации может быть использовано различное количество данных. Это имеет место в том случае, например, когда два разных человека, один – многословный, другой – лаконичный, рассказывают одну и ту же историю. В этом случае информацией являются факты, о которых идет речь, слова – данными, использующимися для изложения информации. В случае первого рассказчика говорят об избыточности данных.
Избыточность данных – центральное понятие цифрового сжатия данных. Это измеримая математическая категория. Пусть и означают числа элементов – носителей информации – в двух наборах данных, представляющих одну и ту же информацию. Тогда относительная избыточность данных первого набора ( ) по отношению ко второму набору ( ) определяется как:
,
где , обычно называемая коэффициентом сжатия, есть
.
В задаче цифрового сжатия изображений различаются и могут быть использованы три основных вида избыточности данных:
- Кодовая избыточность,
- Межэлементная,
- Визуальная.
Сжатие данных достигается в том случае, когда сокращается или устраняется избыточность одного или нескольких из вышеуказанных видов.
Кодовая избыточность. Значительная доля информации о виде изображения может быть получена на основе анализа его гистограммы значений яркости. Гистограмму изображения можно использовать для построения кодов, уменьшающих требуемое количество данных для представления изображения (в случае обычного (или прямого) двоичного кода каждому информационному элементу или событию (например, значению яркости) присваивается одно из значений -битовой двоичной последовательности). Однако, для представления многих значений можно использовать меньшее количество битов (например, чтобы представить 1 не надо иметь 8 битов).
Межэлементная избыточность.Межэлементная избыточность связана с межэлементными связями внутри изображения. Поскольку значение любого элемента ЦИ может быть достаточно точно предсказано по значениям его соседей, то информация, содержащаяся в отдельном элементе, оказывается относительно малой. Бóльшая часть вклада отдельного элемента в изображение является избыточной, она может быть «угадана» на основе значений соседних элементов. Для отражения подобной межэлементной связи введены различные термины, такие как пространственная избыточность, геометрическая избыточность, внутрикадровая избыточность. Объединением их всех является термин межэлементная избыточность.
Для уменьшения межэлементной избыточности в изображении двумерный массив пикселей должен быть преобразован в некоторый более рациональный (но обычно «не визуальный») формат. Например, для представления изображения может быть использована разность между соседними элементами.
Визуальная избыточность. Воспринимаемая глазом яркость зависит не только от количества света, исходящего из рассматриваемой области, но и от других факторов. При обычном визуальном восприятии часть информации оказывается менее важной, чем другая. Такую информацию называют визуально избыточной. Она может быть удалена без заметного ухудшения визуального качества изображения.
Важнейшей операцией при оцифровке зрительной информации является квантование изображения. Квантование означает отображение широкого (и, вообще говоря, непрерывного) диапазона входных значений в ограниченный набор выходных значений. Поскольку такая операция необратима (происходит потеря визуальной информации), то квантование является сжатием с потерями.
Дата добавления: 2015-09-18; просмотров: 1425;