Общие сведения. Назначение признака элементом алфавита признаков сопровождается присвоением ему коэффициента значимости

 

Назначение признака элементом алфавита признаков сопровождается присвоением ему коэффициента значимости, обычно за 1 принимается значимость наиболее мощного признака (при вычислениях в целых числах для уменьшения времени расчетов верхнее значение будет равно 255).

Признаки выбираются итерационной процедурой, исходя из априорных сведений об объектах, фоне и результатах сравнения перекрытий описаний классов. Сравнение проводится при отсутствии корреляции между признаками на числовой оси признака или в гиперпространствах коррелированных признаков.

Понижение размерности исследуемого пространства признаков – классическая задача в теории распознавания. В технических приложениях ее сводят к задаче построения преобразующего фильтра, выходной вектор сигнала которого имеет заметно меньшую размерность, чем входной вектор. Классификация в пространстве меньшей размерности выполняется быстрее и проще.

В технике наиболее распространенным принципом понижения размерности является преобразование исследуемого пространства в пространство базисных функций (тригонометрических, экспоненциальных, дельта функций). Выбор типа базисных функций основывается на понятии расстояния между различаемыми классами в новых пространствах. Важную роль играют априорные сведения об исследуемых объектах. При достаточном объеме данных можно решать задачу так, чтобы, сохранив вероятность правильного принятия решения о принадлежности объекта к собственному классу, получить новое описание в базисных функциях минимального размера.

Практически правило сжатия гиперпространства базисных функций, содержащего образ исходного вектора, может быть сформулировано для случая непересекающихся классов следующим образом:

· сжатие допустимо до тех пор, пока не пересекутся крайние точки доверительных интервалов классов, дополненные доверительными зонами крайних объектов в соседних классах (рис. 2.1).

В исходном описании изображений первой процедурой обычно является процедура укрупнения пикселя. Если отсутствует отработанный алгоритм описания классов в пространстве признаков, то целесообразно ее проводить почти до уровня сохранения различия объектов на изображении при решении принимаемом человеком. Данная процедура проводится и в пространствах базисных функций, например, в Фурье-отображениях сегментов. В простейшем случае укрупнение пикселя – это выборка с массива отсчетов в массив меньшей размерности. Ниже приведена процедура формирования массива RQ из R. Размерность нового массива в my × mx меньше, чем исходного. На рис. 2.2 показаны изображения до и после сжатия (левый верхний угол). Возможность распознавания объектов не потеряна. Это подтверждает и вид сигналов снятых с одних и тех же участков изображений (рис. 2.3).

 

 

Рис. 2.1. Сжатие описаний пространства признаков до соприкосновения доверительных интервалов границ классов (А и В)

 

Более корректно операция укрупнения пикселя проводится через сегментацию и идентификацию мини объектов внутри сегмента (например, при распознавании чертежей не уничтожаются последние пиксели линий).

 

Рис. 2.2. Укрупнение пикселя в 4 раза по х и примерно в 8 раз по у

 

Рис. 2.3. Сигналы: после сжатия – строка 8 и до сжатия – строка 66

 

Следующая процедура – уменьшение размерности описания пикселя. Обычно исходное описание в 3-цветной модели имеет размер 24, 30, 48 бит в зависимости от разрядности систем оцифровки аналоговых сигналов.

Уменьшение разрядности линейным, нелинейным масштабированием сигналов цвета или адаптивным выбором цветов, сохраняющих межклассовую специфику объектов, позволяет снизить объем описания пикселя в несколько раз. На рис. 2.4-2.8 показаны результаты выполнения этапов уменьшения разрядности описания пикселя.

На первом этапе находятся гистограммы R, G, B составляющих (рис. 2.4).

 

 

Рис. 2.4. Гистограммы R, G, B составляющих изображения кисти винограда

 

 

 

Рис. 2.5. Выделенные участки гистограммы R составляющей:

а) вся зона, б), в), г), д) зоны содержащие одинаковое число пикселей

Далее задается правило разбиения осей на участки (исходное описание 8 бит – на составляющую).

В нашем случае отработано 2 алгоритма с преобразованием 2-3-2 т. е. 7-битном и 1-2-1 т. е. 4-битном представлении выходного описания пикселя. Результат разбиения оси R на четыре участка с равным количеством пикселей отображен на рис. 2.5. Границы участков служат уровнями логических компараторов, перекодирующих описание пикселей.

На рис. 2.6 и 2.7 приведены графики формирования выходного кода k по уровням R, G, B составляющих.

 

 

Рис. 2.6. Графики перекодировки RGB описания пикселя (возвращается k) для выходного описания 2-3-2 бита

 

 

Рис. 2.7. Графики перекодировки RGB описания пикселя (возвращается k) для выходного описания 1-2-1 бит

 

На рис. 2.8 показан результат перекодировки 24 бита в 7 бит без потери различия объектов. В варианте 24 в 4 бита часть объектов стали неразличимы.

Предельным вариантом сжатия является бинаризация описания, т. е. представление яркости и цвета пикселя нулем или единицей. Выбор порога в бинаризации достаточно сложная процедура. В простейшем случае величина порога задается фиксированной по всему полю изображения. На рис. 2.9 показаны сигнал по строке и результат бинаризации изображения текста низкого качества при величине порога rs = 117. Отдельные элементы букв утеряны (буква "н" в 6 строке не отличается от буквы "п") или стали не различимы по направлению элементов (ряд букв "и" в 4, 5 строке не различимы от буквы "н") и т. п.

 

Рис. 2.8. Изображение кисти темного винограда на фоне листвы:

а) до перекодировки; б) после перекодировки; в) новая палитра (2-3-2)

 

 

 

Рис. 2.9. Бинаризация изображения низкого качества с фиксированным порогом

 

Несколько лучшие результаты получаются при плавающей по полю величине порога. Она может выбираться в процентах от усредненного сигнала в сегменте, средним элементом которого является бинаризуемый пиксель. Величина процента также может быть адаптивно изменяемой, в зависимости от типа сегмента, места пикселя в сегменте и т. п. Например, если W – исходное изображение , w – бинаризованное изображение, y, x – координаты бинаризуемый точки, xs, ys – размеры сегмента, hx, hy – шаг смешения сегмента, nx – число сегментов по x, то правило бинаризации можно записать следующим выражением:

,

где – среднее, медиана или мода j-го сегмента. На рис. 2.10 показан результат бинаризации изображения текста с ys=30, xs=20, hy=20, hx=20, nx=18 и .

 

 

Рис. 2.10. Бинаризация изображения низкого качества с плавающим порогом

 








Дата добавления: 2015-03-23; просмотров: 736;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.012 сек.