Методы и алгоритмы видеоанализа
Алгоритмы видеоанализа с точки зрения организации вычислительных процессов подразделяют на локальные и нелокальные арифметико-логические преобразования, с точки зрения функциональных этапов — на обучение и распознавание.
С точки зрения соотношения между объемами входной и выходной информации арифметико-логические преобразования подразделяют на функции предварительной обработки изображений и построения описаний. При предварительной обработке объем выходной информации равен объему входной (матрица изображения преобразуется в выходную матрицу). Задачами предварительной обработки являются: подавление помех, сглаживание, оконтуривание, разделение слипшихся объектов, выделение срединных линий объектов.
При построении описаний объем выходной информации значительно меньше объема информации на входе. Основные задачи при построении описаний — выделение интегральных признаков (статических, спектральных и др.) и структурно-синтаксических образов (топологических, грамматических).
Рассмотрим локальные и нелокальные преобразования, так как они определяют аппаратную и программную реализацию вычислительных устройств, осуществляющих сенсорные функции.
При локальных преобразованиях (рис. 1.12) вычисляемые параметры, т. е. новое значение точки в преобразуемой
входной матрице изображения и размерность изображения ;
(. — размерность изображения), являются арифметико-логическими функциями значений точек в некоторой локальной окрестности S точки
с координатами (и, /и):
В качестве примеров локальных арифметико-логических операций приведем соотношения, определяющие: сглаживающий фильтр:
и оконтуривающий
Их работа иллюстрируется рис. 1.13.
Результат нелокального преобразования является арифметико-логической функцией всех точек изображения, т. е.:
Линейные нелокальные преобразования описываются выражением
где — анализируемый объект; — распознающий оператор;
— признак анализируемого изображения; — число распознаваемых объектов; S — множество точек изображения, входящих в траектории линейного или полярного сканирования; к — номер признака.
Если множество 5 образовано траекториями линейного сканирования, то в общем случае признаки не инвариантны к сдвигам, вращению и масштабированию. Один из способов получения инвариантного описания состоит в организации полярного сканирования (см. рис. 1.14).
Рассмотрим пример возможного подхода к построе нию инвариантного описания, состоящего из двух операций: вычисление центра тяжести (ЦТ) объекта Q в кадре и выполнение одномерных преобразований Фурье по семейству концентрических окружностей с началом ко- > ординат в центре тяжести,
Обоснованность такого подхода определяется тем, что амплитудная характеристика преобразования Фурье не зависит от угловой ориентации и пространственного положения объекта, а также в определенной степени и от масштабирования. Используемое число концентрических окружностей зависит от сложности внутренней структуры объекта, числа распознаваемых объектов и требуемой помехозащищенности. Информация, содержащаяся в фазовой характеристике преобразования, определяет угловую ориентацию. Координаты центра тяжести характеризуют положение объекта на плоскости.
Общие требования, предъявляемые к сенсорным системам в РТК и ГАП:
построение на модульной основе;
распознавание должно быть в реальном масштабе времени в соответст
вии с производственным ритмом (не более 1 с);
распознавание должно быть помехоустойчивым (т. е. не более заданно
го процента искажений);
надежность должна сочетаться с низкой стоимостью;
реализация динамических задач осуществляется с помощью специаль
ных аппаратных средств.
Дата добавления: 2015-10-29; просмотров: 941;