Глава 5. РАСПОЗНАВАНИЕ И КЛАССИФИКАЦИЯ ОБРАЗОВ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ ПРЕДПОЛОЖЕНИЯ О БЛИЗОСТИ ОПИСАНИЙ

При решении задач распознавания и классификации с использованием предположения о близости описаний, оценивается среднее расстояние между описаниями неизвестного объекта и каждого объекта из известного множества,т. е. предполагается усреднение по измерениям для объектов из этого множества [1]. По сравнению с классическим подходом эти методы классификации основаны на более слабом предположении, что объекты, описания которых расположены близко друг от друга в
m-мерном пространстве описаний D, могут принадлежать одному и тому же классу. Например, пол конкретного человека обычно определяют, выясняя его схожесть с произвольно выбранным мужчиной или с женщиной. Другой пример – происхождение классической греческой скульптуры или мраморной кладки устанавливается по оценкам относительного количества различных изотопов химических элементов в мраморе. Обнаружено, что мрамор из античных карьеров можно отличать по отношению концентраций углерода-13 к углероду-12 и кислорода-18 к кислороду-16. Разумеется, необходимы надежно обоснованные правила отнесения каждого из исследуемых фрагментов скульптуры или кладки к соответствующему карьеру.

Объект с описанием x похож на объекты с описаниями, принадлежащими некоторому множеству , если мало среднее значение квадрата расстояния между точками x и точками множества Y = .

При сравнении двух множеств оценивается среднее расстояние между двумя точками, взятыми по одной из каждого множества. Для множеств X и Y, содержащих соответственно и точек, среднеквадратичное значение расстояния между X и Y равно

(27)

Чем дальше в среднем друг от друга точки из X и Y, тем больше значение Плотность расположения точек внутри множества обычно оценивается среднеквадратичным значением расстояния между точками этого множества:

(28)

Классификация, основанная на близости описаний, заключается в преобразовании пространства описаний D в пространство D^*, в котором все точки одного множества расположены близко друг к другу, а точки различных – удалены на некоторое расстояние. Пространство D^* формируется в результате линейного преобразования m-мерного пространства D, когда каждая точка x Î D отображается в точку x^* Î D^* по формуле

(29)

где W – симметричная (m m)-матрица, w_ji – элементы матрицы.

ВАРИАНТЫ РЕАЛИЗАЦИИ МЕТОДА КЛАССИФИКАЦИИ, ОСНОВАННОГО НА БЛИЗОСТИ ОПИСАНИЙ

Метод классификации, в котором для установления сходства объектов в пределах одного множества пространство описаний трансформируется с целью минимизации среднеквадратичного расстояния между двумя точками, требует для каждого класса отдельного преобразования, что усложняет весь процесс классификации. Другой недостаток заключается в том, что изучение каждого класса в отдельности не позволяет обнаруживать степень различия между классами в пространстве исходных измерений.

Отмеченные недостатки устраняются при использовании дискриминантного критерия. Он состоит в максимизации различия между точками разных множеств; при этом сумма расстояний между точками внутри и между множествами остается постоянной. Этот подход приводит к единой составной мере, по которой местоположения точек одного множества близки, а разных множеств существенно отличаются.

В качестве геометрической интерпретации составной меры можно представить себе прямую линию в m-мерном пространстве, выходящую из начала координат пространства D. Пространственное положение этой линии выбирается таким образом, чтобы точки одного множества проектировались в одну и ту же ее область, а разных множеств – в разные области. Эффективность такого подхода можно проиллюстрировать результатами его использования при решении упомянутой ранее задачи классификации – установлении происхождения материала археологических мраморных обломов при помощи изотопов. На рис. 12 приведены результаты измерений, полученные для образцов из различных карьеров. Данные, определяющие оси, выведены из отношений и с помощью сложных расчетов, в которых измерения исследуемого фрагмента сопоставлялись с аналогичными измерениями для стандартных образцов.

Рис. 12. Отклонения содержания углерода-13 и кислорода-18 (относительно
стандарта PDP) в образцах мрамора из античных карьеров.
Треугольниками обозначены мраморные обломы (Крейг, 1972).
Наименования обломов: А-1 (наименование происхождения – Пентели),
А-2 (наименование происхождения – неизвестно); D-1 (Парос);
N-43 (Наксос), N-48 (Наксос)

Точки, соответствующие множествам образцов из карьеров Парос, Гиметт и Пентели, спроектированные на ось L, изображены на рис. 13. Прямая L – это составная мера, которая определяется взвешенными суммами упомянутых выше отношений кислорода и углерода.

Соответствующие вычислительные процедуры используют три вспомогательные матрицы G, V и T. Для любой пары точек x, y Î D
определим матрицу G(x,y) порядка m с элементами

= (x, y). (30)

Рис. 13. Проекции на соответствующие оптимальные собственные векторы

Предположим, что исходные данные состоят из k множеств X¹, …, X^k наблюдений, соответствующих k классам. Обозначим через усредненную матрицу G(x,y) по всем парам точек x и y из различных множеств
Xⁱ и X^j, а через – усредненную матрицу G(x,y) по всем парам независимо от принадлежности их какому-то классу. Алгебраически это можно записать следующим образом:

= (x y , (31)

(32)

Для дальнейших рассуждений необходимо напомнить, как определяются собственные векторы и собственные значения матрицы. Рассмотрим для заданной квадратной матрицы порядка n следующее уравнение

= , (33)

где – неизвестный числовой вектор, высота которого равна порядку матрицы , а неизвестное число. Данное уравнение при любом обладает тривиальным решением = 0. Однако нас интересуют только такие значения , при которых эта система имеет нетривиальные решения. Эти значения называются собственными значениями матрицы , а решения данного уравнения при этих ее собственными векторами.

Собственные значения и собственные векторы находятся следующим образом. Поскольку x =Ix, где I – единичная диагональная матрица, то можно записать

, (34)

т. е. мы имеем дело с системой из n алгебраических линейных однородных (без свободных членов) уравнений с n неизвестными, где n – порядок матрицы А. Для наличия нетривиального решения необходимо и достаточно, чтобы определитель системы равнялся нулю, т. е.

│A – λI│= 0. (35)

Это уравнение называется характеристическим уравнением матрицы ,оно служит для определения собственных векторов и собственных значений . Так, для матрицы

(36)

характеристическое уравнение имеет вид

(37)

При раскрытии определителя получаем алгебраическое уравнение, степень которого равна порядку матрицы A, т. е. матрица порядка n имеет n собственных значений, среди которых, правда, могут быть совпадающие.

Зная собственные значения, можно найти соответствующие собственные векторы из векторного уравнения (34), переписанного в виде системы скалярных уравнений

(38)

Определим матрицу , строки которой являются собственными векторами матрицы VT^-1 (T^-1 – матрица, обратная для матрицы T, T^-1T = I).
Тогда W₁ – собственный вектор, соответствующий наибольшему собственному значению . Для определения обратной матрицы T^-1 необходимо знать следующее правило:

если (39)

то (40)

где большими буквами A₁, …, C₃ обозначены алгебраические дополнения соответствующих элементов в матрице T.

Собственный вектор W₁ определяетнаправление прямой L, выходящей из начала координат пространства D и максимально разделяющей точки различных множеств. Прямая линия L образует с j-й осью d_j пространства D угол, такой, что

cos(L, d_j) = w_1,_j (41)

Определением прямой L завершается этап распознавания образов. На этапе классификации объект относится к классу i в зависимости от положения на прямой L проекции его описания y. Для любой точки
x Î D обозначим

(42)

Вектор из класса i = 1, …, k классифицируется как описание объекта тогда и только тогда, когда величина

(43)

минимальна.

Недостаток дискриминантногометода состоит в том, что, хотя он приводит к хорошей мере для классификации по всем классам, он не обязательно дает хорошую меру для каждого класса в отдельности. Как видно на рис. 12, ни одна прямая не может разделить все классы, поскольку наилучшая прямая для разделения множеств Пентели и Наксос ориентирована не так, как оптимальная прямая, разделяющая все множества за исключением Наксос.

<== предыдущая лекция	\|	следующая лекция ==>
ПАРАЛЛЕЛЬНАЯ ПРОЦЕДУРА КЛАССИФИКАЦИИ ОБРАЗОВ НА ОСНОВЕ БАЙЕСОВСКОЙ ОЦЕНКИ ВЕРОЯТНОСТЕЙ ОСУЩЕСТВЛЕНИЯ РАЗЛИЧНЫХ ГИПОТЕЗ	\|	Алгоритм коррекции по ошибкам для двух классов

Дата добавления: 2016-01-20; просмотров: 803;