Модель классификации
Рассмотренный пример содержит многие элементы наиболее распространенной абстрактной модели РО: модели классификации.
Модель классификации состоит из 3-х частей:
ü датчика информации;
ü формирователя совокупности признаков;
ü классификатора.
Датчик воспринимает воздействие и преобразует его к виду, удобному
для машинной обработки.
Формирователь признаков (рецептор, фильтр свойств, детектор признаков, препроцессор) выделяет из входных данных только существенную по данной задаче информацию.
Классификатор на основе той информации относит эти данные к одной из нескольких категорий.
С точки зрения теории провести черту между этими двумя действиями (формирование признаков и классификация) можно весьма условно: идеальный формирователь признаков предельно упрощает работу классификатора, а при наличии мощного классификатора не требуется помощь формирователя признаков.
Задача выделения признаков более специализирована по сравнению с задачей классификации.
Как следует из примеров, задача классификации по существу представляет собой задачу разбиения пространства признаков на области, по одной для каждого класса.
Разбиение надо производить так, чтобы не было ошибочных решений. Если же того сделать нельзя, то процедура направлена на уменьшение вероятности ошибки. Если ошибки имеют различную цену, то минимизируется средняя стоимость ошибки. Тогда задача классификации превращается в задачу теории статистических решений.
Основные понятия определения
Класс – одно из основных понятий в проблеме распознавания образов относится к множеству объектов, явлений, процессов или ситуаций, которым присущи некоторые общие свойства, позволяющие объединить их, рассматривая, как сходные, и в то же время отличать от объектов и т.д. с какими-то другими свойствами. Для обозначения этого понятия используют термин “образ”, а более употребительным – термин “класс”. Обозначим его буквой Qj, где индекс j позволяет отличать один класс от другого. Общее число классов обозначим Q.
Процедуру отнесения конкретного объекта, явления ли ситуации к одному из классов используют термин “распознавание” или “классификация”.
Иногда в эти термины вкладываю различный смысл:
ü при классификации достаточно определить только индекс j – номер класса (тип, вид), к которому принадлежит анализируемый объект;
ü при распознавании необходимо указать наименование Qj, например, “10-й самолет эскадрильи СУ-27”, “буква А”, “ЧМ сигнал”, “болезнь Боткина” и т.д.
Нетрудно видеть, что понятие “класс” довольно расплывчато. Оно
основано на утверждении о наличии у множества объектов существенных общих свойств.
При этом пренебрегают различиями объектов, т.е. позволяют считать эти различия второстепенными по сравнению с тем сходством в свойствах, которое их объединяет.
Сходство или различие свойств – относительное понятие. Общность свойств объектов проявляется лишь на фоне их отличий от других множеств.
Понятие “класс” теряет свой смысл, если его рассматривать изолированно от других классов.
Таким образом, должно быть учтено, какие различия в свойствах объектов считаются существенными, а какие – нет.
Потому считаем выполненными следующие условия:
Определения:
1. все распознаваемое множество объектов принадлежит действительно существующим Q классам q1, q2, …, qQ.
2. Пользователю (потребителю) необходима объективная классификация, т.е. распознающее устройство должно принимать одинаковые решения для всех представителей “одного класса” и различные – для представителей разных классов.
Сигнал, признак. Объекты в каждой задаче распознавания часто имеют различную физическую природу. Для упрощения понятий введем термин “сигнал”, он более точно отражает информацию, которая поступает на вход распознающего устройства и связана с результатами измерения определенных свойств объектов, поступающих как сигналы на вход распознающего устройства.
Сигнал обозначают вектор – столбцом:
или вектор – строкой X = {x1,x2,…,xr} .
Здесь каждый элемент вектора отражает какое-либо свойство объекта и может быть признаком сигнала.
Т.о. если при распознавании используется r признаков, то каждый сигнал можно представить в виде точки в r – мерном пространстве сигналов R. Чтобы отличать один сигнал от другого, вектору Х приписывают нижний индекс, обозначающий порядковый номер в последовательности сигналов х1, х2,…, хi,…,поступающих на вход распознающего устройства.
Поскольку каждый элемент вектора сигнала Xi = (xi1, xi2,…,xir) в этом случае отмечается двумя индексами, обозначим через Xik значение k-го признака i-го сигнала.
Задача выбора наиболее существенных признаков решается до разработки алгоритма функционирования распознающего устройства.
Определение: Таким образом, с выхода устройства измерения признаков на вход устройства классификации поступают сигналы с заранее выбранным фиксированным набором (множеством) признаков, характеризующих свойства, наиболее существенные для пользователя.
Пример 2: Рассмотрим задачу сортировки, например, томатов. Пусть система управления, стоящая над системой распознавания, располагает тремя возможными решениями:
1) направить на продажу;
2) направить на консервирование;
3) направить на томат-пасту.
Очевидно, что применительно к этим решениям в системе
распознавания должны быть предусмотрены 4 класса (4 образа):
ü 1-й класс, например, крупные, твердые, красные томаты;
ü 2-й класс, более мелкие, менее красные томаты;
ü 3-й класс – мягкие, перезревшие томаты;
ü 4-й класс – все остальные.
Итак, сформирован алфавит классов Q = {Q1, Q2, Q3, Q4}.
Необходимо определить, какими признаками обладают томаты. В данном случае – вес х1, размеры – х2, х3, цвет – х4, степень твердости – х5.
Полагаем также, что ограничения, накладываемые на систему, не препятствуют применению соответствующего набора измерителей. Признаки здесь – количественные и качественные.
Следовательно, сформирован словарь признаков .
Следовательно, следующей операцией необходимо: каждый класс томатов описать на языке признаков, т.е. определить какими значениями, интервалами значений или законами распределения признаков описывается (характеризуется) каждый класс.
Определение 1: Алфавит классов (образов) – то совокупность образов, которую может распознать система (устройство).
Определение 2: Словарь признаков – то их совокупность, достаточная и используемая для распознавания класса.
Определение 3: талон – некоторый средний образ, т.е. образ, все параметры которого усреднены. Признаки (параметры) образа могут меняться в некоторых пределах, в то время как образ будет относиться к одному и тому же “классу”, т.е. необходимо знать возможные разбросы параметров образа, т.е. статистические характеристики всех признаков.
Следствие 1: Таким образов, можно говорить о том, что каждому эталонному образу соответствует некоторый r – мерный вектор µq(q = 1,2,…,Q).
Следствие 2: В пространстве параметров каждому образу соответствует определенный объем.
Перечисленные тапы характеризуются накоплением, анализом и обработкой априорной информации.
Следующим этапом является получение апостериорной информации, в нашем примере, о томате.
Пусть в результате наблюдений значение вектор – столбца или вектор – строки , r = 1,2… получены.
Следующий этап – сопоставление апостериорных данных с данными, заключенными в априорном описании всех классов, например, томатов, на языке признаков, позволяет в принципе определить, к какому классу относится неизвестный объект, распознать его.
Определение: Таким образом, предпосылкой для создания распознающей системы является:
1) имеется некоторая совокупность объектов, явлений или ситуаций;
2) априорная информация позволяет подразделить их на классы,
непересекающиеся с точки зрения выбранного принципа классификации, определяемого набором возможных решений (стратегий) системы управления, т.е. составить алфавит классов;
3) выбирается словарь признаков, на языке которого описывается
каждый класс объектов;
4) синтезируются средства наблюдения и измерения, обеспечивающие
получение с необходимой достоверностью значений признаков;
5) синтезируются вычислительные средства, способные реализовать
алгоритмы распознавания, способные сопоставлять апостериорные данные о неизвестном объекте с априорной информацией и на основе сопоставления – принять решение, к какому классу он может быть отнесен.
В соответствии с предложенной трактовкой задачи распознавания
структурная схема типовой системы может быть представлена следующим образом.
решение
(результат распознавания)
х1 х2 хr
неизвестный объект
Дата добавления: 2016-01-20; просмотров: 1313;