Определение полного перечня признаков и параметров, характеризующих объекты или явления, для которых данная система разрабатывается.
Главное в решении этой задачи - найти все признаки, характеризующие существо распознаваемых объектов (явлений). Любые ограничения, любая неполнота, приводят к ошибкам или полной невозможности правильной классификации объектов (явлений).
Так если в задаче распознавания самолетов использовать один признак - потолок высоты полета самолетов, то бомбардировщики не удастся отличать от истребителей, поскольку при создании бомбардировщиков стремятся к обеспечению максимально возможной высоты полета, а при создании истребителей добиваются, чтобы они могли уничтожать бомбардировщики. Реально даже целая группа признаков может оказаться неэффективной.
Поэтому для решения 1-ой задачи создания системы распознавания необходимо найти все возможные признаки, описывающие объекты распознавания. Это необходимо для того, чтобы при оценке эффективности системы не возвращаться к этой задаче, обнаружив ограниченность выбранных признаков на последующих этапах разработки.
Но чтобы назначать перечень (алфавит) признаков распознавания, необходимо, во-первых, понять, что не существует способов автоматической генерации подобных списков. На сегодня это под силу только человеку. Поэтому говорят, что выбор признаков - эвристическая операция. Во-вторых, выбор признаков можно осуществлять, имея представление об их общих свойствах. С этих позиций достаточно принять, что признаки могут подразделяться на следующие виды:
- детерминированные;
- вероятностные;
- логические;
- структурные.
Детерминированные признаки - это такие характеристики объектов или явлений, которые имеют конкретные и постоянные числовые значения.
Примерами детерминированных признаков могут быть, например, одиннадцать тактико-технических характеристик бомбардировщиков и истребителей. Числовые значения признаков по каждому из самолетов можно тогда интерпретировать как координаты точек, представляющих каждый самолет в 11-мерном пространстве признаков.
Необходимо иметь в виду, что в задачах распознавания с детерминированными признаками ошибки измерения этих признаков не играют никакой роли, если, например, точность измерений такого признака значительно выше, чем различие этого признака у разных классов объектов.
К системам, использующим детерминированные признаки, можно отнести, например:
- системы распознавания принадлежности самолета к классу бомбардировщиков или истребителей по размаху крыльев, если данные получены разведкой или из открытой печати и заранее не привязаны к классам;
- системы распознавания на конвейере деталей по отличию геометрических характеристик (длина одних – 20 мм, длина других – 50 мм), если ошибки измерений существенно меньше размеров этих деталей. Распознавание осуществляется путем сравнения полученных размеров с имеющимися в базе данных характеристиками деталей.
Вероятностные признаки - это характеристики объекта (явления), носящие случайный характер на множестве объектов каждого класса. Именно с такими признаками в основном и приходится иметь дело.
Отличительной особенностью этих признаков является то обстоятельство, что в силу случайности соответствующей величины признак одного класса может принимать значения из области значений других классов, каждый из которых подлежит распознаванию в системе.
Если признак не может принять значений в области значений, соответствующей другим классам, то мы имеем дело не с вероятностным, а с тем же детерминированным признаком. Это подчеркивает, что класс вероятностных систем шире, чем класс детерминированных систем.
Чтобы в условиях случайности признака говорить о возможности распознавания, следует потребовать, чтобы вероятности наблюдения значений признака в своем классе были на много больше, чем в чужих классах. В противном случае данный признак не позволит построить систему распознавания, использующую описание классов на его основе. Эффективность его недостаточна для достоверного решения, и необходимо искать другие признаки, имеющие, как принято говорить, большую разделительную способность.
Случайная величина характеризуется функцией распределения вероятностей. Точно так же функцией распределения должен характеризоваться каждый вероятностный признак.
Логические признаки- это характеристики объекта или явления, относительно которых возможны только элементарные высказывания об истинности («да» - «нет» или «истина» – «ложь»).
Эти признаки, как мы понимаем, не имеют количественного выражения, то есть являются качественными суждениями о наличии, либо об отсутствии некоторых свойств или составляющих у объектов или явлений. Примеры логических признаков:
- наличие резьбы на изделии;
- кашель;
- насморк;
- растворимость реактива и т.д.
Здесь по каждому признаку можно сказать только то, что он есть, либо его нет. К логическим можно отнести также такие признаки, для которых важна не величина, а лишь факт попадания или непопадания ее в заданный интервал (в поле допуска).
Структурные или лингвистические признаки – это непроизводные, первичные элементы символы, примитивы ил терминалы изображения объекта распознавания.
Появление структурных признаков обязано возникновению проблемы распознавания изображений с ее специфическими особенностями и трудностями. Структурными признаками для изображения прямоугольника является горизонтальный отрезок и вертикальный отрезок прямой.
Традиционно для описания изображений использовались разложения его в ряды по ортогональным системам базисных функциий (ряды Фурье, полиномы Эрмита, Лежандра, Чебышева, разложения Карунена-Лоэва и др.). Однако структурное описание в отличие от разложений:
- понятнее для человека, решающего задачу распознавания объекта;
- приемлемо и для компьютерной реализации при распознавании;
- свободно от трудоемкости вычислений и потерь информации, свойственных разложениям.
Оказывается, что, оперируя ограниченным числом примитивов, можно получить описание разнообразных объектов. Но для того, чтобы описание можно было бы выполнить, наряду с определением примитивов должны вводиться правила их комбинирования. В результате два одинаковых примитива различных объектов могут быть соединены друг с другом по разным правилам. Это и будет отличать объекты друг от друга.
Так для описания арабских цифр достаточно иметь девять черточек: 4 вертикальные, три горизонтальные и две наклонные (смотри рисунок). Объединяя их по-разному, можно получить описания всех цифр на языке этих примитивов в виде кортежей переменной длины:
Таким образом, мы рассмотрели очень подробно первую задачу в ряду проблем создания системы распознавания - определение полного перечня признаков (параметров), характеризующих объекты или явления, для которых данная система разрабатывается. Главные выводы:
1) Выбор и назначение признаков распознавания является эвристической операцией, зависящей от творчества, изобретательности разработчика.
2) Состав признаков, выбираемых на этом этапе, должен быть как можно более разносторонним и полным, независимо от того, можно или нельзя эти признаки получить с помощью имеющихся средств получения информации.
3) Выбор признаков должен осуществляться в группах детерминированных, вероятностных, логических и структурных признаков.
Дата добавления: 2015-11-28; просмотров: 1130;