Основы метода
Метод основан на простой формуле Байеса. Если имеется диагноз Di и простой признак kj, встречающийся при этом диагнозе, то вероятность совместного появления событий (наличие у объекта состояния Di и признака kj)
. (3.1)
Из этого равенства вытекает формула Байеса
. (3.2)
Очень важно определить точный смысл всех входящих в эту формулу величин. - вероятность диагноза Di, определяемая по статистическим данным (априорная вероятность диагноза). Так, если предварительно обследовано N объектов и у Ni объектов имелось состояние Di, то
. (3.3)
вероятность появления признака kj у объектов с состоянием Di. Если среди Ni объектов, имеющих диагноз Di у Nij, проявился признак kj, то
. (3.4)
- вероятность появления признака kj во всех объектах независимо от состояния (диагноза) объекта. Пусть из общего числа N объектов признак kj был обнаружен у Nj объектов, тогда
. (3.5)
Для установления диагноза специальное вычисление не требуется. Как будет ясно из дальнейшего, значения , , известные для всех возможных состояний, определяют величину .
В равенстве (3.2) - вероятность диагноза Di после того, как стало известно наличие у рассматриваемого объекта признака kj (апостериорная вероятность диагноза).
Обобщенная формула Байеса. Эта формула относится к случаю, когда обследование проводится по комплексу признаков K, включающему признаки k1, k2, …kν. Каждый из признаков kj имеет mj разрядов (kj1, kj2, …kjs, …, kjmj). В результате обследования становится известной реализация признака и всего комплекса признаков K*. Индекс * означает конкретное значение (реализацию признака). Формула Байеса имеет вид
, i=1, 2, …, n, (3.6)
где - вероятность диагноза Di после того, как стали известны результаты обследования по комплексу признаков К; - предварительная вероятность диагноза Di (по предшествующей статистике).
Формула 3.6 относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний и потому
. (3.7)
В практике нередко существуют несколько состояний A1, …Ar, причем некоторые могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов Di следует рассматривать отдельные состояния D1=A1,…Dr=Ar и их комбинации Dr+1=A1^A2, … и т.п.
Если комплекс признаков состоит из ν признаков, то
, (3.8)
где - разряд признака, выявившийся в результате обследования.
Для диагностически независимых признаков
. (3.9)
Вероятность появления комплекса признаков K*
. (3.10)
Обобщенная формула Байеса может быть записана
, (3.11)
где определяется равенством 3.8 и 3.9.
Из соотношения 3.11 вытекает , что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация двух диагнозов невозможна.
Дата добавления: 2014-12-20; просмотров: 978;