Метод Байеса

Среди методов технической диагностики метод, основанный на обобщенной формуле Бaйeca_, занимает особое место благодаря простоте и эффективности.

Разумеется, метод Байеса имеет недостатки: большой объем предварительной информации, «угнетение» редко встречающихся диагнозов и др. Однако в случаях, когда объем статистических данных позволяет применить метод Байеса, его целесообразно использовать как один из наиболее надежных и эффективных методов.

Основы метода. Метод основан на простой формуле Байеса. Если имеется диагноз D_i и простой признак k_j, встречающийся при этом диагнозе, то вероятность совместного появления событий (наличие у объекта состояния D_i и признака k_j)

P (D_ik_j) = P (D_i) P (k_j/D_i) = P (k_j) P (D_i/k_j). (5.4)

Из этого равенства вытекает формула Байеса (см. гл. 11)

P(D_i/k_j) = P(D_i) P(k_i/D_i)/P(k_j) (5.5)

Очень важно определить точный смысл всех входящих в эту формулу величин.

P(D_i) —вероятность диагнозаD_i, определяемая по статистическим данным (априорная вероятность диагноза). Так, если предварительно обследовано N объектов и у N_i объектов имелось состояние D_i, то

P(D_i) = N_i/N. (5.6)

P (k_j/D_i) —вероятность появления признакаk_jу объектов с состоянием D_i. Если среди N_i объектов, имеющих диагнозD_i, у N_ij проявился признак k_j, то

P(k_j/D_i) = N_ij/N_i. (5.7)

P(k_j) —вероятность появления признакаk_j во всех объектахнезависимо от состояния (диагноза)объекта. Пусть изобщего числа N объектов признакk_j был обнаружену N_j объектов, тогда

P(k_j) = N_j/N. (5.8)

Для установления диагноза специальное вычисление P(kj)не требуется. Как будет ясно из дальнейшего,значения P(D_i)и P (k_j/D_i),известные для всех возможных состояний, определяют величину P (k_j).

Вравенстве (3.2) P (D_i/k_j)—вероятность диагноза D_i послетого, как сталоизвестно наличие у рассматриваемого объекта признака k_j (апостериорная вероятность диагноза).

Обобщенная формула Байеса.Эта формула относится к случаю, когда обследование проводится по комплексу признаков К,включающему признаки k₁, k₂, ..., k_v.Каждый из признаков k_jимеет m_j разрядов (k_j_l, k_j₂, ..., k_js, ..., ). В результате обследования становитсяизвестной реализация признака

k_j^*= k_js(5.9)

и всего комплекса признаков K*. Индекс *,как и раньше, означаетконкретное значение (реализацию) признака. Формула Байеса для комплексапризнаков имеет вид

P(D_i/К*)= P(D_i)P(К*/D_i)/P(К*)(i = 1, 2, ..., n), (5.10)

где P (D_i/К*) —вероятность диагноза D_i после того, какстали известны результаты обследования по комплексу признаков К,P (D_i) —предварительная вероятность диагноза D_i (по предшествующей статистике).

Формула (5.10) относится к любому из n возможных состояний (диагнозов) системы. Предполагается, что система находится только в одном из указанных состояний ипотому

(5.11)

В практических задачах нередко допускается возможность существования нескольких состояний А₁, ..., А_r, причем некоторые из них могут встретиться в комбинации друг с другом. Тогда в качестве различных диагнозов D_i следует рассматривать отдельные состояния D₁ = А₁, ..., D_r = А_r и их комбинации D_r₊₁ = А₁ ^ А₂, … и т. п.

Перейдем к определению P (К*/D_i). Если комплекс признаков состоит из v признаков, то

P(К*/D_i) = P(k₁*/D_i)P (k₂*/k₁*D_i)...P (k_v*/k_l*...k*_v-₁D_i), (5.12)

где k_j* =k_js —разряд признака, выявившийся в результате обследования. Для диагностически независимых признаков

P (К*/D_i) = P (k₁*/D_i) P (k₂*/D_i)... P (k_v*/D_i). (5.13)

В большинстве практических задач, особенно при большом числе признаков, можно принимать условие независимости признаков даже при наличии существенных корреляционных связей между ними.

Вероятность появления комплекса признаковК*

P(К*)= P(D_s)P(К*/D_s).(5.14)

Обобщенная формула Байеса может быть записана так:

P(D_i/K*) (5.15)

где P (К*/D_i)определяется равенством (5.12) или (5.13). Изсоотношения (5.15) вытекает

P(D_i/К*)=l, (5.16)

что, разумеется, и должно быть, так как один из диагнозов обязательно реализуется, а реализация одновременно двух диагнозов невозможна.

Следует обратить внимание на то, что знаменатель формулы Байеса для всех диагнозов одинаков. Это позволяет сначала определить вероятности совместного появления i-гo диагноза и данной реализации комплекса признаков

P(D_iК*) = P(D_i)P(К*/D_i) (5.17)

и затем апостериорную вероятность диагноза

P (D_i/К*) = P(D_iК*)/ P(D_sК*). (5.18)

Отметим, что иногда целесообразно использовать предварительное логарифмирование формулы (5.15), так как выражение (5.13) содержит произведения малых величин.

Если реализация некоторого комплекса признаков К* является детерминирующей для диагноза D_p, то этот комплекс не встречается при других диагнозах:

Тогда, в силу равенства (5.15)

(5.19)

Таким образом, детерминистская логика установления диагноза является частным случаем вероятностной логики. Формула Байеса может использоваться и в том случае, когда часть признаков имеет дискретное распределение, а другая часть — непрерывное. Для непрерывного распределения используются плотности распределения. Однако в расчетном плане указанное различие признаков несущественно, если задание непрерывной кривой осуществляется с помощью совокупности дискретных значений.

Диагностическая матрица. Для определения вероятности диагнозов по методу Байеса необходимо составить диагностическую матрицу (табл. 5.1), которая формируется на основе предварительного статистического материала. В этой таблице содержатся вероятности разрядов признаков при различных диагнозах.

Таблица 5.1

Диагностическая матрица в методе Байеса

Диагноз D_i

Признак k_j

P(D_i)

k₁

k₂

k₃

P(k₁₁/D_i)

P(k₁₂/D_i)

P(k₁₃/D_i)

P(k₂₁/D_i)

P(k₂₂/D_i)

P(k₂₃/D_i)

P(k₂₄/D_i)

P(k₃₁/D_i)

P(k₃₂/D_i)

D₁

0,8

0,2

0,1

0,6

0,2

0,8

0,3

D₂

0,1

0,7

0,2

0,3

0,7

0,1

0,9

0,1

…

Если признаки двухразрядные (простые признаки «да — нет»), то в таблице достаточно указать вероятность появления признака Р (k_i/D_i). Вероятность отсутствия признака Р ( /D,-) = 1 - Р (k_i/D_i).

Однако более удобно использовать единообразную форму, полагая, например, для двухразрядного признака Р (k_j/D_i) = Р (k_i₁/D_i); Р ( /D,) = Р (k_i₂/D_i).

Отметим, что P(k_js/Di) = 1, где т, — число разрядов признака k_j. Сумма вероятностей всех возможных реализаций признака равна единице.

В диагностическую матрицу включены априорные вероятности диагнозов. Процесс обучения в методе Байеса состоит в формировании диагностической матрицы. Важно предусмотреть возможность уточнения таблицы в процессе диагностики. Для этого в памяти ЭВМ следует хранить не только значения P(k_js/Di), но и следующие величины: N — общее число объектов, использованных для составления диагностической матрицы; N_i — число объектов с диагнозом D_i; N_ij — число объектов с диагнозом D_i, обследованных по признаку k_j. Если поступает новый объект с диагнозом D_μ, то проводится корректировка прежних априорных вероятностей диагнозов следующим образом:

(5.20)

Далее вводятся поправки к вероятностям признаков. Пусть у нового объекта с диагнозом D_μ выявлен разряд r признака k_j. Тогда для дальнейшей диагностики принимаются новые значения вероятности интервалов признака k_j при диагнозе D_μ:

(5.21)

Условные вероятности признаков при других диагнозах корректировки не требуют.

Пример.Поясним метод Байеса. Пусть при наблюдении за газотурбинным двигателем проверяются два признака: k₁— повышение температуры газа за турбиной более чем на 50 °С и k₂ — увеличение времени выхода на максимальную частоту вращения более чем на 5 с. Предположим, что для данного типа двигателей появление этих признаков связано либо с неисправностью топливного регулятора (состояние D₁,), либо с увеличением радиального зазора в турбине (состояние D₂).

При нормальном состоянии двигателя (состояние D₃)признак k₁не наблюдается, а признак k₂наблюдается в 5% случаев. На основании статистических данных известно, что 80% двигателей вырабатывают ресурс в нормальном состоянии, 5% двигателей имеют состояние D₁и 15% - состояние D₂. Известно также, что признак k₁встречается при состоянии D₁в 20% , а при состоянии D₂ в 40% случаев; признак k₂ при состоянии D₁встречается в 30%, а при состоянии D₂ - в 50% случаев. Сведем эти данные в диагностическую таблицу (табл. 5.2).

Найдем сначала вероятности состояний двигателя, когда обнаружены оба признака k₁и k₂. Для этого, считая признаки независимыми, применим формулу (5.15).

Вероятность состояния

Аналогично получим Р (D₂/k₁k₂) = 0,91; Р (D₃/k₁k₂) = 0.

Определим вероятность состояний двигателя, если обследование показало, что повышение температуры не наблюдается (признак k₁), но увеличивается время выхода на максимальную частоту вращения (признак k₂ наблюдается). Отсутствие признака k₁ есть признак наличия (противоположное событие), причем Р ( /Di) = 1 - Р (k₁/Di).

Для расчета применяют также формулу (5.15), но значение Р (k₁/Di) в диагностической таблице заменяют на Р ( /Di). В этом случае

и аналогично Р (D₂/ k₂) = 0,46; Р (D₃/ k₂) = 0,41. Вычислим вероятности состояний в том случае, когда оба признака отсутствуют. Аналогично предыдущему получим

Отметим, что вероятности состояний D₁ и D₂ отличны от нуля, так как рассматриваемые признаки не являются для них детерминирующими. Из проведенных расчетов можно установить, что при наличии признаков k₁ и k₂ в двигателе с вероятностью 0,91 имеется состояние D₁, т.е. увеличение радиального зазора. При отсутствии обоих признаков наиболее вероятно нормальное состояние (вероятность 0,92). При отсутствии признака k₁ и наличии признака k₂ вероятности состояний D₂ и D₃ примерно одинаковы (0,46 и 0,41) и для уточнения состояния двигателя требуется проведение дополнительных обследований.

Таблица 5.2

Вероятности признаков и априорные вероятности состояний

D_i	P(k₁/D_i)	P(k₂/D_i)	P(D_i)
D₁	0,2	0,3	0,05
D₂	0,4	0,5	0,15
D₃	0,0	0,05	0,80

Решающее правило— правило, в соответствии с которым принимается решение о диагнозе. В методе Байеса объект с комплексом признаков К* относится к диагнозу с наибольшей (апостериорной) вероятностью

K* D_i,если P(D_i/K*) > P(D_j/K*) (j = 1, 2,..., n; i ≠ j). (5.22)

Символ , применяемый в функциональном анализе, означает принадлежность множеству. Условие (5.22) указывает, что объект, обладающий данной реализацией комплекса признаков К* или, короче, реализация К* принадлежит диагнозу (состоянию) D_i. Правило (5.22) обычно уточняется введением порогового значения для вероятности диагноза:

P (D_i/K*) ≥ P_i, (5.23)

где P_i. — заранее выбранный уровень распознавания для диагноза D_i. При этом вероятность ближайшего конкурирующего диагноза не выше 1 – P_i. Обычно принимается P_i ≥ 0,9. При условии

P(D_i/K*)<P_i (5.24)

решение о диагнозе не принимается (отказ от распознавания) и требуется поступление дополнительной информации.

Процесс принятия решения в методе Байеса при расчете на ЭВМ происходит достаточно быстро. Например, постановка диагноза для 24 состояний при 80 многоразрядных признаках занимает на ЭВМ с быстродействием 10 - 20 тысяч операций в секунду всего несколько минут.

Как указывалось, методу Байеса присущи некоторые недостатки, например погрешности при распознавании редких диагнозов. При практических расчетах целесообразно провести диагностику и для случая равновероятностных диагнозов, положив

P(D_i) = l / n (5.25)

Тогда наибольшим значением апостериорной вероятности будет обладать диагноз D_i, для которого Р (K*/D_i) максимальна:

K* D_i,если P(K*/D_i) > P(K*/D_j) (j = 1, 2,..., n; i ≠ j). (5.26)

Иными словами, устанавливается диагноз D_i если данная совокупность признаков чаще встречается при диагнозе D_i, чем при других диагнозах. Такое решающее правило соответствует методу максимального правдоподобия. Из предыдущего вытекает, что этот метод является частным случаем метода Байеса при одинаковых априорных вероятностях диагнозов. В методе максимального правдоподобия «частые» и «редкие» диагнозы равноправны.

Для надежности распознавания условие (5.26) должно быть дополнено пороговым значением

P(K*/D_i) ≥ P_i, (5.27)

где P_i — заранее выбранный уровень распознавания для диагноза D_i.

<10 11 121314 15 16 >

Дата добавления: 2015-07-18; просмотров: 2379;