Неконтролируемая задача с самообучением

Пусть имеем дискриминантную функцию как g(x), предполагающую линейную аппроксимацию. Функция содержит априори неизвестные коэффициенты, которые в процессе самообучения подбираются таким образом, чтобы в соответствии с выбранным критерием реализовалось оптимальное разделение.

g(x) = k₁×m₁(x) + k₂×m₂(x) + … + k_n×m_n(x),

где m_j(x) – функция, представляющая прошлый опыт, предыстория выборки;

k_j – некоторые коэффициенты, определенные на интервале (0,1).

В процессе классификации значения g(x) непрерывно изменяются в зависимости от характера изменения Х во времени.

В этом случае при отсутствии априорных сведений о Р(х/а) контроль успешности классификации непосредственно невозможен.

Здесь подход: квазиоптимальное разделение на классы с неконтролируемым самообучением путем целенаправленного изменения алгоритма переработки текущей информации, основанного на ее накоплении и дальнейшего уточнения модели явления, с которым система имеет дело.

Здесь критерий – максимум правдоподобия.

Условимся: выборка состоит из независимых элементов и дисперсии обоих классов одинаковы, т.е.:

Плотность вероятности выборки Р(х/а) с независимыми элементами равна:

- это функция правдоподобия выборки

Тогда отношение правдоподобия:

Полагая Р(х/а) – нормальный закон, получим:

Задачу классификации решаем как построение разделяющей функции для некоторого одномерного бимодального распределения, т.е.

где a_w = m-m₀ = m₁-m;

ch – гиперболический косинус.

В общем виде критерий разделения имеет вид:

Оценим максимум правдоподобия:

Из соотношения правдоподобия для бимодального нормального распределения получим:

Отсюда нижняя оценка математического ожидания равна:

Здесь решающая процедура формирует разделяющие функции при неизвестных m₁, m₂, s и нефиксированной выборке эквивалентной построению оптимальной оценки математического ожидания по выборочным значениями случайной величины Х с дисперсией:

где - то удаленность математических ожиданий m₁ и m₀ (в предположении, что s и a известны).

Оценка при всех значениях Х сходится к истинному значению математического ожидания и особенно эффективна при g<1, т.к. в этом случае дисперсия лишь незначительно отличаться от минимально возможной для статистической обработки, т.е.

Эта оценка вычислима еще потому, что прогноз легко учитывает предысторию, т.е.

Если все параметры неизвестны, то оптимальное оценивание проблематично.

Если известно хотя бы m, то его оценка вычисляется как:

Асимптотическая дисперсия такой оценки:

, где

С учетом того, что tanh с большой вероятностью P= 1, то:

, где

Dn = n₁(x_i³ _i) – n₂(x_i³ _i)

n₁ + n₂ = n.

<8 9 10 11 12 1314>

Дата добавления: 2016-01-20; просмотров: 892;