Для оценки плотности в некоторой точке методом “парзеновского окна” подсчитывается количество объектов, попадающих в фиксированную малую окрестность .
Эта окрестность
выбирается таким образом, что с увеличением N ее объем VN уменьшается. Если при N®¥ VN®0, k®¥ и k/N®0, то оценка плотности в точке
является состоятельной.
Этим условиям удовлетворяют многие виды зависимостей, например:
;
и т.д.
Тогда 
Средняя эмпирическая плотность
в окрестности точки используется также и для оценки плотности методом “KN ближайших соседей”. Только в отличие от метода “парзеновского окна” (где к – величина случайная) здесь “KN ближайших соседей” определяются как функция от N, причем окрестность
берется таких размеров, чтобы включать ровно KN ближайших объектов.
В зависимости от значений KN к N предъявляются аналогичные требования:
- при N®¥ необходимо, чтобы KN®¥ и KN®0, именно это обеспечивает сходимость оценки в точке
;
- при определении KN можно использовать те же функции, т.е. KN=LnN,
и т.д.
Методы “парзеновского окна” и “обобщенной гистограммы” являются
по сути дела “локальными” аналогами гистограмм, построенных соответственно при равных интервалах разбиения и при условии попадания в них примерно одинакового числа реализаций.
Основное неудобство:
- неопределенность в выборе зависимостей VN от N и KN от N;
- методы непараметрического оценивания в целом хороши только при
достаточно больших выборках (при малых выборках об их качествах трудно что-либо утверждать).
На практике часто прибегают к эвристическому конструированию
(формированию) функций плотности
, j=1,…,n, I=1,…,m и функций P(Qi), основанному на экспертных оценках:
- определяется группа экспертов (веса для которых Bk, k=1,…,t),
оценивающих возможные значения признаков xj объектов всех классов;
- каждый из экспертов Ак сообщает значение признака как CK(Xj/Qi), при
этом некоторые из значений признака xj объектов класса Qi, указанные разными экспертами, могут совпадать, т.е. Cg(Xj/Qi) = Cq(Xj/Qi), g,qÎ1,…,t; кроме того некоторые эксперты могут указать на несколько возможных значений признака Xj в i-том классе Qi, т.е.:
,
и т.д.;
необходимо учитывать также, что некоторые эксперты “промолчат” (указания
отсутствуют);
- определяется усредненный вес мнений экспертов группы L0(Xj/Qi):

AkÎLn(Xj/Qi)
где Ln(Xj/Qi) – группа экспертов; n = 1,…,r(Xj/Qi);
L0(Xj/Qi) – число экспертов в группе Ln;
Алгоритм: группа экспертов Ln(Xj/Qi) указала, что значение признака Xj в классе Qi составляет Сn(Xj/Qi).
Следствие: Статистическая вероятность того, что значение признака Xj у объектов, принадлежащих классу Qi равна величине Сn(Xj/Qi) указанной группой экспертов Ln(Xj/Qi), пропорциональна усредненному весу мнений этой группы, т.е.:
Это соотношение позволяет сформировать статистические ряды:

а на их основе путем сглаживания определить оценки искомых функций распределения вероятностей
.
Метод определения функций P(Qi) аналогичен.
Следствие: Таким образом, эвристический подход к формированию априорных сведений основывается на обработке результатов опроса группы экспертов с учетом их авторитета (веса).
Дата добавления: 2016-01-20; просмотров: 1150;
