Правила выбора оптимальной стратегии
Перед выбором оптимальной стратегии статистической игры, упрощают платежную матрицу, пользуясь доминированием стратегий статистика. Доминированием стратегий природы пользоваться нельзя, так как состояние природы объективно, независимо от того, выгодно оно статистику или нет. После упрощения платежной матрицы переходят к матрице рисков, которая позволит выявить преимущество одной стратегии по сравнению с другой при данном состоянии природы. Например, если , то это не означает, что строка лучше строки , так как состояние может быть более благоприятным для статистика, чем . Эту ситуацию может прояснить анализ матрицы рисков.
Риском статистика, когда он пользуется чистой стратегией при состоянии природы, называем разность между максимальным выигрышем , который статистик мог бы получить, достоверно зная, что природой будет реализовано состояние , и тем выигрышем , который он получит, используя стратегию , не зная, какое из состояний реализует природа.
Таким образом, ( – максимальный элемент j-го столбца). Матрица рисков:
… | ||
… | ||
…. | … … … | … |
… | ||
… |
Матрица рисков для рассматриваемого примера:
= 0 | = 10 | = 20 | |
= 7 | = 0 | = 10 | |
= 14 | = 7 | = 0 |
Рассмотрим критерии выбора оптимальной стратегии статистика с использованием вероятностей состояния природы. В критериях используют:
– среднее значение выигрыша:
= ; (7.1)
определяется для каждой чистой стратегии , ..., ;
– среднее значение риска:
= , (7.2)
которое находят по матрице рисков.
Критерий Байеса. Оптимальной считается стратегия , при которой максимизируется средний выигрыш статистика, т. е. обеспечивается max , .
Вернемся к рассматриваемому примеру и предположим, что вероятности , , потребления сырья в количествах 20, 21 и 22 единиц соответственно равны 0,3; 0,2; и 0,5. Используя формулу (7.1), находим = значение средних выигрышей. Составим таблицу:
0 –10 –20 | –7,0 | |
–7 0 –10 | –7,1 | |
–14 –7 0 | –5,6 | |
0,3 0,2 0,5 |
Из таблицы видим, что максимальной величины «–5,6» средний выигрыш достигает при стратегии , которая предусматривает запасать 22 единицы сырья. Оптимальной стратегий будет стратегия (по Байесу).
Вычислим среднее значение рисков по формуле (7.2), и составим матрицу рисков:
0 10 20 | 7,0 | |
7 0 10 | 7,1 | |
14 7 0 | 5,6 | |
0,3 0,2 0,5 |
В этом случае риск нужно минимизировать. Минимальный риск соответствует стратегии .
Из примера следует, что стратегия, максимизирующая средний выигрыш, совпадает со стратегией, минимизирующей средний риск.
Критерий Лапласа. Если статистик А не располагает определенными вероятностями , …, состояний природы , то их вероятности полагают равными, т. е. = = … = = . Оптимальной считают такую стратегию, при которой обеспечивается = .
Если состояние природы можно оценить по степени их правдоподобия, то вероятности реализации состояний считают пропорциональными членам убывающей арифметической прогрессии:
и значения определяют по формуле:
, j = 1, 2, …, n.
Если вероятности состояний природы неизвестны, то для выбора оптимальной стратегии статистика можно использовать критерий Вальда.
Критерий Вальда. Статистик выбирает такую чистую стратегию , при которой наименьший выигрыш будет максимальным, т.е. обеспечивается максимин:
так как статистик исходит из предложения, что природа действует против него наихудшим образом.
Для рассматриваемого примера:
Следовательно, оптимальной по Вальду будет стратегия , так как запас сырья на предприятии должен составлять 21 единицу, при этом дополнительные затраты будут равны 7 ед.
Оптимальной смешанной стратегией статистика по критерию Вальда считают ту, при которой его минимальный средний выигрыш будет max. Смешанная стратегия находится из условия .
Для рассматриваемого примера оптимальная по Вальду смешанная стратегия определяется решением линейной оптимизационной модели:
;
Решение в смешанных стратегиях целесообразнее, чем в чистых стратегиях.
Критерий Сэвиджа. Оптимальной чистой стратегией будет та чистая стратегия , при которой минимизируется величина максимального риска, т. е. достигается .
Для нашего примера:
0 10 20 | ||
7 0 10 | ||
14 7 0 |
оптимальной по Сэвиджу будет чистая стратегия , так как
.
Оптимальной смешанной стратегией по критерию Сэвиджа считают ту смешанную стратегию , при которой максимальное значение среднего риска минимизируется, т. е. обеспечивается выполнение условия:
.
Критерий Гурвица. Оптимальной чистой стратегией будет та чистая стратегия, для которой , где (0; 1) и выбирается из субъективных соображений.
При = 1 критерий Гурвица превращается в критерий Вальда: ; при = 0 – в критерий крайнего оптимизма: ; при получаем критерий пессимизма-оптимизма. Значение выбирают исходя из опыта или из субьективных соображений.
Положив в нашем примере = 0,7, получим:
.
Все результаты приведены в таблице.
0,7 | 0,3 | |||||
0 10 20 | –20 | –14 | –14 | |||
7 0 10 | –10 | –7 | –7 | |||
14 7 0 | –14 | –9,8 | –9,8 |
Из последнего столбца следует, что оптимальной стратегией является чистая стратегия .
В заключение подчеркнем, что выбор чистой стратегии следует проводить по нескольким критериям. Решение статистической игры по рассмотренным критериям позволяет более обоснованно принимать ту стратегию, которая гарантирует статистику больший выигрыш.
Дата добавления: 2015-09-29; просмотров: 1301;