Методы решения матричных игр в смешанных стратегиях.
В этой лекции рассматриваются матричные игры, не имеющие седловых точек.
Игры.
Рассмотрим игру с платежной матрицей

Пусть игрок A применяет набор своих оптимальных стратегий
. По основной теореме теории игр это обеспечивает ему выигрыш
при любых стратегиях игрока В, т.е. выполняются соотношения:
(62)
Дополняя их уравнением
(63)
получим систему линейных уравнений относительно
и
. Решая ее найдем
,
,
, (64)
где
.
Повторяя те же рассуждения для игрока В, получим систему линейных уравнений
(65)
Ее решениями будут
,
,
, (66)
Пример.Молокозавод поставляет в магазин молочную продукцию (
) и кисломолочную продукцию (
). Согласно договора между ними продукция поступает в магазин два раза в день: с 10.00 до 11.00 (1-ый срок) и с 17.00 до 18.00 (2-ой срок). Если молокозавод соблюдает сроки поставок, то магазин выплачивает премии по следующей схеме: при поставке продукции
в первый срок выплачивает 5 тыс. руб., во второй срок – 3 тыс. руб.; при поставке продукции
в первый срок выплачивает 2 тыс. руб., во второй срок – 3 тыс. руб. Определить оптимальные стратегии поставок и получения продукции.
Решение. Примем молокозавод за игрока А, а магазин – за игрока В. Составим платежную матрицу игры:
| Сроки Продукция | 1-ый срок | 2-ой срок |
| ||
|
или

Найдем

,
, седловой точки нет. Применим формулы (63) – (65) для определения оптимальных стратегий и цены игры:
,
,
,
,
,
,
Оптимальные стратегии:
,
, цена игры
.
Таким образом, молокозавод поставляет молочную продукцию с вероятностью
, а кисломолочную продукцию – с вероятностью
, а магазин получает продукцию в 1-ый срок с вероятностью
, а во 2-ой срок – с вероятностью
и выплачивает 2,6 тыс. руб. премии молокозаводу ежедневно.
Матричная игра
допускает простую геометрическую интерпретацию.
Нахождение цены игры
и оптимальной стратегии
для игрока А равносильно решению уравнения:
(66)
Для нахождения правой части (66) применим графический метод.
Пусть игрок А выбрал смешанную стратегию
,
, а игрок В – k-ую чистую стратегию,
. Тогда средний выигрыш игрока А окажется равным
при стратегии
(67)
при стратегии
(68)
Очевидно,
, которую называют нижней огибающей прямых I и II.
Нетрудно видеть, что

Таким образом, верхняя точка нижней огибающей –
определяет оптимальную стратегию игрока А:
и цену игры
.
Проиллюстрируем описанный графичексий метод на рассмотренной выше игре с платежной матрицей
.
На плоскости pOz построим две прямые, описываемые уравнениями:
и
или
(I) и
(II).
Решая систему уравнений

найдем
,
,
.
Таким образом, имеем полученный выше ответ игры:
и
.
Теперь покажем как графическим методом найти стратегии игрока В.
(69)
Пусть игрок В выбрал смешанную стратегию
,
, а игрок А – i-ую чистую стратегию,
. Тогда средний выигрыш игрока В окажется равным
при стратегии
(70)
при стратегии
(71)
Очевидно,
, которую называют верхней огибающей прямых III и IV.
Нетрудно видеть, что

Таким образом, нижняя точка верхней огибающей –
определяет оптимальную стратегию игрока В:
и цену игры
.
Для рассмотренной выше гры с матрицей H найдем стратегии игрока В.
На плоскости qOz построим две прямые, описываемые уравнениями:
и
или
(III) и
(IV).
Решая систему уравнений

найдем
,
,
.
Таким образом, имеем
и
.
Замечания. На практике оптимальную стратегию игрока В, если оптимальная стратегия игрока А, следовательно, и цена игры известны, находят приравниванием любого из двух средних выйгрышей игрока В к цене игры:
или
.
Для рассмотренного примера такими уравнениями будут
или 
Аналогично находят оптимальную стратегию игрока А, если известна оптимальная стратегия игрока В.
Дата добавления: 2015-02-03; просмотров: 1053;
