Равновесная ситуация
Пусть матричная игра m×n задана платежной матрицей
=
(4.2)
Строки этой матрицы соответствуют стратегиям игрока
, а столбцы – стратегиям игрока
. В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом. Определим оптимальные стратегии каждого из игроков. Начнем с анализа стратегий игрока
. На стратегию
игрока
игрок
ответит такой стратегией
, при которой выигрыш игрока
будет минимальным. Аналогично игрок B будет отвечать на все m стратегий игрока
. Другими словами, найдем в каждой строке матрицы минимальный элемент (минимальные выигрыши игрока
)

и запишем их в правом столбце табл. 4.2.
Таблица 4.2.
|
| … |
| … |
| Минимальные выигрыши игрока А | |
…
…
|
|
|
|
|
|
|
|
| Максимальные выигрыши игрока А |
|
|
|
|
|
|
Действуя разумно, игрок
остановится на той стратегии
, для которой
окажется максимальным. Поэтому среди чисел 
выбираем максимальное число
(4.3)
Число
называется нижней ценой игры.
Принцип построения стратегии игрока
, основанный на максимизации минимальных выигрышей, называется принципом максимина (maxmin).
Проведем анализ стратегий игрока
. Для этого найдем в каждом столбце матрицы максимальный элемент (максимальные выигрыши игрока
):

и запишем их в нижней строке табл. 4.2. Действуя разумно, игрок B остановится на той стратегии
, для которой
выбираем минимальное число
(4.4)
Число β называется верхней ценой игры.
Принцип построения стратегии игрока B, основанный на минимизации максимальных выигрышей, называется принципом минимакса (minmax).
Нижняя цена игра α и верхняя цена игра β связаны неравенством
α ≤ β. (4.5)
Если
или
(4.6)
то ситуация
оказывается равновесной, и ни один игрок не заинтересован в том, чтобы ее нарушить. В том случае, когда верхняя цена игры равна нижней, их называют просто ценой игры.
Если α=β, то такую игру называют также игрой с седловой точкой, а пара оптимальных стратегий
– седловой точкой матрицы. Цена игры обозначается буквой v. Тогда
.
Седловых точек в матричной игре может быть несколько, но все они имеют одно и то же значение.
Пример 4.2. Игроки
и
записывают одну из трех цифр: 1, 2 или 3. Затем сравнивают эти цифры и расплачиваются друг с другом так, как показано в платежной матрице размера 3×3 :
= 
Определить оптимальные стратегии.
Решение. Здесь строки соответствуют стратегиям игрока
, а столбцы – стратегиям игрока
.
Стратегия игрока
:
;
;
.
Стратегия игрока
:
;
;
.
Определим оптимальные стратегии каждого из игроков. Начнем с анализа стратегий игрока
. Игрок
анализирует свою стратегию на максимин (maxmin) , т.е. на максимальный из своих минимальных выигрышей. На стратегию
игрока
игрок В ответит стратегией
, т.е. то стратегией, при которой выигрыш игрока
будет минимальным (выигрыш – 2 игрока
означает его выигрыш +2). На стратегию
игрока
игрок В ответит стратегией
(минимальный выигрыш игрока
равен 1). На стратегию
– стратегией
(минимальный выигрыш игрока
равен –3 ). Запишем минимальный выигрыш игрока А в правом столбце табл. 4.3.
Таблица 4.3.
|
|
| Минимальные выигрыши игрока А | |
| -2 | -3 | -1 | -2 -3 |
| Максимальные выигрыши игрока А |
Игрок
, проанализировав правый столбец таблицы, оставит свой выбор на стратегии
, при которой его минимальный выигрыш максимален. Это максимальное значение называется максимин (maxmin). В данном случае maxmin = 1. Если игрок
будет придерживаться этой стратегии, то ему гарантирован выигрыш, не менее 1, при любом поведении противника.
Аналогично проведем анализ стратегий игрока
. Игрок В анализирует свою стратегию на минимакс (minmax), т.е. на минимальный из максимальных выигрышей игрока
. На стратегию
игрока
игрок
ответит стратегией
, т.е. той стратегией, при которой его выигрыш будет максимальным и равен 3. На стратегию
игрока
игрок
ответит стратегией
(его максимальный выигрыш равен 2), на стратегию
– стратегией
(его максимальный выигрыш равен 1). Запишем максимальные выигрыши игрока
в нижней строке табл. 5.3. В данном случае minmax = 1. Если игрок В будет придерживаться этой стратегии, то он проиграет не больше 1 при любом поведении противника.
Таким образом, в рассматриваемой игре maxmin и minmax совпали:
maxmin =minmax = 1.
Таким образом, ситуация оказывается равновесной, матрица игры имеет седловую точку
.
Дата добавления: 2016-09-20; просмотров: 1012;

…
…