Равновесная ситуация

Пусть матричная игра m×n задана платежной матрицей

= (4.2)

Строки этой матрицы соответствуют стратегиям игрока , а столбцы – стратегиям игрока . В теории игр предполагается, что оба игрока действуют разумно, т.е. стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом. Определим оптимальные стратегии каждого из игроков. Начнем с анализа стратегий игрока . На стратегию игрока игрок ответит такой стратегией , при которой выигрыш игрока будет минимальным. Аналогично игрок B будет отвечать на все m стратегий игрока . Другими словами, найдем в каждой строке матрицы минимальный элемент (минимальные выигрыши игрока )

и запишем их в правом столбце табл. 4.2.

Таблица 4.2.

	…	…	Минимальные выигрыши игрока А
… …
Максимальные выигрыши игрока А

Действуя разумно, игрок остановится на той стратегии , для которой окажется максимальным. Поэтому среди чисел

выбираем максимальное число

(4.3)

Число называется нижней ценой игры.

Принцип построения стратегии игрока , основанный на максимизации минимальных выигрышей, называется принципом максимина (maxmin).

Проведем анализ стратегий игрока . Для этого найдем в каждом столбце матрицы максимальный элемент (максимальные выигрыши игрока ):

и запишем их в нижней строке табл. 4.2. Действуя разумно, игрок B остановится на той стратегии , для которой выбираем минимальное число

(4.4)

Число β называется верхней ценой игры.

Принцип построения стратегии игрока B, основанный на минимизации максимальных выигрышей, называется принципом минимакса (minmax).

Нижняя цена игра α и верхняя цена игра β связаны неравенством

α ≤ β. (4.5)

Если или

(4.6)

то ситуация оказывается равновесной, и ни один игрок не заинтересован в том, чтобы ее нарушить. В том случае, когда верхняя цена игры равна нижней, их называют просто ценой игры.

Если α=β, то такую игру называют также игрой с седловой точкой, а пара оптимальных стратегий – седловой точкой матрицы. Цена игры обозначается буквой v. Тогда .

Седловых точек в матричной игре может быть несколько, но все они имеют одно и то же значение.

Пример 4.2. Игроки и записывают одну из трех цифр: 1, 2 или 3. Затем сравнивают эти цифры и расплачиваются друг с другом так, как показано в платежной матрице размера 3×3 :

Определить оптимальные стратегии.

Решение. Здесь строки соответствуют стратегиям игрока , а столбцы – стратегиям игрока .

Стратегия игрока : ; ; .

Определим оптимальные стратегии каждого из игроков. Начнем с анализа стратегий игрока . Игрок анализирует свою стратегию на максимин (maxmin) , т.е. на максимальный из своих минимальных выигрышей. На стратегию игрока игрок В ответит стратегией , т.е. то стратегией, при которой выигрыш игрока будет минимальным (выигрыш – 2 игрока означает его выигрыш +2). На стратегию игрока игрок В ответит стратегией (минимальный выигрыш игрока равен 1). На стратегию – стратегией (минимальный выигрыш игрока равен –3 ). Запишем минимальный выигрыш игрока А в правом столбце табл. 4.3.

Таблица 4.3.

				Минимальные выигрыши игрока А
	-2	-3	-1	-2 -3
Максимальные выигрыши игрока А

Игрок , проанализировав правый столбец таблицы, оставит свой выбор на стратегии , при которой его минимальный выигрыш максимален. Это максимальное значение называется максимин (maxmin). В данном случае maxmin = 1. Если игрок будет придерживаться этой стратегии, то ему гарантирован выигрыш, не менее 1, при любом поведении противника.

Аналогично проведем анализ стратегий игрока . Игрок В анализирует свою стратегию на минимакс (minmax), т.е. на минимальный из максимальных выигрышей игрока . На стратегию игрока игрок ответит стратегией , т.е. той стратегией, при которой его выигрыш будет максимальным и равен 3. На стратегию игрока игрок ответит стратегией (его максимальный выигрыш равен 2), на стратегию – стратегией (его максимальный выигрыш равен 1). Запишем максимальные выигрыши игрока в нижней строке табл. 5.3. В данном случае minmax = 1. Если игрок В будет придерживаться этой стратегии, то он проиграет не больше 1 при любом поведении противника.

Таким образом, в рассматриваемой игре maxmin и minmax совпали:

maxmin =minmax = 1.

Таким образом, ситуация оказывается равновесной, матрица игры имеет седловую точку

<1 234 5 6 7 >

Дата добавления: 2016-09-20; просмотров: 1043;