Решение и геометрическая интерпретация игры (2x2).

Если игра (2х2) имеет седловую точку, то ее решение очевидно. Пусть игра без седловой точки с платежной матрицей (aij)2x2. Требуется найти оптимальные смешанные стратегии игроков и и цену игры g. В игре (2х2) без седловой точки обе стратегии игроков являются активными. Поэтому в соответствии с теоремой об активных стратегиях, если игрок А будет применять свою оптимальную смешанную стратегию, то независимо от действия игрока В, выигрыш его будет равен цене игры g.

Пусть игрок А использует стратегию , а игрок В – стратегию В1. Тогда выигрыш игрока А определяется из уравнения

.

Если же игрок В будет применять стратегию В2, то выигрыш игрока А не изменится и будет определяться равенством

.

Принимая во внимание условие , можно записать систему уравнений с тремя неизвестными величинами:

,

, (1)

.

Решив эту систему уравнений, находим оптимальную смешанную стратегию игрока А, т.е. и .

Аналогично определяется оптимальная стратегия игрока В из системы уравнений:

 

 

,

, (2)

.

В результате решения системы уравнений (2) находятся вероятности и , т.е. оптимальная стратегия .

Игра (2х2) допускает простую геометрическую интерпретацию. Для этого в системе координат хОу на оси абсцисс откладывается отрезок [А12], равный единице, и через концы этого отрезка проводятся перпендикулярные к оси абсцисс прямые, на которых откладываются выигрыши игрока А (рис.1).

 
 

Левый перпендикуляр, совпадающий с осью ординат, соответствует стратегии А1, для которой Р1=1, Р2=0, а правый равен стратегии А2, для которой Р1=0, Р2=1. При применении игроком В стратегии В1 выигрыш будет а11, если игрок А использует стратегию А1, и будет а21, если он применяет стратегию А2. Отложив отрезки, равные а11 и а21 на соответствующих перпендикулярах получим две точки: В1 соответствующий стратегии А1 и В1 соответствующий стратегии А2. Ордината любой точки отрезка В1В2 равна величине выигрыша игрока А при применении им стратегии А1 и А2 с вероятностями Р1 и Р2.

Если игрок В применяет стратегию В2, то выигрыш игрока А равен а12 при использовании стратегии А1, и а22 – стратегии А2. Ординаты точек, лежащие на отрезке В2В2, равны среднему выигрышу игрока А, если он применяет стратегии А1 и А2 с вероятностями Р1 и Р2, а противник -–стратегию В2.

Для нахождения оптимальной стратегии построим нижнюю границу выигрыша игрока А, т.е. ломаную В2NB1, отмеченную на рис.1 линией. Очевидно, что на этой ломанной лежат минимальные выигрыши игрока А при использовании им любой смешанной стратегии.

Оптимальное решение игры определяет точка N, в которой выигрыш игрока А принимает наибольшее значение (проигрыш игрока В наименьшее значение) равный цене игры g. Проекция этой точки на ось абсцисс соответствует оптимальной стратегии , при этом расстояния от точки до концов единичного отрезка на оси абсцисс равны вероятностям и .

Оптимальная стратегия игрока В находится аналогично. Для этого необходимо поменять местами игроков А и В. (см. рис.2)

 
 

       
 
   
 

На рис.1 и 2 решение игры определялось точкой пересечения стратегий, однако это справедливо не всегда. Так, например на рис.3 показан случай, когда нижняя граница выигрыша игрока А совпадает с отрезком В2В2, т.е. стратегия В1 для игрока В заведомо не выгодная. Здесь , игра имеет седловую точку.

На рис.4 показан случай, в котором , . Игра имеет седловую точку.








Дата добавления: 2016-05-16; просмотров: 661;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.007 сек.