Решение и геометрическая интерпретация игры (2x2).
Если игра (2х2) имеет седловую точку, то ее решение очевидно. Пусть игра без седловой точки с платежной матрицей (aij)2x2. Требуется найти оптимальные смешанные стратегии игроков и и цену игры g. В игре (2х2) без седловой точки обе стратегии игроков являются активными. Поэтому в соответствии с теоремой об активных стратегиях, если игрок А будет применять свою оптимальную смешанную стратегию, то независимо от действия игрока В, выигрыш его будет равен цене игры g.
Пусть игрок А использует стратегию , а игрок В – стратегию В1. Тогда выигрыш игрока А определяется из уравнения
.
Если же игрок В будет применять стратегию В2, то выигрыш игрока А не изменится и будет определяться равенством
.
Принимая во внимание условие , можно записать систему уравнений с тремя неизвестными величинами:
,
, (1)
.
Решив эту систему уравнений, находим оптимальную смешанную стратегию игрока А, т.е. и .
Аналогично определяется оптимальная стратегия игрока В из системы уравнений:
,
, (2)
.
В результате решения системы уравнений (2) находятся вероятности и , т.е. оптимальная стратегия .
Игра (2х2) допускает простую геометрическую интерпретацию. Для этого в системе координат хОу на оси абсцисс откладывается отрезок [А1,А2], равный единице, и через концы этого отрезка проводятся перпендикулярные к оси абсцисс прямые, на которых откладываются выигрыши игрока А (рис.1).
Левый перпендикуляр, совпадающий с осью ординат, соответствует стратегии А1, для которой Р1=1, Р2=0, а правый равен стратегии А2, для которой Р1=0, Р2=1. При применении игроком В стратегии В1 выигрыш будет а11, если игрок А использует стратегию А1, и будет а21, если он применяет стратегию А2. Отложив отрезки, равные а11 и а21 на соответствующих перпендикулярах получим две точки: В1 соответствующий стратегии А1 и В1 соответствующий стратегии А2. Ордината любой точки отрезка В1В2 равна величине выигрыша игрока А при применении им стратегии А1 и А2 с вероятностями Р1 и Р2.
Если игрок В применяет стратегию В2, то выигрыш игрока А равен а12 при использовании стратегии А1, и а22 – стратегии А2. Ординаты точек, лежащие на отрезке В2В2, равны среднему выигрышу игрока А, если он применяет стратегии А1 и А2 с вероятностями Р1 и Р2, а противник -–стратегию В2.
Для нахождения оптимальной стратегии построим нижнюю границу выигрыша игрока А, т.е. ломаную В2NB1, отмеченную на рис.1 линией. Очевидно, что на этой ломанной лежат минимальные выигрыши игрока А при использовании им любой смешанной стратегии.
Оптимальное решение игры определяет точка N, в которой выигрыш игрока А принимает наибольшее значение (проигрыш игрока В наименьшее значение) равный цене игры g. Проекция этой точки на ось абсцисс соответствует оптимальной стратегии , при этом расстояния от точки до концов единичного отрезка на оси абсцисс равны вероятностям и .
Оптимальная стратегия игрока В находится аналогично. Для этого необходимо поменять местами игроков А и В. (см. рис.2)
На рис.1 и 2 решение игры определялось точкой пересечения стратегий, однако это справедливо не всегда. Так, например на рис.3 показан случай, когда нижняя граница выигрыша игрока А совпадает с отрезком В2В2, т.е. стратегия В1 для игрока В заведомо не выгодная. Здесь , игра имеет седловую точку.
На рис.4 показан случай, в котором , . Игра имеет седловую точку.
Дата добавления: 2016-05-16; просмотров: 661;