Модели матричных игр со смешанными стратегиями игроков. Свойства смешанных стратегий
Рассмотрим матричную игру:
![]() ![]() | ![]() | ![]() | … | ![]() | … | ![]() | ![]() |
![]() | ![]() | ![]() | … | ![]() | ![]() | ![]() | |
![]() | ![]() | ![]() | … | ![]() | … | ![]() | ![]() |
… | … | … | … | … | … | … | … |
![]() | ![]() | ![]() | … | ![]() | … | ![]() | ![]() |
… | … | … | … | … | … | … | … |
![]() | ![]() | ![]() | … | ![]() | … | ![]() | ![]() |
![]() | ![]() | ![]() | … | ![]() | … | ![]() |
Обозначим через ,…,
вероятности, с которыми игрок А использует чистые стратегии
, …,
. В силу свойств вероятностей:
. (6.3)
Упорядоченное множество р = ( , …,
), элементы которого удовлетворяют условиям (6.3), полностью определяют характер игры игрока А и называется его смешанной стратегией. Итак, смешанной стратегией игрока А является полный набор вероятностей применения его чистых стратегий. Множество смешанных стратегий определяется случайным выбором чистых стратегий. Любая его чистая стратегия А
может рассматриваться как частный случай смешанной стратегии, i-я компонента которой равна 1, а остальные равны нулю: р = (0; …; 1; …; 0).
Упорядоченное множество q = ( , …,
), элементы которого удовлетворяют соотношениям
, называются смешанной стратегией игрока В.
Применение смешанных стратегий p и q игроками А и В означает, что игрок А использует стратегию с вероятностью
, а игрок В – стратегию
с вероятностью
. Поскольку игроки выбирают свои стратегии случайно и независимо друг от друга, то вероятность выбора комбинации стратегий (
,
) будет равна
. При использовании смешанных стратегий игра приобретает случайный характер, поэтому случайными будут и выигрыши игрока А и проигрыши игрока В. Следовательно, можно вести речь лишь о средней величине (математическом ожидании) выигрыша (проигрыша). Эта величина является функцией смешанных стратегий p и q и определяется по формуле:
.
Функция f(p; q) называется платежной функцией игры с матрицей .
Смешанные стратегии ,
назовем оптимальными смешанными стратегиями игроков А и В, если они удовлетворяют неравенству:
(6.4)
для любых стратегий и
.
Значение платежной функции при оптимальных стратегиях определяет цену игры v, т. е.
.
В седловой точке платежная функция
достигает максимума по смешанным стратегиям
игрока
и минимума по смешанным стратегиям
игрока
.
Рассмотрим игру с матрицей и предположим, что
и
– оптимальные смешанные стратегии игроков и
– цена игры. Проверку того, что набор
является решением, можно провести при помощи теоремы 6.2.
Теорема 6.2. Для того, чтобы смешанные стратегии и
, были оптимальными для игроков А и В в игре с матрицей
и ценой v, необходимо и достаточно выполнения неравенств:
Кроме того, смешенные стратегии удовлетворяют еще следующим теоремам.
Теорема 6.3. В смешанных стратегиях любая конечная матричная игра имеет седловую точку.
Теорема 6.4. Если один из игроков придерживается своей оптимальной смешанной стратегии, то его выигрыш остается неизменным и равным цене игры независимо от того, какую стратегию применяет другой игрок, если только тот не выходит за пределы своих активных стратегий.
Активные стратегии – это чистые стратегии игрока, входящие в оптимальную смешанную стратегию с вероятностями, отличными от нуля.
Из теоремы 6.2 вытекает принципиальное решение матричной игры: надо найти неотрицательное решение ( ,
, …,
,
,
, …,
, v) системы
линейных неравенств и линейных уравнений:
;
.
Отметим, что число активных стратегий игроков не превышает наименьшего из чисел m и n.
Решение матричной игры можно упростить, если воспользоваться доминированием одних стратегий над другими.
Говорят, что стратегия доминирует над стратегией
, если элементы k-й строки не меньше соответствующих элементов s-ой строки:
,
. Выигрыш игрока А в этом случае (при стратегии
) больше чем при стратегии
, какой бы стратегией не воспользовался игрок В. Стратегию
назовем доминирующей, а стратегию
– доминируемой.
Аналогично и для столбцов:
если элементы l-го столбца не превосходят соответствующих элементов r-го столбца: ,
, то игроку В выгоднее применять стратегию
, чем
, так как он будет проигрывать меньше. Поэтому стратегия
доминирует над стратегией
. Стратегия
называется доминирующей, стратегия
– доминируемой.
Если ,
, или
,
, то стратегии
и
,
и
называются дублирующими.
Пример 6.3. Выполнить возможные упрощения платежной матрицы:
Решение. Элементы первой и третьей строки соответственно равны. Поэтому одну из них можно удалить. Элементы второй строки не превышают соответственно элементов первой строки, поэтому удаляем вторую строку и приходим к матрице
Элементы первого столбца преобразованной матрицы больше соответствующих элементов второго столбца, элементы второго столбца больше соответствующих элементов третьего столбца; элементы третьего столбца больше соответствующих элементов четвертого столбца. Поэтому доминируемые первый, второй и третий столбцы опускаем. В результате получаем матрицу
.
Сравнивая строки полученной матрицы, заключаем, что элементы первой строки больше соответствующих элементов второй строки. Следовательно, первая строка является доминирующей. Опуская вторую строку, получаем матрицу , из которой следует, что наилучшей стратегией для игрока
является чистая стратегия
. Опуская доминируемую стратегию
игрока
, получаем матрицу
. Итак, получили матицу, состоящую из одного элемента. Это объясняется тем, что рассматриваемая матричная игра имеет седловую точку
, а полученный элемент 4 является седловым элементом:
. Таким образом, в результате упрощения платежной матрицы нашли решение игры:
. Такой же результат получим, если вместо стратегии
рассмотреть стратегию
, поскольку эти стратегии являются дублирующими. Следовательно, оптимальными чистыми стратегиями для игрока
являются стратегии
или
, а для игрока
- стратегия
, обеспечивающие наибольший выигрыш для игрока
, равный 4, и наименьший проигрыш игрока
.
Теорема 6.5. Пусть и
– оптимальные смешанные стратегии игроков А и В в игре I с матрицей
и ценой v. Тогда
и
будут оптимальными и в игре I' с матрицей
и ценой
, где
.
Воспользовавшись этой теоремой матрицу:
можно упростить. Сначала разделить элементы матрицы на 100, а затем прибавить к полученным значениям 2:
элементы последней матрицы получены по формуле:
.
Дата добавления: 2015-09-29; просмотров: 1402;