Модели матричных игр со смешанными стратегиями игроков. Свойства смешанных стратегий

Рассмотрим матричную игру:

 

 
 

 

Обозначим через ,…, вероятности, с которыми игрок А использует чистые стратегии , …, . В силу свойств вероятностей:

. (6.3)

Упорядоченное множество р = ( , …, ), элементы которого удовлетворяют условиям (6.3), полностью определяют характер игры игрока А и называется его смешанной стратегией. Итак, смешанной стратегией игрока А является полный набор вероятностей применения его чистых стратегий. Множество смешанных стратегий определяется случайным выбором чистых стратегий. Любая его чистая стратегия А может рассматриваться как частный случай смешанной стратегии, i-я компонента которой равна 1, а остальные равны нулю: р = (0; …; 1; …; 0).

Упорядоченное множество q = ( , …, ), элементы которого удовлетворяют соотношениям , называются смешанной стратегией игрока В.

Применение смешанных стратегий p и q игроками А и В означает, что игрок А использует стратегию с вероятностью , а игрок В – стратегию с вероятностью . Поскольку игроки выбирают свои стратегии случайно и независимо друг от друга, то вероятность выбора комбинации стратегий ( , ) будет равна . При использовании смешанных стратегий игра приобретает случайный характер, поэтому случайными будут и выигрыши игрока А и проигрыши игрока В. Следовательно, можно вести речь лишь о средней величине (математическом ожидании) выигрыша (проигрыша). Эта величина является функцией смешанных стратегий p и q и определяется по формуле:

.

 

Функция f(p; q) называется платежной функцией игры с матрицей .

Смешанные стратегии , назовем оптимальными смешанными стратегиями игроков А и В, если они удовлетворяют неравенству:

(6.4)

для любых стратегий и .

Значение платежной функции при оптимальных стратегиях определяет цену игры v, т. е. .

В седловой точке платежная функция достигает максимума по смешанным стратегиям игрока и минимума по смешанным стратегиям игрока .

Рассмотрим игру с матрицей и предположим, что и – оптимальные смешанные стратегии игроков и – цена игры. Проверку того, что набор является решением, можно провести при помощи теоремы 6.2.

Теорема 6.2. Для того, чтобы смешанные стратегии и , были оптимальными для игроков А и В в игре с матрицей и ценой v, необходимо и достаточно выполнения неравенств:

 

Кроме того, смешенные стратегии удовлетворяют еще следующим теоремам.

Теорема 6.3. В смешанных стратегиях любая конечная матричная игра имеет седловую точку.

Теорема 6.4. Если один из игроков придерживается своей оптимальной смешанной стратегии, то его выигрыш остается неизменным и равным цене игры независимо от того, какую стратегию применяет другой игрок, если только тот не выходит за пределы своих активных стратегий.

Активные стратегии – это чистые стратегии игрока, входящие в оптимальную смешанную стратегию с вероятностями, отличными от нуля.

Из теоремы 6.2 вытекает принципиальное решение матричной игры: надо найти неотрицательное решение ( , , …, , , , …, , v) системы линейных неравенств и линейных уравнений:

; .

Отметим, что число активных стратегий игроков не превышает наименьшего из чисел m и n.

Решение матричной игры можно упростить, если воспользоваться доминированием одних стратегий над другими.

Говорят, что стратегия доминирует над стратегией , если элементы k-й строки не меньше соответствующих элементов s-ой строки: , . Выигрыш игрока А в этом случае (при стратегии ) больше чем при стратегии , какой бы стратегией не воспользовался игрок В. Стратегию назовем доминирующей, а стратегию доминируемой.

Аналогично и для столбцов:

если элементы l-го столбца не превосходят соответствующих элементов r-го столбца: , , то игроку В выгоднее применять стратегию , чем , так как он будет проигрывать меньше. Поэтому стратегия доминирует над стратегией . Стратегия называется доминирующей, стратегия доминируемой.

Если , , или , , то стратегии и , и называются дублирующими.

Пример 6.3. Выполнить возможные упрощения платежной матрицы:

 

Решение. Элементы первой и третьей строки соответственно равны. Поэтому одну из них можно удалить. Элементы второй строки не превышают соответственно элементов первой строки, поэтому удаляем вторую строку и приходим к матрице

Элементы первого столбца преобразованной матрицы больше соответствующих элементов второго столбца, элементы второго столбца больше соответствующих элементов третьего столбца; элементы третьего столбца больше соответствующих элементов четвертого столбца. Поэтому доминируемые первый, второй и третий столбцы опускаем. В результате получаем матрицу

.

Сравнивая строки полученной матрицы, заключаем, что элементы первой строки больше соответствующих элементов второй строки. Следовательно, первая строка является доминирующей. Опуская вторую строку, получаем матрицу , из которой следует, что наилучшей стратегией для игрока является чистая стратегия . Опуская доминируемую стратегию игрока , получаем матрицу . Итак, получили матицу, состоящую из одного элемента. Это объясняется тем, что рассматриваемая матричная игра имеет седловую точку , а полученный элемент 4 является седловым элементом: . Таким образом, в результате упрощения платежной матрицы нашли решение игры: . Такой же результат получим, если вместо стратегии рассмотреть стратегию , поскольку эти стратегии являются дублирующими. Следовательно, оптимальными чистыми стратегиями для игрока являются стратегии или , а для игрока - стратегия , обеспечивающие наибольший выигрыш для игрока , равный 4, и наименьший проигрыш игрока .

Теорема 6.5. Пусть и – оптимальные смешанные стратегии игроков А и В в игре I с матрицей и ценой v. Тогда и будут оптимальными и в игре I' с матрицей и ценой , где .

Воспользовавшись этой теоремой матрицу:

 

 

можно упростить. Сначала разделить элементы матрицы на 100, а затем прибавить к полученным значениям 2:

 

элементы последней матрицы получены по формуле:

 

.








Дата добавления: 2015-09-29; просмотров: 1358;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.019 сек.