Решение игр в смешанных стратегиях

Если в игре верхняя и нижняя цена не совпадают ( a не равно b ), то зна-

чит, что седловой точки нет, но можно улучшить средний выигрыш игроков

А и В путем смешивания их стратегий. Это значит, что игрок А, каждый раз

играя игру, чередует свои чистые стратегии A1A2 ..........Am . Вопрос состоит

в том, какова должна быть доля случаев применения стратегий игроков.

Назовем смешанной стратегией игрока А вектор ( ) SA = p1 , p2 ,K, pm , в

котором показаны вероятности применения соответствующих стратегий. На-

пример: SA (0,1; 0,2; 0,7; 0) = , p 1

i 1

i = Σ=

- свойство полноты.__ Аналогично для игрока В получаем: SB = (q1 , q2 ,K,qm ), 1

j Σ =

Заметим, что чистая стратегия – это частный случай смешанной страте-

гии. A3 SA (0, 0,1, 0) = = .

Справедлива основная теорема теории игр: любая матричная игра имеет

решение в виде пары смешанных стратегий игроков А и В ( * )

SA ;S , дающих

оптимальное значение цены игры V*. Это оптимальное решение обладает

следующим свойством: если один игрок придерживается своей оптимальной

стратегии, то другому невыгодно отклоняться от своей оптимальной страте-

гии.

8.4. Упрощение игр и аналитическое решение игр 2×2

Прежде чем решать игру, ее необходимо упростить, т. е. если для игры

построена платежная матрица, можно вычеркнуть заведомо невыгодные

стратегии для игроков А и В.

Таблица 45

Здесь A2 уступает по всем компонентам A1, а B1 уступает и B2, и B3. За-

метим, что строки лучше, если элементы больше, а столбцы лучше, если

элементы меньше.

Если по каждой компоненте стратегии одна строка хуже другой, то ее

можно вычеркнуть. При этом решение игры упрощается.

В результате остаются такие строки и столбцы, которые нельзя сравнить.

Если число оставшихся стратегий хотя бы одного игрока равно двум, то игру

можно решить аналитически или геометрически.

Рассмотрим игры, в которых у каждого игрока лишь две стратегии. Если

в такой игре нет седловой точки, то значит, что все стратегии активны, т. е.

они войдут в решение с какой-то вероятностью, не равной нулю.

Справедлива теорема об активных стратегиях: если один из игроков при-

держивается своей оптимальной смешанной стратегии, то выигрыш остается

неизменным и равен цене игры V независимо от того, что делает другой иг-

рок, если только тот не выходит за пределы своих ак

Это чрезвычайно развитая область в экономике, в военном деле, в области обработки информации на фоне шумов и т. д. Рассмотрим элементы этой теории как продолжение теории игр.

Существуют задачи, в которых B - «бессознательный игрок», который мешает нам принимать правильные решения, но он не противодействует активно, а действует в соответствии с природными случайными явлениями, поэтому такую ситуацию называют игрой с природой. Например, помехи в канале связи для передачи информации, шумы при записи или воспроизведении звука и т. д. Ясно что бессознательное воздействие в целом вредит нам меньше, чем сознательное. С другой стороны эта «бессознательность» приводит к непредсказуемому поведению операции. Можно считать ,что как и в теории игр мы боремся с противником, который не осознанно мешает нам. Например, это погодные условия, или случайный спрос при продаже товара. Вот почему в теории статистических решений, главной проблемой является обоснование принципов оценки различных ситуаций со стороны A. Заметим, что в теории игр был один принцип – принцип минимакса.

Таблица 1

	P1	P2		Pn
A1	a11	a12	a1n
A2	a21	a22	a2n


Am	am1	am2	amn

Мы будем рассматривать дискретные альтернативы (стратегии) природы. Тогда, если у A имеется m стратегий, а у «природы» имеется n альтернатив, то может быть получена матрица выигрышей, при применении каждой пары Ai Pj.

Условия Pj иногда называются гипотезами. Если платежная матрица построена, то задача состоит в анализе матрицы с целью получить стратегию Ai, которая наиболее выгодна по отношению к другим. В простейшем случае, если какие-то строки матрицы заведомо невыгодны, то их можно отбросить и оставить только одну, безусловно лучшую. Столбцы платёжной матрицы нельзя отбрасывать, т. к. условия «природы» могут быть и в нашу пользу. При анализе платёжной матрицы можно сделать неверный вывод о качестве

нашего решения.

Пусть сравниваются два выигрыша, находящихся в разных столбцах aij и akl, причём j≠l. Если aij>akl, то вроде бы решение в i- строке лучше, чем решение в k- строке, но так просто можно сравнивать, если выигрыш соответствует одинаковым условиям.

Пример: Пусть в Томской области, приняв определенные управляющие решения, получили урожайность пшеницы 20 центнеров с гектара, а в Краснодарском крае - 25. Эти значения сравнивать нельзя, т. к. для Томской области это может быть рекордный (наилучший) результат, а для Краснодарского края – плохой, т.к. рекорд 50 . Решение нужно сравнивать с потенциальными возможностями.

Вот почему необходимо преобразовывать платёжную матрицу таким образом, чтобы каждый наш выигрыш соотносился с тем максимумом, который можно достигнуть в данных условиях Pj Для каждого Pj можно найти максимальную величину βj и вычислить величину rij = βj - aij называемую риском. Здесь

Чем риск меньше, тем лучше.

<1 2 345 6 7 >

Дата добавления: 2015-11-06; просмотров: 811;