Состояние природы (среды)

Введение понятия альтернатив и исходов недостаточно для полного описания процесса принятия решений. Дело в том, что неясно как действия (альтернативы) связаны с исходами. Связь между действиями и исходами обеспечивается “состоянием природы”.

S = {s₁, s₂, ...,s_i, ...}

Пример: Выборы между двумя кандидатами. Альтернативы: за, против, воздержался.

Связь между действиями и исходами, опосредованная состояниями природы представлена в следующей таблице:

	s₁	s₂	s₃	s₄	s₅
a₁: голос за 1	r₂: побеждает 2	r₃: ничья	r₁: побеждает 1	r₁: побеждает 1	r₁: побеждает 1
a₂: голос за 2	r₂: побеждает 2	r₂: побеждает 2	r₂: побеждает 2	r₃: ничья	r₁: побеждает 1
a₃: воздержался	r₂: побеждает 2	r₂: побеждает 2	r₃: ничья	r₁: побеждает 1	r₁: побеждает 1

Если превалирует ситуация s₁ или s₅, то от конкретного голосующего гражданина ничего не зависит: он может голосовать как угодно. Если же, однако, превалирует ситуация s₃, т.е. голоса распределяются между кандидатами примерно поровну, то голос гражданина становится решающим: от него напрямую зависит исход.

Таким образом, информация о превалирующем состоянии среды оказывается чрезвычайно важной при выборе действия. Качество же этой информации может варьировать от полной определенности до полного отсутствия таковой. Простейшим случаем является принятие решения в условиях определенности, т.е. в ситуации, когда заведомо известно, к какому исходу приведет то или иное действие. Более сложным случаем является принятие решений в условиях риска. При отсутствии точной информации о состоянии природы осмысленность выбору может придать лишь приблизительная информация, а именно, в этом случае предполагается, что игрок может хотя бы оценивать вероятность того, что то или иное состояние природы окажется превалирующим.

В случае полной информации принятие решений не составляет труда. Если имеется хорошо определенный порядок предпочтений на множестве исходов, то следует просто выбрать действие, приводящее к наиболее предпочтительному исходу.

Предпочтения

Слабое и сильное предпочтения. Будем писать , если исход r₁ для игрока i по крайней мере не хуже чем r₂. (слабое предпочтение)

Предположение 1 (полнота): Для любых двух исходов либо либо .

Предположение 2 (транзитивность): Для любых трех исходов если и , то .

Индифферентность: исходы r₁ и r₂ одинаково предпочтительны , если и одновременно.

Строгое (сильное) предпочтение означает наличие слабого предпочтения при отсутствии индифферентности: .

Предположения о полноте (1) и транзитивности (2) не так просты и очевидны, как может показаться на первый взгляд.

Предположим, вы очень любите классическую музыку. Что вы предпочитаете: взбитые сливки с шоколадом или прелюдию Баха?

Предположим, я предпочитаю чай без сахара, но не могу отличить разницу в сладости, если она составляет одну крупинку сахара на стакан. Тогда получается следующее (цифры будут обозначать число крупинок сахара): .

Но при достаточно большом числе n я безусловно отличу сладкий чай от несладкого. Так что транзитивности здесь нет. Благодаря таким примерам часто рассматривается альтернативное предположение, согласно которому только строгое предпочтение считается транзитивным.

Функция полезности

Отношения индифферентности, слабого и сильного предпочтения, рассмотренные выше, удобны для конечных множеств. Но для бесконечных множеств, таких как бюджетный симплекс, они становятся неудобными. В то же время, очевидна близость этих отношений к математическим отношениям {=, ≥, >}, выражающим отношения между числами. Хорошо бы использовать эти математические отношения для выражения отношения предпочтения между альтернативами или исходами. Для этого можно ввести функцию, которая ставила бы в соответствие каждому исходу некоторое действительное число, причем так, что более предпочтительному исходу соответствовало бы большее число.

Такая функция называется функцией полезности (она вводится неоднозначно!). Функция полезности u(r) определена на множестве исходов R и удовлетворяет следующему условию:

для любых u(r₁)>u(r₂) тогда и только тогда, когда .

Пример: бюджетный симплекс. Исходом в данном случае является тройка r=(x₁, x₂, x₃), соответствующая дележу денег между тремя кандидатами. Определим функции полезности для каждого из кандидатов следующим образом:

Тогда для игрока 1 исход r предпочтительнее , если .

Векторные исходы.

В реальной жизни исходы часто бывают многоплановыми, так что оценки лучше - хуже, более или менее предпочтительный оказываются к ним трудно применимыми. Пусть, например, Государственная Дума принимает некоторый бюджетообразующий закон, в котором фиксируется распределение денег по нескольким позициям. Общественность может благосклонно принять решение по одной позиции, но подвергнуть резкой критике решение по другой. Можно, разумеется, каким-то образом усреднить оценку законопроекта, пренебрегая возникающим при этом произволом (стандартного способа усреднения не существует), но можно поступить и по другому, рассматривая исход как вектор, состоящий из нескольких компонент - частичных исходов.

Пример: Варианты финансирования оборонных и социальных программ. Пусть в парламенте рассматривается вопрос о распределении бюджетных средств между министерством обороны и министерством социального обеспечения. Пусть х₁ – количество средств выделяемых на военные нужды, а х₂ – на социальные нужды. И пусть предельное количество средств , выделяемых по обеим статьям, не может превышать величины Х. То есть:

(1.1)

Естественными функциями полезности будут для министерства обороны – х₁, а для министерства социального обеспечения – х₂. Рассмотрим в рамках этих предположений несколько альтернативных исходов. На рисунке ниже граница бюджетного симплекса представлена линией . Допустимыми с точки зрения (1.1) исходами являются все точки, содержащиеся в треугольнике, образованном осями х₁, х₂ и границей бюджетного симплекса.

Рассмотрим пару исходов r₁ и r₂. С учетом функций полезности исходы индифферентны с точки зрения министерства социального обеспечения. Однако с точки зрения министерства обороны исход r₂ явно предпочтительнее.

Рисунок2. Векторные исходы.

Математически этот факт можно выразить следующим образом: . Аналогично: . Исход r₄ предпочтительнее, чем r₁ для обоих игроков: . В подобных случаях говорят, что исходы r₂ и r₃ доминируют по Парето исход r₁, а исход r₄ доминирует по Парето все выше перечисленные исходы. Если мы рассмотрим исход r₅, находящийся на границе симплекса, то обнаружим, что найти доминирующий его исход невозможно. Действительно, мы находили доминирующие для r₁ исходы, двигаясь от этой точки либо вверх (r₃), либо вправо (r₂), либо в северо-восточном направлении (r₄). Ни одно из подобных движений в точке r₅невозможно. Точки, подобные r₅, называются оптимальными по Парето.

Формальное определение состоит в следующем.

Исход r доминирует по Парето исход q, если

Исход r называется оптимальным по Парето (Парето - оптимальным), если он не доминируем по Парето.

Разумеется, рациональные игроки не должны стремиться ни к каким иным исходам, кроме Парето - оптимальных. Проблема заключается в том, что Парето -оптимальных исходов много. В нашем примере их несчетное число: каждая точка прямой является Парето - оптимальной. Парламент должен выбрать одну из этих точек. Парламент – это орган коллективного принятия решений. Ситуация, когда игрок является не индивидуумом, а группой лиц, вполне стандартна для теории игр. Например, если игрок фирма, то решения принимает совет директоров. Если игрок – партия, то решения принимает партийный съезд. Среди членов Парламента, несомненно, будут депутаты, лоббирующие интересы военного ведомства, но будут и такие, которые будут активно поддерживать финансирование социальных программ. Налицо конфликт интересов. Какое решение будет оптимальным с точки зрения коллектива? Существует ли универсальный алгоритм, позволяющий учесть все индивидуальные предпочтения членов органа, принимающего решения, и вынести справедливое коллективное решение?

<1 234 5 6 7 >

Дата добавления: 2016-10-17; просмотров: 925;