Принятие решений в условиях риска
Принятие решений в условиях риска характеризуется тем, что поведение среды имеет случайный характер, причем в этой случайности имеются закономерности стохастического типа. В общем случае это проявляется в том, что существует некоторая вероятностная мера, в соответствии с которой возникают те или иные состояния среды. Причем ЛПР имеет определенную информацию об этом. В наиболее простом случае это выглядит так: если множество состояний среды конечно, то есть , то вероятностная мера на нем может быть задана вероятностным вектором , где , – вероятность наступления -го состояния среды.
Считаем, что оценочная структура ЗПР задана в виде оценочной функции. Целевая функция представлена в виде матрицы выигрышей .
Такая ЗПР называется также «игрой с природой».
состояния среды | ||||||
Альтернативы | ||||||
Выбирая -ю альтернативу, получаем один из выигрышей с вероятностью соответственно. Таким образом, исходом является величина . Следовательно, сравнение альтернатив и сводится к сравнению соответствующих им случайных величин. Для этого используется математическая ожидание и дисперсия . Математическое ожидание показывает величину ожидаемого выигрыша, а дисперсия – величину риска. Часто используется не дисперсия, а среднеквадратичное отклонение (СКО): . Получаем двухкритериальную задачу.
Чтобы получить представление о математическом ожидании, рассмотрим следующую ситуацию: группа сдает три экзамена.
Среднее | |||||||
Оценка | |||||||
Отклонение | -1 | -1 | -1 | ||||
СКО |
Результат: 4 1.
Другой пример:
Среднее | |||||||
Оценка | |||||||
Отклонение | -1 | -1 | |||||
СКО |
Подход А. Использование обобщенного критерия: где - некоторая постоянная, определяемая ЛПР. Этот критерий – взвешенная сумма М и с весами 1 и (- ). При , что характеризует ЛПР как человека, не склонного к риску. При , наоборот, , что характеризует ЛПР как человека, склонного к рискую Если же , то, следовательно, ЛПР безразличен к риску.
Таким образом, – субъективный показатель меры склонности к риску (показатель осторожности). Будем считать, что ЛПР не склонен к риску ( ). Тогда критерий М будет позитивным, а – негативным. Возьмем из множества альтернатив две альтернативы и . Тогда , .
Возможны два случая:
а) Альтернативы и сравнимы по Парето.
Пусть . Тогда и (причем хотя бы одно из этих неравенств является строгим) > , то есть > . Таким образом, в этом случае независимо от меры склонности ЛПР к риску (от значения ) .
б) Альтернативы и несравнимы по Парето.
Пусть, пример, > и > (больше ожидаемый выигрыш и больше риск). Тогда > . Таким образом, , если ; , если .
В многокритериальной ЗПР основная трудность – в выборе одной оптимальной альтернативы из множества Парето-оптимальных альтернатив. Она легко преодолевается, если Парето-оптимальные альтернативы проранжировать по предпочтению. Это можно сделать с использованием вышеприведенных формул.
Найдем и , где – множество Парето-оптимальных альтернатив ( > и > ).
Назовем нижней границей несклонности к риску, а верхней границей несклонности к риску. Тогда всегда выполняется .
Правила:
1) Если у ЛПР , то для этого ЛПР ранжирование множества Парето-оптимальных альтернатив по обобщенному критерию должно совпадать с ранжированием по показателю ожидаемого выигрыша , то есть более предпочтительней будет альтернатива с большим .
2). Если у ЛПР , то для этого ЛПР ранжирование множества Парето-оптимальных альтернатив по обобщенному критерию должно совпадать с ранжированием по показателю риска (есть более предпочтительной будет альтернатива с меньшим риском).
Показатель (мера склонности к риску) предлагается определять на основе психологических качеств ЛПР на основе наблюдения за тем, как ЛПР принимает решения в различных ситуациях.
Подход В. Использование отношений доминирования по Парето.
Пусть ЛПР не склонен к риску, тогда будет позитивным критерием, а –негативным.
Условие доминирование по Парето означает, что для альтернативы получается такой же (или больший) ожидаемый выигрыш, но с меньшим (или таким же) риском.
Окончательный выбор альтернативы производится из этого множества на основе неформальных добавочных соображений. При втором подходе производится сужение множества Парето с применением ранее изученных методов.
Пример: выбор варианта производимого товара.
Фирма может выпускать продукцию одного из следующих типов: зонты (З), куртки (К), плащи (П), сумки (С), шляпы (Ш), туфли (Т). Глава фирмы должен решить, какую продукцию выпускать предстоящим летом. Прибыль фирмы зависит от того, каким будет лето: дождливым (Д), жарким (Ж) или умеренным (У). Пусть ЛПР имеет информацию о вероятности наступления дождливого, жаркого или умеренного лета:
Д (0,2) | Ж (0,5) | У (0,3) | |
З | |||
К | |||
П | |||
С | |||
Т | |||
Ш |
Ожидаемый выигрыш:
М(З)=80*0,2+60*0,5+40*0,3=58;
М(К)=58;
М(П)=57;
М(С)=56;
М(Т)=55;
М(Ш)=62,5.
Определим дисперсии (по формуле )
D (З)=6400*0,2+3600*0,5+1600*0,3-(58) =196;
D (К)=336;
D (П)=61;
D (С)=84;
D (Т)=100;
D (Ш)=231,5.
Среднеквадратичное отклонение:
;
;
;
;
;
.
М | ||
З | ||
К | 18,3 | |
П | 7,8 | |
С | 9,2 | |
Т | ||
Ш | 62,5 | 15,2 |
Результат сводим в таблицу:
Парето-оптимальное множество – . Из него выбирается одна альтернатива.
Найдем оптимальное решение с помощью обобщенного критерия: q(З)=58-14 ; q(С)=56-9,2 ; q(К)=58-18,3 ; q(Т)=55-10 ; q(П)=57-7,8 ; q(Ш)=62,5-15,2 .
Найдем и :
= =0,16; = 3,8; = =0,74.
=min(0,16; 3,8; 0,74)=0,16; =max(0,16; 3,8; 0,74)=3,8.
По правилу ранжирования получаем:
1) Если для ЛПР , то Ш З П. Оптимальная альтернатива – Ш.
2) Если для ЛПР , то П З Ш. Оптимальная альтернатива – П.
3) Если для ЛПР , например, . Тогда:
q(З)=58-14*2=30; q(П)=57-7,8*2=41,4; q(Ш)=62,5-15,2*2=32,1. Получаем П Ш З.
14. Оценка многокритериальных альтернатив – подход аналитической иерархии
Автор: Т. Саати. Analytic Hierarchy Process (AHP).
Данный подход широко известен в настоящее время. Типичная постановка задачи, решаемой этим методом, заключается обычно в следующем: дана общая цель решения задачи, альтернатив и критериев оценки альтернатив. Требуется выбрать наилучшую альтернативу.
Подход AHP состоит из ряда этапов:
1) Структуризация задачи в виде иерархической структуры с несколькими уровнями: цели – критерии – альтернативы.
2) ЛПР выполняет попарное сравнение элементов каждого уровня. Результаты сравнений переводятся в числа с помощью специальной таблицы.
3) Вычисляются коэффициенты важности для элементов каждого уровня, при этом проверяется согласованность суждений ЛПР.
4) Подсчитывается количественный индикатор качества каждой из альтернатив и определяется лучший из них.
В качестве примера рассмотрим ситуацию выбора места для постройки аэропорта. Критерии для оценки альтернатив таковы: C1 – стоимость постройки (желательно подешевле), C2 – расстояние до города (желательно, чтобы расстояние было меньше), C3 – минимальное шумовое воздействие (число людей, подвергающихся шуму, должно быть минимально). Эти критерии противоречивы. Например: постройка аэропорта вдали от города возможно потребует меньших затрат, но время поездки будет больше.
Структуризация.
Предположим, что предварительно выбрали четыре варианта (A,B,C,D). Тогда структура решаемой задачи будет выглядеть так:
A (180, 70, 10)
B (170, 40, 15)
C (160, 55, 20)
D (150, 50, 25)
Дата добавления: 2016-03-20; просмотров: 570;