Матричная игра двух лиц с ненулевой постоянной суммой
Конечная игра, в которой сумма выигрышей обоих игроков не равна нулю и постоянна для всех сочетаний их чистых стратегий, называется матричной игрой двух лиц с ненулевой постоянной суммой. Пусть — матрица выигрышей игрока 1 и — матрица выигрышей игрока 2. Причем для всех .
Такого рода игра сводится к игре двух лиц с нулевой суммой следующим образом:
1) каждому игроку выплачивается сумма с/2;
2) решается игра с нулевой суммой с матрицей выигрышей игрока 1, где
Действительно, в игре с преобразованной таким способом матрицей выигрышей игрок 2 получает сумму с/2 – аij для всех i = 1, ..., т; j = 1, ..., п, т.е. новая игра является игрой с нулевой суммой. При этом каждый игрок ничего не теряет от того, что каждый из них в игре получает на с/2 меньше, поскольку по с/2 они получили перед игрой.
Примеры
Пример 1. Выбор стратегии. Матрица некоторой игры имеет вид
Найдите оптимальные стратегии игроков.
Решение. В этой игре игрок 1 имеет три возможные стратегии: а1, а2, а3 из, а игрок 2 — четыре возможные стратегии: b1, b2, b3, b4.
Рассмотрим процесс принятия игроками решения (предполагается, что они действуют рационально). Взглянув на таблицу, можно заметить, что если игрок 1 не знает, как поступит его противник, то, действуя наиболее целесообразно и считая, что противник будет действовать подобным же образом, он выберет стратегию а2, которая гарантирует ему наибольший из трех возможных наименьших выигрышей: 9, 13, 8. Другими словами, игрок 1 руководствуется принципом максиминного выигрыша. Этот выигрыш a = аij есть нижняя цена игры. Для нашего примера a = 13.
Игрок 2 рассуждает аналогично: если он выберет стратегию b1, ,то потеряет самое большее 23, если стратегию b2, то — 40, и т.д. В результате он выберет стратегию b3, которая гарантирует ему наименьший из четырех возможных проигрышей: 23, 40, 13, 25. Принято говорить, что игрок 2 руководствуется принципом минимаксного проигрыша. Этот проигрыш b = аij есть верхняя цена игры. Для нашей матрицы b = 13.
Ситуация (a2, b3) есть седловая точка, и a = b = 13 есть цена игры.
При наличии седловой точки ни одному из участников игры невыгодно отклоняться от своей минимаксной стратегии: он будет наказан противником тем, что получит меньший выигрыш.
Пример 2. Где строить?
Две конкурирующие крупные торговые фирмы Ф1 и Ф2 планируют построить в одном из четырех небольших городов Г1, Г2, Г3 и Г4, лежащих вдоль автомагистрали, по одному универсаму. Взаимное расположение городов, расстояние между ними и численность населения показаны на рис. 1.
Рис. 1
Прибыль каждой фирмы зависит от численности населения городов и степени удаленности универсамов от места жительства потенциальных покупателей. Специально проведенное исследование показало, что прибыль в универсамах будет распределяться между фирмами следующим образом:
Например, если универсам фирмы Ф1 расположен к городу Г1ближе универсама фирмы Ф 2, то прибыль от покупок, сделанных жителями данного города, распределится следующим образом: 75% получит Ф1, остальное — Ф 2.
Представьте описанную ситуацию как игру двух лиц.
В каких городах фирмам целесообразно построить свои универсамы?
Решение. Составим платежную матрицу игры, в которой игроком 1 будет фирма Ф 1, а игроком 2 — фирма Ф2. Стратегии обоих игроков: строить свой универсам в городе Г1, в городе Г2 и т.д. Элементы матрицы — прибыль фирмы Ф1 (в тыс. руб.), которая, как предполагается, пропорциональна (причем с одним и тем же коэффициентом) числу покупателей. Величина указанного коэффициента пропорциональности для выбора оптимального места размещения универсамов значения не имеет, поэтому примем его равным единице.
Платежная матрица имеет вид
Рассмотрим примеры расчета значений элементов (Г1, Г2) и (Г3, Г4) матрицы.
Ситуация (Г1, Г2) означает, что фирма Ф1, строит универсам в городе Г1, а фирма Ф2 — в городе Г2. Число покупателей фирмы Ф1 складывается из покупателей четырех городов. Для ситуации (Г1, Г2) число покупателей из Г1: 0,75×30, из Г2: 0,45×50, из Г30,45×40, из Г4: 0,45×30, т.е. в сумме 76,5 тыс. руб. Для ситуации (Г3, Г4) число покупателей из Г1: 0,75×30, из Г2: 0,75×50, из Г3: 0,75×40, из Г4: 0,45×30, т.е. в сумме 103,5 тыс. руб. Элементы матрицы выигрышей фирмы Ф2 — дополнения до числа 150 (общее число жителей в четырех городах). Таким образом, имеет место игра двух лиц с ненулевой постоянной суммой, оптимальные стратегии которой те же, что и для соответствующей игры с нулевой суммой.
Полученная платежная матрица имеет седловую точку (Г2, Г2). Соответствующий элемент матрицы равен 90.
Таким образом, обеим фирмам следует строить свои универсамы в одном и том же городе Г2, при этом прибыль фирмы Ф1составит 90 тыс., а фирмы Ф2 — 60 тыс. руб.
Пример 3. Двухпальцевая «игра морра».
Каждый игрок показывает один или два пальца и называет число пальцев, которое, по его мнению, показал его противник (ни один из игроков не видит, какое число пальцев на самом деле показывает его противник). Если один из игроков угадывает правильно, он выигрывает сумму, равную сумме числа пальцев, показанных им и его противником. В противном случае (если никто не угадывает) — ничья. Если оба угадали, то игроки платят друг другу одинаковую сумму, в результате также ничья.
Вопросы:
1. Существует ли в данной игре седловая точка в чистых стратегиях?
2. Кто из игроков в среднем выигрывает и сколько?
3. Как часто игрок 1 должен говорить, что его противник показал два пальца?
4. Как часто игрок 2 должен показывать один палец?
Решение. Прежде всего определим стратегии игроков и построим платежную матрицу.
Стратегиями игрока 1 (строки таблицы) являются четыре пары чисел. Первое число каждой пары — это число пальцев, показанное им, второе — число пальцев, которое, как он предполагает, показал его противник. Такие же стратегии имеет игрок 2.
Платежная матрица размером 4 х 4 и другая информация представлены в следующей таблице:
Нижняя цена игры a = –2, верхняя цена игры b = 2.
Как видим, a ¹ b, поэтому седловой точки не существует и решение в чистых стратегиях отсутствует. Для решения данной игры построим соответствующую задачу линейного программирования. Для этого сначала преобразуем платежную матрицу таким образом, чтобы все ее элементы были положительными. Максимальное по абсолютной величине значение неположительного элемента платежной матрицы равно 4, поэтому к матрице достаточно прибавить число 5:
Оптимальная стратегия игрока 1 находится решением следующей задачи линейного программирования [см. (1)]:
Используя пакет POMWIN, исходную информацию для решения этой задачи можно представить в виде следующей таблицы:
Получаем следующий результат:
Решение (в нижней строке):
Оптимальное значение целевой функции равно 0,2.
В последнем столбце — двойственные оценки. Переходя к переменным исходной задачи и учитывая, что v = 1/(x1 + х2 + х3 + х4) = 5 и pi = хi v, получаем:
p1 = 0, р2 = 0,5715, p3 = 0, p4 = 0,4285.
Это означает, что при многократном повторении игры первая стратегия (1, 1) и третья стратегия (2,1) игроком 1 не должны использоваться; вторая стратегия (1,2) должна использоваться с частотой 0,5715, четвертая стратегия (2, 2) — с частотой 0,4285.
Аналогично определяем оптимальную стратегию игрока 2:
т.е. игрок 2 должен использовать лишь свою вторую стратегию (1,2) с частотой 0,5715 и третью стратегию (2, 1) с частотой 0,4285.
Так как исходная матрица была увеличена на 5, получаем, что цена первоначальной игры равна 0 (5 — 5). Таким образом, исход игры — ничья.
Ответы: 1. Нет, не существует. 2. Ничья. 3. Всегда. 4. 0,572.
Пример 4. Доминирование стратегий.
Платежная матрица для двух игроков имеет вид
Преобразуйте игру, исключив доминируемые стратегии.
Решение. Для игрока 1: вторая стратегия (строка 2 матрицы) доминирует четвертую и шестую стратегии, поэтому четвертую и шестую строки можно вычеркнуть. Для игрока 2: третья стратегия (столбец 3) доминирует четвертую, поэтому четвертый столбец можно вычеркнуть, и т.д.
Результирующая матрица имеет вид
Пример 5. Как завоевать рынок?
Два конкурирующих друг с другом предприятия, выпускающие стиральные машины, имеют следующие доли общего сбыта своей продукции на местном рынке: 53% — предприятие 1 и 47% — предприятие 2.
Оба предприятия пытаются увеличить объем своих продаж. Для этого у них есть следующие альтернативы: a1 (b1) — расширить сеть сбыта; a2 (b2) — рекламировать свою продукцию; a3(b3) — увеличить ассортимент (число моделей стиральных машин); a4 (b4) — ничего не предпринимать.
Анализ показал, что при осуществлении обоими предприятиями указанных мероприятий доля (в %) предприятия 1 на рынке стиральных машин изменится следующим образом:
Сформулируйте данную ситуацию в виде игры.
Вопросы:
1. Какое из мероприятий предприятия 1 наиболее эффективно?
2. Какую долю на рынке будет иметь предприятие 1?
3. Какое из мероприятий предприятия 2 наиболее эффективно?
4. С какой частотой следует предприятию 2 использовать стратегию «реклама»?
Решение. Приведенную выше таблицу можно рассматривать как платежную матрицу игры двух лиц с нулевой суммой. Альтернативы, имеющиеся в распоряжении предприятий, — стратегии игроков. Прежде всего следует исключить доминируемые стратегии игроков: 04 игрока 1 и 64 игрока 2. В результате получим
Увеличив все элементы матрицы на 6, решим следующую задачу линейного программирования:
Используя пакет POMWIN, получаем следующий результат:
Переходя к переменным исходной задачи и учитывая, что v = 1/(x1 + x2 + х3) = 3,85 и pi = xiv, получаем: р1 = 0,4, р2 = 0,6, p3 = 0, p4 = 0. Цена игры, соответствующая первоначальной матрице, равна –2,15 (3,85 – 6). Таким образом, предприятие 1 при многократном повторении игры должно использовать с частотой 0,4 стратегию а1 (расширить сеть сбыта), с частотой 0,6 — стратегию a2 (рекламировать свою продукцию), а стратегии a3 (увеличить ассортимент) и a4 (ничего не предпринимать) не использовать вовсе. При этом доля сбыта предприятия на рынке уменьшится на 2,15%. Оптимальная смешанная стратегия предприятия 2: с частотой 0,4 использовать стратегию b1 (расширить сеть сбыта) и с частотой 0,6 — стратегию b3 (увеличить ассортимент). Стратегии a2 (рекламировать свою продукцию) и a4 (ничего не делать) не применять вовсе. Доля предприятия 2 на рынке увеличится на 2,15%. Казалось бы, поскольку в результате осуществления своих мероприятий предприятие 1 «теряет рынок», ему не следует ничего предпринимать, однако в этом случае оно потеряет еще больше (в соответствии со стратегией a4) из-за действий предприятия 2, которому они выгодны.
Ответы: 1. Реклама. 2. 50,85%. 3. Увеличение ассортимента. 4. С нулевой частотой, т.е. стратегия «реклама» предприятием 2 вообще не должна применяться.
Вопросы
Вопрос 1. Нижняя цена матричной игры {aij}m,n определяется следующей формулой:
Вопрос 2. Верхняя цена матричной игры {aij}m,n определяется следующей формулой:
Вопрос 3. Какова верхняя цена следующей игры?
Варианты ответов:
1) 1; 2) 3; 3) 4; 4) 5; 5) 6.
Вопрос 4. Какова нижняя и верхняя цена игры для нижеприведенной матрицы?
Варианты ответов:
1) (-4, 10); 2) (0, 5); 3) (2, 4); 4) (3, 5); 5) (2, 8).
Вопрос 5. Чему равно значение элемента матрицы игры в седловой точке?
Варианты ответов:
1) 6; 2) 8; 3) 15; 4) 25; 5) седловая точка отсутствует.
Вопрос 6. Используя свойство доминирования стратегий игроков, максимально редуцируйте следующую матрицу игры:
Какова размерность результирующей матрицы?
Варианты ответов:
1)1х2; 2)2х1; 3)2х2; 4)3х2; 5)3х3.
Вопрос 7. Найдите цену следующей игры (без использования пакета POMWIN):
Варианты ответов:
1) 1; 2) 1,5; 3) 2; 4) 2,5; 5) 3.
Вопрос 8. Два игрока одновременно и независимо показывают О, 1, 2 или 3 пальца. Игрок, показавший большее число пальцев, платит другому игроку сумму, равную разности чисел пальцев, показанных им и его соперником. Какова цена такой игры?
Варианты ответов:
1) 3; 2) 2; 3) 1; 4) 0; 5) –1.
Вопрос 9. Два игрока одновременно и независимо показывают 1, 2 или 3 пальца. Пусть s — сумма чисел пальцев, показанных обоими противниками. Если s — нечетное, то игрок 1 платит другому игроку сумму s, если же s — четное, эту сумму выплачивает игрок 2. Чему равна цена такой игры?
Варианты ответов:
1) –1; 2) 0; 3) 1; 4) 1,3; 5) 1,7.
Вопрос 10. Постройте платежную матрицу следующей игры.
Игрок 2 прячет в одном из п мест предмет стоимостью сj (j = 1,.... n). Игрок 1 ищет этот предмет в одном из п мест, и если находит, то получает сj, в противном случае получает 0. Пусть п = 4 и вектор стоимости предметов с = (5, 7, 3, 12). Чему равна цена игры?
Варианты ответов:
1) 1,75; 2) 1,57; 3) 1,32; 4) 1,23; 5) 1,12.
Задачи
Задача 1. По требованию рабочих некоторой компании профсоюз ведет с ее руководством переговоры об организации горячих обедов за счет компании. Профсоюз, представляющий интересы рабочих, добивается того, чтобы обед был как можно более качественным и, следовательно, более дорогим. Руководство компании имеет противоположные интересы. В конце концов стороны договорились о следующем. Профсоюз выбирает одну из шести фирм (Ф1 ¸ Ф6), поставляющих горячее питание, а руководство компании — набор блюд из семи возможных вариантов (B1¸ B7). После подписания соглашения профсоюз формирует следующую платежную матрицу, элементы которой представляют стоимость набора блюд:
Определите оптимальные стратегии игроков и цену игры.
Вопросы:
1. Чему равна цена игры?
2. Какая фирма наиболее предпочтительна для профсоюза?
3. Какой набор руководство компании считает наиболее «выгодным»?
4. Чему равна нижняя цена игры?
Задача 2. Известный актер обдумывает, где бы ему провести в текущем году отпуск. Он рассматривает шесть возможных вариантов: Монте-Карло (МК), Гавайские острова (Г), Багамские острова (Б), Канарские острова (К), Сочи (С), озеро Байкал (ОБ). Единственный критерий для выбора места отдыха — это стремление избежать встречи с журналистами, которые могут испортить ему отпуск. Если они «выследят» актера, отдых будет испорчен (полезность равна 0). В противном случае все будет, как запланировано (полезность равна 1). Журналисты могут обнаружить актера с такой вероятностью: в Монте-Карло — 0,34; на Гавайских островах — 0,12; на Багамских островах — 0,16; на Канарских островах — 0,4; в Сочи — 0,5; на озере Байкал — 0,2.
Опишите данную ситуацию как игру двух лиц с нулевой суммой (актер — игрок 1). Вычислите цену игры и определите минимаксные стратегии обоих игроков.
Вопросы:
1. Чему равна максимальная ожидаемая полезность отпуска актера?
2. С какой вероятностью актер поедет в отпуск на Байкал?
3. Чему равна верхняя цена игры?
4. В каком из мест наиболее вероятно будет отдыхать актер?
Задача 3. На «Диком Западе» имела место следующая ситуация. Группа из пяти индейцев взяла в осаду лагерь, охраняемый четырьмя белыми. У лагеря два входа: E1 и Е2. Разведчик белых установил, что перед входом Е1 находится как минимум один индеец, а перед входом Е2 — как минимум два индейца. Остальное распределение неизвестно. Командир осажденных может себя и остальных трех человек распределить по E1 и Е2, причем у каждого входа должен быть как минимум один человек. Предполагается, что численно превосходящая (у каждого входа) группа берет в плен всю группу противника без собственных потерь, в то время как при равенстве сил перед каким-либо входом потерь нет с обеих сторон. В качестве платежа (выигрыша) выступает разность числа пленных.
Определите все чистые стратегии обоих противников. Постройте платежную матрицу, считая игроком 1 обороняющуюся сторону. Редуцируйте матрицу, насколько это возможно, и найдите оптимальные стратегии сторон.
Вопросы:
1. С какой частотой белым следует использовать стратегию: расположить по два человека у каждого входа?
2. Кто больше в среднем захватит пленных — белые или индейцы?
3. Какова абсолютная величина разности числа захваченных обеими сторонами пленных?
4. С какой частотой белым следует использовать стратегию:
расположить у первого входа одного, а у второго — трех человек?
5. С какой частотой индейцам следует использовать стратегию:
расположить у первого входа трех, а у второго — двух воинов?
Задача 4. Имеются два предприятия, которые в дополнение к основной продукции могут выпускать побочную продукцию одного и того же назначения — пластмассовые игрушки. Известно, что они могут продавать ее в одном и том же городе. Игрушки немного отличаются по конструкции, оформлению, удобству и т.д. Первое предприятие может выпускать игрушки типа А1, А2,..., Аm; второе — типа B1, В2,..., Bn. Себестоимость и цена игрушек у всех предприятий одинаковы. Всего в течение года продается N игрушек. Если первое предприятие выпускает игрушки типа Аi, а второе — типа Вj, то первое предприятие продаст rijN игрушек, а второе — (N – rijN). Каждое предприятие стремится получить максимальный доход от продажи игрушек.
Пусть т = 4, п = 5, N= 300 000, цена (равновесная) одной игрушки составляет 20 руб., элементы матрицы {rij}4,5 представлены в таблице:
Сформулируйте игру двух лиц, считая игроком 1 первое предприятие. Определите выигрыш (доход от продажи) каждого предприятия.
Вопросы:
1. Каков общий средний доход первого предприятия?
2. Каков общий средний доход второго предприятия?
3. Какое изделие следует выпускать первому предприятию с наибольшей вероятностью?
4. Какое изделие следует выпускать второму предприятию с наибольшей вероятностью?
5. Какова частота применения стратегии «Выпускать изделие B2»?
Задача 5. Сторона В посылает подводную лодку в один из п регионов. Сторона А, располагая т противолодочными кораблями, стремится обнаружить лодку противника. Сторона B стремится этого избежать. Вероятность обнаружения подводной лодки в j-м регионе одним противолодочным кораблем равна рj (j = 1,..., n).
Предполагается, что обнаружение лодки каждым кораблем является независимым событием. Сторона А может посылать в различные регионы разное количество кораблей (распределение т кораблей по регионам и есть ее стратегия).
Пусть т = 3, п = 2, р1 = 0,4, р2 = 0,6.
Считая сторону А игроком 1, построите игру и найдите оптимальное распределение противолодочных кораблей по регионам.
Вопросы:
1. Каков средний выигрыш стороны А?
2. С какой частотой стороне А следует посылать в регион 2 три противолодочных корабля?
3. С какой частотой стороне А следует посылать в регион 1 один противолодочный корабль?
4. С какой частотой стороне В следует посылать подводную лодку в регион 2?
Ответы и решения
Ответы на вопросы: 1—4, 2 — 5, 3—2, 4 — 4, 5—2, 6—3, 7 — 3, 8—4, 9—2, 10—2.
Задача 1. Решение.
Модель линейного программирования и решение представлены в следующей таблице:
Цена игры v = 1/(0,196 + 0,131) = 3,06.
Вероятности выбора фирм Р = (0,6; 0,4; 0; 0; 0; 0).
Вероятности выбора наборов Q = (0,24; 0; 0,76; 0; 0; 0; 0).
Ответы: 1. 3,06. 2. Ф1. 3. B3 4. 2,3.
Задача 2. Решение.
Матрица игры и решение задачи линейного программирования представлены в следующей таблице:
Цена игры равна 0,96. Частоты использования игроком 1 своих стратегий Р = (0,11; 0,32; 0,24; 0,096; 0,077; 0,19).
Ответы: 1. 0,96. 2. 0,19. 3. 1. 4. На Гавайских островах.
Задача 3. Решение.
Матрица игры имеет вид
После исключения доминируемых стратегий матрица примет вид
После приведения данной матрицы к положительно определенной, решив задачу, получаем: цена исходной игры равна 0, т.е. белые, даже применяя оптимальную стратегию, теряют на одного человека больше (здесь имеет смысл округлить цену игры до ближайшего целого). Другими словами, индейцы берут в плен на одного человека больше.
Оптимальная смешанная стратегия белых: с частотой 0,2 применять стратегию (1, 3) и с частотой 0,8 — стратегию (3, 1). Оптимальная смешанная стратегия индейцев: с частотой 0,4 применять стратегию (1, 4) и с частотой 0,6 — стратегию (3, 2).
Ответы: 1.0. 2. Индейцы. 3.1. 4.0,2. 5.0,6.
Задача 4. Решение.
Данная игра — это игра двух лиц с ненулевой постоянной суммой. Сумма выигрышей обоих игроков при любых сочетаниях стратегий предприятий равна 6 (все числа в матрице выигрышей даны в миллионах). Сведем ее к игре двух лиц с нулевой суммой. Для этого до игры каждому предприятию выплачивается половина постоянной суммы, т.е. 3, а из выигрыша каждого предприятия (из элементов матрицы) вычитается 3. Полученная матрица соответствует игре с нулевой суммой, поэтому достаточно указать в ней только выигрыши одного (первого) предприятия. После необходимых расчетов матрица игры имеет вид
Прибавим к матрице число 3, чтобы все ее элементы были положительными. Матрица задачи и решение показаны в следующей таблице:
Цена преобразованной игры равна 1/0,34 = 2,94.
Оптимальная смешанная стратегия игрока 1 (частоты использования игроком 1 своих стратегий) Р = (0,23; 0,36; 0,41; 0).
Для игрока 2 оптимальная смешанная стратегия Q = (0,43; 0; 0,1; 0,47; 0). Цена исходной игры с нулевой суммой равна —0,06. Поскольку оба игрока получили по 3 млн руб., общий доход первого предприятия составляет 2,94 млн руб., доход второго предприятия равен 3,06 млн руб.
Ответы: 1. 2,94 млн руб. 2. 3,06 млн руб. 3. Изделие А3 4. Изделие B4 5. Частота применения стратегии «Выпускать изделие B2» равна нулю.
Задача 5. Решение.
Стратегии игрока 2: I — послать подводную лодку в регион 1; II — послать подводную лодку в регион 2. Множество стратегий игрока 1: {(0, 3), (1, 2), (2,1), (3, 0)}. Числа в скобках — это количество противолодочных кораблей, посылаемых в каждый из двух регионов.
Вероятность обнаружить подводную лодку в регионе j с помощью k противолодочных кораблей равна (1 – (1 – рj)k). Предположим, что выигрыш игрока 1 равен единице в случае обнаружения подводной лодки и нулю — в противном случае. Тогда матрица игры имеет вид
Элементы матрицы — средние выигрыши игрока 1 в соответствующих ситуациях.
Модель линейного программирования и решение (элементы матрицы увеличены на 1):
Цена игры равна 1/0,62 = 1,61. Цена первоначальной игры равна 1,61 – 1 = =0,61.
Частоты применения стороной А своих стратегий Р = (0; 0,92; 0,08; 0). Сторона В посылает подводную лодку в оба региона с равной вероятностью (0,31×1,61 = 0,5).
Ответы: 1. 0,61, т.е. средний выигрыш равен цене игры.
2. Стороне А не следует посылать в регион 2 три противолодочных корабля.
3. С частотой 0,92.
4. С частотой 0,5.
Глава 11. Нелинейное программирование
Цели
В данной главе описываются оптимизационные задачи нелинейного программирования (НЛП), математические модели которых содержат нелинейные зависимости от переменных. Источники нелинейности относятся в основном к одной из двух категорий:
1) реально существующие и эмпирически наблюдаемые нелинейные соотношения, например: непропорциональные зависимости между объемом производства и затратами; между количеством используемого в производстве компонента и некоторыми показателями качества готовой продукции; между затратами сырья и физическими параметрами (давление, температура и т.п.) соответствующего производственного процесса; между выручкой и объемом реализации и др.;
2) установленные (постулируемые) руководством правила поведения или задаваемые зависимости, например: формулы или правила расчета с потребителями энергии или других видов услуг; эвристические правила определения страховых уровней запаса продукции; гипотезы о характере вероятностного распределения рассматриваемых в модели случайных величин; различного рода договорные условия взаимодействия между партнерами по бизнесу и др.
Решать линейные задачи значительно проще, чем нелинейные, и если линейная модель обеспечивает адекватность реальным ситуациям, то ее и следует использовать. В практике экономического управления модели линейного программирования успешно применялись даже в условиях нелинейности. В одних случаях нелинейность была несущественной и ею можно было пренебречь, в других — производилась линеаризация нелинейных соотношений или применялись специальные приемы, например строились так называемые линейные аппроксимационные модели, благодаря чему достигалась требуемая адекватность. Тем не менее имеется большое число ситуаций, где нелинейность является существенной и ее нужно учитывать в явном виде.
Далее приводятся общая модель задачи нелинейного программирования и классы задач НЛП, а также описываются условия оптимальности решения.
После того как вы выполните задания, предлагаемые в этой главе, вы будете уметь определять и использовать для экономического анализа:
• целевую функцию;
• ограничения;
• допустимый план;
• множество допустимых планов;
• модель нелинейного программирования;
• оптимальный план.
Вы сможете также:
• определять, является ли функция выпуклой;
• строить функцию Лагранжа задачиНЛП;
• проверять оптимальность полученных решений.
Модели
В общем виде задача НЛП описывается с помощью следующей моделинелинейного программирования:
где х = (x1, х2, ..., хn) — вектор переменных задачи.
Задача (1)—(3) называется задачей нелинейного программирования в стандартной форме на максимум.
Может быть сформулирована также задача НЛП на минимум.
Вектор х = (x1, х2, ..., хn), компоненты хj которого удовлетворяют ограничениям (2) и (3), называется допустимым решением или допустимым планом задачиНЛП.
Совокупность всех допустимых планов называется множеством допустимых планов.
Допустимое решение задачи НЛП, на котором целевая функция (1) достигает максимального значения, называется оптимальным решением задачи НЛП.
Возможное местонахождение максимального значения функции F(x) при наличии ограничений (2) и (3) определяется следующим общим принципом. Максимальное значение F(x), если оно существует, может достигаться в одной или более точках, которые могут принадлежать следующим множествам:
— внутренняя точка множества допустимых планов, в которой все первые частные производные
— точка границы множества допустимых планов};
— точка множества допустимых планов, в которой функция F(x) недифференцируема}.
В отличие от задач линейного программирования, любая из которых может быть решена симплекс-методом, не существует одного или нескольких алгоритмов, эффективных для решения любых нелинейных задач. Какой-то алгоритм может оказаться чрезвычайно эффективным для решения задач одного типа и неудачным для задач другого типа.
Эффективность алгоритма может даже существенно зависеть от постановки задачи, например от изменения масштабов измерения тех или иных переменных. Поэтому алгоритмы разрабатываются для каждого класса (типа) задач. Программы, ориентированные на решение определенного класса задач, как правило, не гарантируют правильность решения любых задач данного класса, и оптимальность решения рекомендуется проверять в каждом конкретном случае.
В экономических приложениях рассматриваются следующие классы задач НЛП.
1. Оптимизация нелинейной функции с ограничениями на неотрицательность значений переменных:
F(х) ® mах,
x ³ 0,
где х = (х1, х2,..., хn) — вектор переменных задачи.
Пусть F(x) — дифференцируемая функция.
Необходимые условия того, что в точке х0 достигается максимум функции F(x):
Это означает, что:
и
Если F(x) вогнутая функция (для задачи минимизации — выпуклая), то эти условия являются также достаточными.
Функция F(x) с числовыми значениями, определенная на выпуклом множестве точек К, называется вогнутой, если для любой пары точек х1, х2 и для всех чисел l, 0 £ l £ 1, выполняется неравенство
Если то функция F(x) называется выпуклой. Если имеют место строгие неравенства, то говорят, что функция строго вогнута или строго выпукла.
Данное определение вогнутости (выпуклости) годится для любого типа функции. Практически, однако, применять его трудно.
Для дважды дифференцируемой функции F(x) имеет место следующий критерий. Дифференцируемая функция F(x) строго вогнута в некоторой окрестности точки если выполняются следующие условия:
т.е. если знаки этих определителей чередуются указанным образом.
Здесь — частная производная второго порядка, вычисленная в точке х0.
Матрица размера п ´ п, составленная из элементов , называется матрицей Хессе (Hesse). По значениям ее главных миноров можно судить о выпуклости или вогнутости функции. Функция F(x) строго выпукла в малой окрестности точки х0, если все главные миноры ее матрицы Хессе строго положительны. Если имеют место нестрогие неравенства (³), то функция в окрестности точки х0 выпукла. Если при этом главные миноры матрицы Хессе от х не зависят, то функция всюду (строго) выпукла.
Весьма распространены относящиеся к данному типу модели квадратичного программирования, в которых целевая функция F(x)является квадратичной функцией переменных х1, х2, ..., хn. Существует большое число алгоритмов решения такого типа задач, в которых функция F(x) вогнутая (для задач минимизации — выпуклая).
2. Модели выпуклого программирования. К такого рода моделям относятся задачи НЛП (1)—(3), в которых F(x) — вогнутая (выпуклая) функция, a gi(x) — выпуклые функции. При данных условиях локальный максимум (минимум) является и глобальным.
Пусть F(x) и gi(x), i= 1,..., т, — дифференцируемые функции.
Необходимые и достаточные условия оптимальности решения — выполнение условий Куна — Таккера.
Рассмотрим задачу НЛП (1)—(3) и функцию Лагранжа L (х, l) =
Условия Куна — Таккера оптимальности решения х0 для задачи максимизации F(x) имеют вид
где — частная производная функции Лагранжа по переменной хj при х = х0 и l = l0. Пусть максимальное значение F(x) равно F(x0) = F0. Числа связаны с F0 следующими соотношениями:
Из этих соотношений видно, что числа характеризуют реакцию значения F0 на изменение значения соответствующего bi. Например, если < 0, то при уменьшении bi (в пределах устойчивости ) значение F0 увеличится, а = 0 указывает на несущественность соответствующего ограничения gi(х) £ bi, которое может быть без ущерба для оптимального решения из системы ограничений исключено.
3. Сепарабельное программирование. Специальный случай выпуклого программирования при условии, что F(x) и все gi(х) — сепарабельные функции, т.е.
Задачи данного вида сводятся к задачам линейного программирования.
4. Дробно-нелинейное программирование. Максимизировать (минимизировать) функцию F(x) = F1(x)/F2(x).
В частном случае, когда в числителе и знаменателе — линейные функции (так называемая задача дробно-линейного программирования), задача сводится к линейной.
5. Невыпуклое программирование. Функция F(x) и (или) какие-либо gi(x) не выпуклы. Надежных методов решения задач такого типа пока не существует.
Примеры
Пример 1. Сколько производить?
Предприятие располагает ресурсами двух видов сырья и рабочей силы, необходимыми для производства двух видов продукции. Затраты ресурсов на изготовление одной тонны каждого продукта, прибыль, получаемая предприятием от реализации тонны продукта, а также запасы ресурсов указаны в следующей таблице:
Стоимость одной тонны каждого вида сырья определяется следующими зависимостями: (9 + 0,0088r1) тыс. руб. для сырья 1 и (5 - 0,0086r2) тыс. руб. для сырья 2, где r1 и r2 — затраты сырья на производство продукции. Стоимость одного часа трудозатрат определяется зависимостью (1 - 0,0002r, где r — затраты времени на производство продукции.
Вопросы:
1. Сколько продукта 1 следует производить для того, чтобы обеспечить максимальную прибыль?
2. Сколько продукта 2 следует производить для того, чтобы обеспечить максимальную прибыль?
3. Какова максимальная прибыль?
Решение. Пусть x1 — объем выпуска продукта 1 (в тоннах), х2 — объем выпуска продукта 2 (в тоннах). Тогда задача может быть описана в виде следующей модели нелинейного программирования:
При использовании программы GINO исходную информацию для решения этой задачи представляем в следующем виде:
Получаем следующий результат:
Ответы: 1. 16,67т. 2.13,89т. 3. 507,407 тыс. руб.
Пример 2. Формирование портфеля ценных бумаг.
Клиент поручил брокерской конторе купить для него на 1 млн руб. акции трех известных ему компаний. Сделка заключается на год. Клиент заинтересован, с одной стороны, в максимизации средней прибыли на вложенный капитал, а с другой — в минимизации риска, поскольку прибыль, получаемая в конце года от акции каждой компании, является величиной случайной. Известно, что чем прибыльнее акция, тем выше связанный с ней риск, поэтому названные критерии являются противоречивыми. Клиенту это обстоятельство разъяснили и попросили его указать относительную значимость («вес») критериев. Клиент, будучи человеком осторожным, высказал пожелание, чтобы риск учитывался с весом втрое большим, чем прибыль. Получив такие указания, сотрудники брокерской конторы сформулировали следующую модель нелинейного программирования:
где хj — объем средств, затраченных на покупку акций типа j (тыс. руб.);
mj — математическое ожидание процента прибыли от вложения 1 тыс. руб. в акции типа j;
sjj — дисперсия указанного выше процента прибыли;
sij — ковариация между процентами прибыли от вложения 1 тыс. руб. в акции типа i и j (i ¹ j).
Первая сумма в критерии — ожидаемое значение прибыли, обеспечиваемой пакетом акций, вторая — дисперсия прибыли пакета акций, взятая с «весом» 3. Дисперсия прибыли пакета акций служит мерой риска.
Пусть средние значения процентов годовой прибыли от акций компаний составляют соответственно 8, 10 и 13%. Дисперсии s11 = 0,1, s22 = 0,15, s33 = 0.19. Ковариации s12 = 0,01, s13 = 0,02, s23 = 0,03.
Вопросы:
1. Является ли целевая функция строго вогнутой?
2. Какую сумму следует вложить в покупку акций типа 1?
3. Какую сумму следует вложить в покупку акций типа 3?
Решение. Модель нелинейного (в данном случае — квадратичного) программирования имеет вид
Рассчитав значения соответствующих определителей (главных миноров матрицы Хессе), можно убедиться, что выполняются условия (4), откуда следует, что целевая функция строго выпукла для любых значений х1, х2, х3 (значения определителей не зависят от значений переменных).
Используя программу GINO, исходную информацию для решения этой задачи представляем в следующем виде:
Получаем следующий результат:
Непосредственной подстановкой полученного решения в условия (5)—(8) можно убедиться, что условия Куна — Таккера выполняются, причем решение обеспечивает глобальный максимум целевой функции, поскольку F строго вогнута.
Ответы: 1. Да, является (при любых значениях переменных).
2. 496,8 тыс. руб. 3. 197,93 тыс. руб.
Пример 3. Производство молочных продуктов.
Молокозавод производит для местного рынка три вида продуктов: сметану, творог и сыр. Молоко поступает ежедневно из двух ферм. Технологические и экономические данные о производимых продуктах приведены в следующей таблице:
Затраты, связанные с приобретением сырья (молока), являются кусочно-линейной функцией закупаемого количества:
а) для фермы 1
б) для фермы 2
Вопросы:
1. Какова максимальная ежедневная прибыль молокозавода?
2. Сколько молока следует закупать на ферме 1?
3. Сколько молока следует закупать на ферме 2?
4. Как изменится максимальная прибыль, если максимальное суточное производство сметаны увеличить на 1 кг?
5. Как изменится максимальная прибыль, если максимальное суточное производство творога уменьшить на 2 кг?
Решение. Задача может быть описана с помощью модели линейного программирования.
Пусть x1 — количество молока, закупаемого на ферме 1, х2 — количество молока, закупаемого па ферме 2. Представим х1 и х2 в следующем виде:
Тогда стоимость молока, закупаемого на ферме 1, описывается функцией
а стоимость молока, закупаемого на ферме 2, — функцией
Окончательно модель линейного программирования имеет вид
Структура матрицы задачи линейного программирования показана в следующей таблице:
Используя для решения этой задачи программу POMWIN, получаем следующий результат:
Далее представлена таблица, содержащая границы устойчивости по коэффициентам целевой функции:
Границы устойчивости по правым частям ограничений:
Ответы: 1. 8275 руб. 2. 312,5 кг. 3. 218,75 кг. 4. Увеличится на 45 руб. 5. Уменьшится на 80 руб.
Вопросы
Вопрос 1. Дана действительная функция f(х), определенная на отрезке действительных чисел S = [0, 100]. Пусть х1 и х2 — точки этого отрезка и 0 £ l £ 1.
Какое из нижеприведенных неравенств является условием выпуклости функции?
Варианты ответов:
Вопрос 2. Дана действительная функция f(x), определенная на отрезке действительных чисел S=[0, 100]. Пусть x1 и x2 — точки этого отрезка и 0 £ l £ 1.
Какое из нижеприведенных неравенств является условием строгой вогнутости функции?
Варианты ответов:
Вопрос 3. Функция
1) выпуклая;
2) строго выпуклая;
3) вогнутая;
4) строго вогнутая;
5) выпуклая и вогнутая.
Вопрос 4. Функция
1) выпуклая;
2) ни выпуклая, ни вогнутая;
3) вогнутая;
4) строго вогнутая;
5) выпуклая и вогнутая.
Вопрос 5. Функция всюду:
1) выпуклая;
2) ни выпуклая, ни вогнутая;
3) строго выпуклая;
4) вогнутая:
5) выпуклая и вогнутая.
Вопрос 6. Новая модель скоростного мотоцикла «Улитка» продается предприятием по цене (30 – 2x) тыс. долл. за штуку, где х —количество проданных мотоциклов. Переменные производственные затраты составляют 6 тыс. долл. за штуку, фиксированные затраты — 30 тыс. долл. Максимизируйте прибыль предприятия за неделю.
Предположим, что в результате изменения ставки налога с продаж последний (налог) составил дополнительно 4 тыс. долл. на каждый проданный мотоцикл.
Как изменится оптимальный выпуск мотоциклов по сравнению с начальной ситуацией?
(Решить, используя функцию Лагранжа.)
Варианты ответов:
1) увеличитсяна 2; 2) уменьшится на 2;
3) не изменится; 4) увеличится на 1;
5) уменьшится на 1.
Вопрос 7. Предположим, что у вас есть 2 недели (14 дней) отпуска, которые вы можете провести на Канарских островах и в Ницце. Пусть ваша функция полезности имеет вид 2KN – 3К2 – 4N2, где К и N — количество дней, которое вы проводите на Канарских островах и в Ницце соответственно.
Сколько дней вы должны провести в Ницце, чтобы максимизировать свою функцию полезности?
(Для решения использовать функцию Лагранжа. Результат округлить до ближайшего целого. Проверить, выполняются ли условия оптимальности Куна — Таккера.)
Варианты ответов:
1) 3; 2) 4; 3) 5; 4) 6; 5) 7.
Вопрос 8. Для задачи вопроса 7 найдите значение двойственной оценки ограничения.
(Результат округлить до ближайшего целого.)
Варианты ответов:
1) 41; 2) 34; 3) 29; 4) 39; 5) 44.
Вопрос 9. Монополист планирует программу производства и реализации продукции на следующий период. Цены: р1 = 14 – 0,25x1 (на продукт 1); р2 = 14 – 0,5х2 (на продукт 2), где x1 и х2 — объемы реализации продуктов. Предположим, что вся произведенная продукция реализуется. Максимальный суммарный объем сбыта — 57.
Каков оптимальный выпуск продукта 2?
Варианты ответов:
1) 36,4; 2) 30,7; 3) 26,3; 4) 20,6; 5) 41,8.
Вопрос 10. Владелец небольшого предприятия располагает на ближайший месяц 100 тыс. руб., которые он может потратить на увеличение основных фондов К (закупку оборудования) по цене 1 тыс. руб за единицу либо на покупку дополнительной рабочей силы L по цене 50 руб./ч. Увеличение готовой продукции, которая может быть продана по 10 тыс. руб. за единицу, определяется производственной функцией F(K, L)= L2/7 К2/5.
Сколько средств следует потратить на увеличение основных фондов?
Варианты ответов:
1) 74,36 тыс. руб.; 2) 58,33 тыс. руб.; 3) 63,44 тыс. руб.;
4) 45,66 тыс. руб.; 5) 39,77 тыс. руб.
Задачи
Задача 1. Компания «Комуойл» производит на одном из своих заводов три марки неэтилированного бензина А-88, А-92 и А-95 из нефти, добываемой на трех месторождениях: на двух сибирских — тюменском и самотлорском — и на башкирском. Причем из Сибири нефть поступает по трубопроводу в смеси в количестве 250 т в сутки.
Данные о нефти представлены в следующей таблице:
Требуемые характеристики бензина:
Предположим, что других затрат, кроме затрат на покупку сырой нефти, нет. Определите оптимальную (с точки зрения максимума прибыли) суточную производственную программу завода.
Вопросы:
1. Какова максимальная прибыль завода?
2. Каков оптимальный выпуск бензина А-88?
3. Какова доля тюменской нефти в смеси, поступающей из Сибири?
4. Каковы общие затраты?
Задача 2. На кондитерской фабрике «Десерт» вследствие уменьшения спроса на ряд ее изделий освободилась часть производственных мощностей. Чтобы избежать сокращения численности работающих, специалисты фабрики разработали технологию производства двух новых видов шоколадных конфет: шоколадных бочонков с коньяком, получивших название «Братец Иванушка» (БИ), и шоколадных шариков с вишней, названных «Сестрица Аленушка» (СА). Для изготовления любого нового вида конфет должны быть задействованы три производственные линии: производство шоколада, непосредственное изготовление конфет, упаковка и контроль. Первая и третья линии — общие для конфет обоих наименований. Доля шоколада в общем весе одной конфеты БИ составляет 70%, а в конфете СА — 80%. Максимальная мощность линии по изготовлению шоколада (для новой продукции) составляет 250 кг в сутки. Производительность линии по изготовлению конфет БИ — 170 кг в сутки, конфет СА — также 170 кг. Удельные переменные затраты составляют: для конфет БИ — 180 руб./кг, для конфет СА — 150 руб./кг. Предполагается, что все изготовленные в течение суток конфеты будут проданы. В силу своей исключительности новые изделия не испытывают внешней конкуренции, однако они конкурируют друг с другом. В результате проведенного исследования были получены следующие зависимости объемов сбыта от цен:
где x1 — произведенное (проданное) в течение суток количество конфетБИ, кг;
х2 — произведенное (проданное) в течение суток количество конфетСА, кг;
р1 — цена конфет БИ, руб./кг;
р2 — цена конфет СА, руб./кг.
Определите производственную программу, при которой суточная прибыль фабрики от производства новой продукции максимальна.
Вопросы:
1. Какова максимальная прибыль фабрики?
2. Каков оптимальный выпуск конфет БИ?
3. Каков оптимальный выпуск конфет СА?
4. Какова оптимальная цена конфет БИ?
5. Какова оптимальная цена конфет СА?
Задача 3. На молочном комбинате помимо других продуктов производится также сырковая масса трех наименований: «Изюминка», «Ваниль» и «Орешек» — жирности соответственно 6, 5 и 3%. В качестве основных исходных продуктов используются творог жирности 8, 7 и 2%, объемы суточных поставок которого составляют по 200 кг каждого вида, и сахар, имеющийся в количестве 70 кг в сутки.
По технологии для получения 1 кг сырковой массы «Изюминка» требуется 30 г сахара, для «Ванили» — 40 г и для «Орешка» — 60 г. Цена сырковой массы «Изюминка» равна 36 руб./кг, «Ванили» — 35 руб./кг, «Орешка» — 33 руб./кг.
Закупочная цена творога 8%-й жирности определяется зависимостью (29 – 0,003x) руб./кг, где х — объем закупки (в кг). Аналогичные зависимости для творога 7%-й жирности (27 – 0,008x) руб./кг и 2%-й жирности (26 – 0,005x) руб./кг.
Минимальный выпуск для «Изюминки» 100 кг, «Ванили» 50 кг, «Орешка» 50 кг.
Постройте производственную программу, максимизирующую общую суточную прибыль.
Вопросы:
1. Какова максимальная прибыль?
2. Каков оптимальный объем производства сырковой массы «Орешек»?
3. Каков оптимальный объем производства сырковой массы «Ваниль»?
Задача 4. Горно-обогатительная фабрика получает из руды, поступающей из двух месторождений, никель, медь и серебро. Данные о количестве ценных металлов, получаемых из одной тонны руды каждого месторождения, приведены в следующей таблице:
В течение месяца фабрика перерабатывает не более 1000 т руды. За счет увеличения (уменьшения) затрат можно изменить доли выхода металлов в пределах ±10% по сравнению с приведенными в таблице. Предположим, что удельные затраты после изменения средних (приведенных в таблице) коэффициентов выхода металлов определяются зависимостью с = (2k – 1) с0, где k показывает, во сколько раз изменяется средний выход металла из 1 т руды, а с0 — средние удельные затраты. При этом предполагается, что общие затраты, связанные с изменением нескольких коэффициентов, аддитивны.
Постройте модель нелинейного программирования с учетом возможности изменения коэффициентов выхода металлов. Определите оптимальные значения коэффициентов, обеспечивающих максимум прибыли фабрики.
Вопросы:
1. Какова максимальная прибыль?
2. Каково оптимальное значение коэффициента выхода никеля из руды месторождения 2?
3. Каково оптимальное значение коэффициента выхода меди из руды месторождения 1?
4. Какое количество руды месторождения 2 следует использовать в производстве?
Задача 5. Завод производит два вида высококачественного паркета из дуба, отличающиеся формой и толщиной деталей. Дефицитными ресурсами служат дубовая доска и специальная жидкость для пропитки деталей. Для производства 1 м2 паркета первого вида требуется 0,01 м3 дубовой доски и 0,05 кг жидкости для пропитки. Для производства 1 м2 паркета второго вида потребности в ресурсах составляют соответственно 0,02 м3 и 0,15 кг. Максимальное количество ресурсов за месяц: 20 м3 дубовой доски и 150 кг жидкости для пропитки.
Затраты на единицу первого ресурса (на 1 м3 дубовой доски) составляют (1000 – 3r1) руб./м3, где r1 — объем дубовых досок, использованных в производстве паркета. Затраты на единицу второго ресурса (на 1 кг жидкости для пропитки) составляют (500 – 0,5r2) руб./кг, где r2 — количество использованной в производстве паркета жидкости для пропитки. Предполагается, что других затрат нет. Оба вида паркета могут частично заменять друг друга, поэтому величины спроса на них взаимозависимы. Цена 1 м2 паркета первого вида (руб./м2) определяется зависимостью p1 = 100 – 0,04x1 — 0,01x2, а цена 1 м2 паркета второго вида — зависимостью p2 = 210 – 0,008x1 – 0,03x2, где x1, х2 — объемы производства (м2) паркета соответственно первого и второго вида.
В предположении, что весь паркет может быть продан, определите производственную программу завода, обеспечивающую максимум прибыли.
Вопросы:
1. Какова максимальная прибыль предприятия?
2. По какой цене следует продавать паркет первого вида?
3. По какой цене следует продавать паркет второго вида?
4. Какое количество жидкости для пропитки используется в производстве?
5. Каков оптимальный выпуск паркета второго вида?
Задача 6.
Дата добавления: 2016-07-09; просмотров: 3318;