Бережная_Матметоды моделирования эк cистем
.pdfмально допустимая цена продажи автомобиля. Продажа автомоби лей по цене ниже лимитной приведет к убыточной работе транс портной фирмы. Это и есть предельный уровень, позволяющий транспортной фирме согласиться на первое же превышающее этот уровень предложение цены. Такой критерий не определяет опти мальное решение, поскольку одно из последующих предложений может оказаться более выгодным, чем принятое.
Одно из преимуществ критерия предельного уровня заключает ся в том, что для него нет необходимости задавать в явном виде плотность распределения случайных величин. В нашем примере случайная величина — рыночная цена автомобиля. Транспортная фирма располагает информацией о распределении рыночных цен на подобные автомобили в неявном виде. Иначе при полном отсут ствии информации о распределении рыночных цен фирма устано вила бы предельные цены на автомобили очень высокими или, на оборот, очень низкими.
Критерий наиболее вероятного события (исхода) основан на пре образовании случайной ситуации в детерминированную путем за мены случайной величины единственным значением, имеющим наибольшую вероятность реализации.
9.4.Принятие решений
вусловиях неопределенности
Неопределенность является характеристикой внешней среды (природы), в которой принимается управленческое решение о раз витии (или функционировании) экономического объекта. Здесь бу дем рассматривать неопределенность «природы», вызванную отсут ствием, недостатком информации о действительных условиях (фак торах), при которых развивается объект управления. Внешняя сре да («природа») может находиться в одном из множества возможных состояний. Это множество может быть конечным и бесконечным. Будем считать, что множество состояний конечно или по крайней мере количество состояний можно пронумеровать;^
Пусть Si — состояние «природы», при этом / = 1, «, где л — чис ло возможных состояний. Все возможные состояния известны, не известно только, какое состояние будет иметь место в условиях, когда планируется реализация принимаемого управленческого ре шения. Будем считать, что множество управленческих решений (планов) Rj также конечно и равно т. Реализация Rj плана в усло виях, когда «природа» находится в 5/ состоянии, приводит к опре деленному результату, который можно оценить, введя количествен ную меру В качестве этой меры могут служить выигрыши от при нимаемого решения (плана); потери от принимаемого решения, а также полезность, риск и- другие количественные критерии.
320
Данные, необходимые для принятия решения в условиях нео пределенности, обычно задаются в форме матрицы, строки кото рой соответствуют возможным действиям (управленческим реше ния) Rp а столбцы — возможным состояниям «природы» 5/.
Допустим, каждому Rj-uy действию и каждому возможному 5/-му состоянию «природы» соответствует результат (исход), опре деляющий результат (выифыш, полезность) при выборе у-го дейст вия и реализации /-го состояния, — Vj^.
Rx |
Si |
Si |
... |
S, ... |
s„ |
|
||
Vu |
Vn |
• •• |
Vu |
• •• |
Vu |
|
||
Кг |
Vix |
У22 |
• .. |
V2i |
.•• |
Vln |
(9.22) |
|
|
|
|
|
|
|
|
|
|
Rj |
^•' |
Vj2 |
... |
Vj, . |
: |
^^ |
|
|
|
|
|
|
|
||||
Rm |
V • |
Vml |
• •• |
^ mi |
|
|
V |
|
^ mi |
|
|
|
|
Следовательно, математическая модель задачи принятия реше ний определяется множеством состояний {J/}, множеством планов (стратегий) {Rj} и матрицей возможных результатов \\Vji\\. В качест ве результатов в отдельных задачах рассматривается матрица ри сков \\rjl
Риск — мера несоответствия между разными возможными ре зультатами принятия определенных стратегий (действий).
Элементы матрицы рисков ||/}J| связаны с элементами матрицы полезностей (выигрышей) следующим соотношением:
г.. = К- -- К- |
(9.23) |
где V^ = max Vji — максимальный элемент в столбце / матрицы по-
^лезностей.
Если матрица возможных результатов \\Vji\\ представляет собой матрицу потерь (затрат), то элементы матрицы рисков \\rj\ следует определять по формуле
г = V- V,', |
(9.24) |
где Vi = min Vji — минимальный элемент в столбце / матрицы потерь J (результатов).
321
Таким образом, риск — это разность между результатом, кото рый можно получить, если знать действительное состояние «при роды», и результатом, который будет получен приу-й стратегии.
Матрица рисков дает более наглядную картину неопределенной ситуации, чем матрица выигрышей (полезностей).
Непосредственный анализ матриц выифышей Щ^Ц или рисков \\гр\\ не позволяет в общем случае принять решение по выбору оп тимальной стратегии (плана), за исключением тривиального слу чая, когда выигрыши при одной стратегии выше, чем при любой другой для каждого состояния «природы» (элементы матрицы вы игрышей в некоторой строке больше, чем в любой из других). Дру гими словами, имеется в наличии «доминирующая» стратегия.
Для принятия решения в условиях неопределенности использу ется ряд критериев. Рассмотрим некоторые из них. Это критерий Лапласа, критерий Вальда, критерий Сэвиджа, критерий Гурвица.
Критерий Лапласа. Этот критерий опирается на «принцип недо статочного основания» Лапласа, согласно которому все состояния «природы» 5/, / = 1,л полагаются равновероятными. В соответствии с этим принципом каждому состоянию 5/ ставится вероятность q^, определяемая по формуле
При этом исходной может рассматриваться задача принятия решения в условиях риска, когда выбирается действие Лу, дающее наибольший ожидаемый выигрыш. Для принятия решения для каж дого действия Rj вычисляют среднее арифметическое значение вы игрыша:
Mj(R) = ^iVj,, |
(9.26) |
Среди Mj(R) выбирают максимальное значение, которое будет соответствовать оптимальной стратегии Rj.
Другими словами, находится действие Rj , соответствующее
(9.27)
Если в исходной задаче матрица возможных результатов пред ставлена матрицей рисков ||/у,||, то критерий Лапласа принимает следующий вид:
322
minfi«
(9.28)
Пример 9.4. Одно из транспортных предприятий должно опре делить уровень своих провозных возможностей так, чтобы удовле творить спрос клиентов на транспортные услуги на планируемый пе риод. Спрос на транспортные услуги не известен, но ожидается (про гнозируется), что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует наилуч ший уровень провозных возможностей транспортного предприятия (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения про возных возможностей над спросом (из-за простоя подвижного со става), либо из-за неполного удовлетворения спроса на транспорт ные услуги. Ниже приводится табл. 9.3, определяющая возможные прогнозируемые затраты на развитие провозных возможностей:
Таблица 9.3
|
Варианты провозных |
Варианты спроса на транспортные |
|
|||
|
возможностей транспортного |
1 |
услуги,д. е. |
4 |
! |
|
|
предприятия |
2 |
3 |
|||
1 |
1 |
6 |
12 |
20 |
24 |
|
2 |
9 |
7 |
9 |
28 |
|
|
|
3 |
23 |
18 |
15 |
19 |
|
|
4 |
27 |
24 |
21 |
15 |
|
Необходимо выбрать оптимальную стратегию.
Решение
Согласно условию задачи имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: Si, Si, S^, ^4. Известны также четыре стратегии разви тия провозных возможностей транспортного предприятия: Л], Л2, Лз» ^4- Затраты на развитие провозных возможностей при каждой паре iS} и Л/ заданы следующей матрицей (таблицей):
Л1 |
•^I |
8г ^3 5-4 |
||
6 |
12 |
20 |
24 |
|
V = R2 |
9 |
7 |
9 |
28 |
h |
23 |
18 |
15 |
19 |
Л4 |
27 |
24 |
21 |
15. |
323
Принцип Лапласа предполагает, что S^, S2, ^3, S4 равновероят
ны. Следовательно, Р{5 = 5/} = — = •- = 0,25, / = 1, 2, 3, 4 и ожидае
мые затраты при различных действиях Л^, /?2' ^з» ^4 составляют:
ЩЯ^) = 0,25 (6 4- 12 -f 20 + 24) = 15,5; ЩК2} = 0,25 (9 + 7 + 9 + 28) = 13,25; Ж{Лз} = 0,25 (23 + 18 + 15 + 19) = 18,75; IV{R^} = 0,25 (27 + 24 + 21 + 15) = 21,75.
Таким образом, наилучшей стратегией развития провозных воз можностей в соответствии с критерием Лапласа будет /?2-
Критерий Вальда (минимаксный или максиминный критерий). Применение данного критерия не требует знания вероятностей со стояний 5/. Этот критерий опирается на принцип наибольшей ос торожности, поскольку он основывается на выборе наилучшей из наихудших стратегий Rj,
Если в исходной матрице (по условию задачи) результат V^ представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии Rj необходимо в каждой строке матрицы результатов найти наибольший элемент max {К,/}, а затем
выбирается действие Rj (строка у), которому будет соответствовать наименьший элемент из этих наибольших элементов, т. е. дейст вие, определяющее результат, равный
W = min max | уЛ. |
(9.29) |
Если в исходной матрице по условию задачи результат Vji пред ставляет выигрыш (полезность) лица, принимающего решение, то при выборе оптимальной стратегии используется максиминный кри терий.
Для определения оптимальной стратегии Rj в каждой строке матрицы результатов находят наименьший элемент minJFy/j , а за тем выбирается действие Rj (строкау), которому будут соответство вать наибольшие элементы из этих наименьших элементов, т. е. действие, определяющее результат, равный
fF = minmax{K/J. |
^^30) |
324
Пример 9.5. Рассмотрим пример 9.4. Так как Vj^ в этом приме ре представляет потери (затраты), применим минимаксный крите рий. Необходимые результаты вычисления приведены в табл. 9.4:
|
|
|
|
|
|
Таблица 9.4 |
Х^^Состояния |
|
Затраты, д. е. |
|
max |
|
|
Стра- \ v |
|
|
(Vji) |
|
= min max {Уц} |
|
|
|
|
|
{Vji} |
||
тегия Rj ^ v |
Si |
^2 |
^3 |
^4 |
|
|
^1 |
6 |
12 |
20 |
24 |
24 |
|
|
9 |
7 |
9 |
28 |
28 |
23 |
|
23 |
18 |
15 |
19 |
23 |
|
R, |
27 |
24 |
21 |
15 |
27 |
|
Таким образом, наилучшей стратегией развития провозных воз можностей в соответствии с минимаксным критерием «лучшим из худших» будет третья, т. е. Яу
Минимаксный критерий Вальда иногда приводит к нелогич ным выводам из-за своей чрезмерной «пессимистичности». «Пес симистичность» этого критерия исправляет критерий Сэвиджа.
Критерий Сэвиджа использует матрицу рисков ||А}/||. Элементы данной матрицы можно определить по формулам (9.23), (9.24), ко торые перепишем в следующем виде:
niax|Fy/j - Vjf, если V - |
выигрыш |
0/ = Ку/-тш|Ку/}, если К - |
(9.31) |
потери. |
Это означает, что /у/ есть разность между наилучшим значени ем в столбце / и значениями Vji при том же /. Отметим, что неза висимо от того, является ли Vj^ доходом (выигрышем) или потеря ми (затратами), rj^ в обоих случаях определяет величину потерь ли ца, принимаюихего решение. Следовательно, можно применять к Ау/ только минимаксный критерий. Критерий Сэвиджа рекоменду ет в условиях неопределенности выбирать ту стратегию Rj, при ко торой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).
Пример 9.6. Рассмотрим пример 9.4. Заданная матрица опре деляет потери (затраты). По формуле (9.31) вычислим элементы матрицы рисков ||/yj|:
325
|
SI |
Si |
•^3 |
^4 |
Rx |
0 |
5 |
11 |
9 |
\Ji 1 = ^2 |
3 |
0 |
0 |
13 |
Кг |
17 |
11 |
6 |
4 |
RA |
21 |
17 |
12 |
0 |
Полученные результаты вычислений с использованием крите рия минимального риска Сэвиджа оформим в табл. 9.5.
|
|
|
|
|
|
Таблица 9.5 |
\ v Состояние |
|
Величина риска, д. е. |
|
|
|
|
Стра- \ v |
|
|
|
|
max {rji}= min max {/}/} |
|
тегия Rj >v |
Si |
^2 |
^3 |
^4 |
|
|
^1 |
0 |
5 |
11 |
9 |
11 |
11 |
R, |
3 |
0 |
0 |
13 |
13 |
|
17 |
11 |
6 |
4 |
17 |
|
|
RA |
21 |
17 |
12 |
0 |
21 |
|
Введение величины риска rj^ привело к выбору первой страте гии Ri, обеспечивающей наименьшие потери (затраты) в самой не благоприятной ситуации (когда риск максимален).
Применение критерия Сэвиджа позволяет любыми путями из бежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).
Критерий ГУрвица. Основан на следующих двух предположени ях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 — а) и в самом выгодном состоянии с вероятнос тью а, где а - коэффициент доверия. Если результат Vji — прибыль, полезность, доход и т п., то критерий Гурвица записыва ется так:
W = max!а max Vji + (l - a) min Vj^ |
(9.32) |
J |
|
Когда Vji представляет затраты (потери), то выбирают действие, дающее
Жп,1п=тш а min Vjj + (l - а) max Fy/ |
(9,33) |
Если a = О, получим пессимистический критерий Вальда.
326
Если а = 1, то приходим к решающему правилу вида maxminK./ или к так называемой стратегии «здорового оптими-
j i
ста», т. е. критерий слишком оптимистичный.
Критерий Гурвица устанавливает баланс между случаями край него пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 — а) и а, где О < а < 1. Значение а от О до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности а = 0,5 представляется наиболее разумной.
Пример 9.7. Критерий Гурвица используем в примере 9.4. По ложим а = 0,5. Результаты необходимых вычислений приведены в табл. 9.6.
Таблица 9.6
Wj |
maxFy/ |
min Vjj |
а • min Vji + (1 - a) • max Vj^ |
min IVj |
|
6 |
24 |
15 |
15 |
|
7 |
28 |
17,5 |
|
|
15 |
23 |
19 |
|
|
15 |
27 |
21 |
|
Оптимальное решение заключается в выборе JV. Таким образом, в примере предстоит сделать выбор: по критерию Лапласа — выбор стратегии Rji
по критерию Вальда — выбор стратегии R^; по критерию Сэвиджа — выбор стратегии /?i;
по критерию Гурвица — выбор стратегии Ri при а = 0,5, а ес ли лицо, принимающее решение, — пессимист (а = 0), то выбор стратегии R^^
Какое из возможных решений предпочтительнее?
Это определяется выбором соответствующего критерия (Лапла са, Вальда, Сэвиджа или Гурвица).
Выбор критерия принятия решений в условиях неопределенно сти является наиболее сложным и ответственным этапом в иссле довании операций. При этом не существует каких-либо общих со ветов или рекомендаций. Выбор критерия должно производить ли цо, принимающее решение (ЛПР), с учетом конкретной специфи ки решаемой задачи и в соответствии со своими целями, а также опираясь на йрошлый опыт и собственную интуицию.
В частности, если даже минимальный риск недопустим, то сле дует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое пред приятие столько средств, чтобы потом оно не сожалело, что. вложе но слишком мало, то выбирают критерий Сэвиджа.
327
9.5.Теория игр
вотличие от рассмотренных выше задач принятия решений в условиях определенности, риска и неопределенности, в которых внешняя среда (природа) предполагалась пассивной, в конфликт ных ситуациях имеются противодействующие стороны, интересы которых противоположны. При конфликтных ситуациях решения принимаются в условиях неопределенности двумя и более разум ными противниками, каждый из которых стремится оптимизиро вать свои решения за счет других. Теория, занимающаяся приня тием решений в условиях конфликтных ситуаций, называется теорией игр. Математическая модель конфликтной ситуации пред ставляет собой игру.
Игра — это совокупность правил, описывающих сущность кон фликтной ситуации. Эти правила устанавливают:
•выбор образа действия игроков на каждом этапе игры;
•информацию, которой обладает каждый игрок при осуществ лении таких выборов;
•плату для каждого игрока после завершения любого этапа
игры.
Игру можно определить следующим образом:
•имеются п конфликтующих сторон (игроков), принимающих решения, интересы которых не совпадают;
•сформулированы правила выбора допустимых стратегий, из вестные игрокам;
•определен набор возможных конечных состояний ифы (на пример, выифыш, ничья, проигрыш);
•всем игрокам (участникам игры) заранее известны платежи, соответствующие каждому возможному конечному состоянию. Платежи задаются в виде матрицы Л = |lfl^y||.
В зависимости от числа конфликтующих сторон ифы делятся на парные (с двумя игроками) и множественные (имеющие не ме нее трех ифоков). Каждый ифок имеет некоторое множество (ко нечное или бесконечное) возможных выборов, т. е. стратегий.
Стратегией игры называется совокупность правил, определяю щих поведение ифока от начала игры до ее завершения. Стратегии каждого ифока определяют результаты или платежи в игре. Игра называется игрой с нулевой суммой, если проигрыш одного игрока равен выигрышу другого, в противном случае она называется игрой
сненулевой суммой.
Вподразд. 9.5 рассматриваются только игры двух лиц с нулевой суммой. Задание стратегий {Л и В) двух ифоков в парной ифе пол ностью определяет ее исход, т. е. выигрыш одного или проигрыш другого. Игра называется конечной, если у каждого игрока имеется
328
конечное число стратегий. Результаты конечной парной игры с ну левой суммой можно задавать матрицей, строки и столбцы которой соответствуют различным стратегиям, а ее элементы — выигрышам одной стороны (равные проигрышам другой). Эта матрица называ ется платежной матрицей или матрицей игры.
Если первый ифок имеет т стратегий, а второй — п стратегий, то говорят, что мы имеем дело с игрой тхп.
Рассмотрим ифу т х п. Пусть заданы множество стратегий: для первого игрока {Ai), для второго игрока {Bj}, платежная матрица Атхп = WayW, где ау — выифыш первого игрока или проифыш вто рого ифока при выборе ими стратегий Ai и Bj соответственно. Каж дый из ифоков выбирает однозначно с вероятностью 1 некоторую стратегию, т.е. пользуется при выборе решения чистой стратегией. При этом решение ифы будет в чистых Сфатегиях. Поскольку инте ресы ифоков противоположны, то первый ифок сфемится макси мизировать свой выифыш, а второй ифок, наоборот, минимизиро вать свой проифыш.
Решение игры состоит в определении наилучшей стратегии каждым ифоком. Выбор наилучшей стратегии одним ифоком про водится при полном отсутствии информации о принимаемом ре шении вторым ифоком. Следует отметить, что и первый, и второй игрок являются разумными противниками, которые находятся в состоянии конфликта. Поэтому для решения ифы двух лиц с нуле вой суммой используется очень «пессимистичный» критерий, так называемый критерий мини-макса-максимина. Этот критерий рас смотрен в подразд. 9.4. Основное отличие заключается в том, что ранее «природа» не рассматривалась как активный противник, тог да как в теории игр каждый ифок действует разумно и, следова тельно, пытается активно помешать своему противнику. Так, если первый ифок применяет стратегию Л/, то второй будет сфемиться к тому, чтобы выбором соответствующей стратегии Bj свести выиг рыш первого ифока к минимуму, что равнозначно сведению своего проифыша к минимуму. Величина этого минимума
a/=mina,y, / = l,Aw. |
(9.34) |
Первый ифок (при любых ответах противника) будет стремить ся найти такую стратегию, при которой а, обращается в максимум:
а = maxа/ = max mm а(/• |
(9.35) |
Величина а называется нижней ценой игры. Ей соответствует максиминная стратегия, придерживаясь которой первый ифок при любых стратегиях противника обеспечит себе выифыш, не мень-
329