Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бережная_Матметоды моделирования эк cистем

.pdf
Скачиваний:
211
Добавлен:
29.03.2015
Размер:
8.86 Mб
Скачать

мально допустимая цена продажи автомобиля. Продажа автомоби­ лей по цене ниже лимитной приведет к убыточной работе транс­ портной фирмы. Это и есть предельный уровень, позволяющий транспортной фирме согласиться на первое же превышающее этот уровень предложение цены. Такой критерий не определяет опти­ мальное решение, поскольку одно из последующих предложений может оказаться более выгодным, чем принятое.

Одно из преимуществ критерия предельного уровня заключает­ ся в том, что для него нет необходимости задавать в явном виде плотность распределения случайных величин. В нашем примере случайная величина — рыночная цена автомобиля. Транспортная фирма располагает информацией о распределении рыночных цен на подобные автомобили в неявном виде. Иначе при полном отсут­ ствии информации о распределении рыночных цен фирма устано­ вила бы предельные цены на автомобили очень высокими или, на­ оборот, очень низкими.

Критерий наиболее вероятного события (исхода) основан на пре­ образовании случайной ситуации в детерминированную путем за­ мены случайной величины единственным значением, имеющим наибольшую вероятность реализации.

9.4.Принятие решений

вусловиях неопределенности

Неопределенность является характеристикой внешней среды (природы), в которой принимается управленческое решение о раз­ витии (или функционировании) экономического объекта. Здесь бу­ дем рассматривать неопределенность «природы», вызванную отсут­ ствием, недостатком информации о действительных условиях (фак­ торах), при которых развивается объект управления. Внешняя сре­ да («природа») может находиться в одном из множества возможных состояний. Это множество может быть конечным и бесконечным. Будем считать, что множество состояний конечно или по крайней мере количество состояний можно пронумеровать;^

Пусть Si — состояние «природы», при этом / = 1, «, где л — чис­ ло возможных состояний. Все возможные состояния известны, не известно только, какое состояние будет иметь место в условиях, когда планируется реализация принимаемого управленческого ре­ шения. Будем считать, что множество управленческих решений (планов) Rj также конечно и равно т. Реализация Rj плана в усло­ виях, когда «природа» находится в 5/ состоянии, приводит к опре­ деленному результату, который можно оценить, введя количествен­ ную меру В качестве этой меры могут служить выигрыши от при­ нимаемого решения (плана); потери от принимаемого решения, а также полезность, риск и- другие количественные критерии.

320

Данные, необходимые для принятия решения в условиях нео­ пределенности, обычно задаются в форме матрицы, строки кото­ рой соответствуют возможным действиям (управленческим реше­ ния) Rp а столбцы — возможным состояниям «природы» 5/.

Допустим, каждому Rj-uy действию и каждому возможному 5/-му состоянию «природы» соответствует результат (исход), опре­ деляющий результат (выифыш, полезность) при выборе у-го дейст­ вия и реализации /-го состояния, — Vj^.

Rx

Si

Si

...

S, ...

s„

 

Vu

Vn

••

Vu

••

Vu

 

Кг

Vix

У22

..

V2i

.••

Vln

(9.22)

 

 

 

 

 

 

 

 

Rj

^•'

Vj2

...

Vj, .

:

^^

 

 

 

 

 

 

Rm

V

Vml

••

^ mi

 

 

V

 

^ mi

 

 

 

 

Следовательно, математическая модель задачи принятия реше­ ний определяется множеством состояний {J/}, множеством планов (стратегий) {Rj} и матрицей возможных результатов \\Vji\\. В качест­ ве результатов в отдельных задачах рассматривается матрица ри­ сков \\rjl

Риск — мера несоответствия между разными возможными ре­ зультатами принятия определенных стратегий (действий).

Элементы матрицы рисков ||/}J| связаны с элементами матрицы полезностей (выигрышей) следующим соотношением:

г.. = К- -- К-

(9.23)

где V^ = max Vji — максимальный элемент в столбце / матрицы по-

^лезностей.

Если матрица возможных результатов \\Vji\\ представляет собой матрицу потерь (затрат), то элементы матрицы рисков \\rj\ следует определять по формуле

г = V- V,',

(9.24)

где Vi = min Vji — минимальный элемент в столбце / матрицы потерь J (результатов).

321

Таким образом, риск — это разность между результатом, кото­ рый можно получить, если знать действительное состояние «при­ роды», и результатом, который будет получен приу-й стратегии.

Матрица рисков дает более наглядную картину неопределенной ситуации, чем матрица выигрышей (полезностей).

Непосредственный анализ матриц выифышей Щ^Ц или рисков \\гр\\ не позволяет в общем случае принять решение по выбору оп­ тимальной стратегии (плана), за исключением тривиального слу­ чая, когда выигрыши при одной стратегии выше, чем при любой другой для каждого состояния «природы» (элементы матрицы вы­ игрышей в некоторой строке больше, чем в любой из других). Дру­ гими словами, имеется в наличии «доминирующая» стратегия.

Для принятия решения в условиях неопределенности использу­ ется ряд критериев. Рассмотрим некоторые из них. Это критерий Лапласа, критерий Вальда, критерий Сэвиджа, критерий Гурвица.

Критерий Лапласа. Этот критерий опирается на «принцип недо­ статочного основания» Лапласа, согласно которому все состояния «природы» 5/, / = 1,л полагаются равновероятными. В соответствии с этим принципом каждому состоянию 5/ ставится вероятность q^, определяемая по формуле

При этом исходной может рассматриваться задача принятия решения в условиях риска, когда выбирается действие Лу, дающее наибольший ожидаемый выигрыш. Для принятия решения для каж­ дого действия Rj вычисляют среднее арифметическое значение вы­ игрыша:

Mj(R) = ^iVj,,

(9.26)

Среди Mj(R) выбирают максимальное значение, которое будет соответствовать оптимальной стратегии Rj.

Другими словами, находится действие Rj , соответствующее

(9.27)

Если в исходной задаче матрица возможных результатов пред­ ставлена матрицей рисков ||/у,||, то критерий Лапласа принимает следующий вид:

322

minfi«

(9.28)

Пример 9.4. Одно из транспортных предприятий должно опре­ делить уровень своих провозных возможностей так, чтобы удовле­ творить спрос клиентов на транспортные услуги на планируемый пе­ риод. Спрос на транспортные услуги не известен, но ожидается (про­ гнозируется), что он может принять одно из четырех значений: 10, 15, 20 или 25 тыс. т. Для каждого уровня спроса существует наилуч­ ший уровень провозных возможностей транспортного предприятия (с точки зрения возможных затрат). Отклонения от этих уровней приводят к дополнительным затратам либо из-за превышения про­ возных возможностей над спросом (из-за простоя подвижного со­ става), либо из-за неполного удовлетворения спроса на транспорт­ ные услуги. Ниже приводится табл. 9.3, определяющая возможные прогнозируемые затраты на развитие провозных возможностей:

Таблица 9.3

 

Варианты провозных

Варианты спроса на транспортные

 

 

возможностей транспортного

1

услуги,д. е.

4

!

 

предприятия

2

3

1

1

6

12

20

24

 

2

9

7

9

28

 

 

3

23

18

15

19

 

 

4

27

24

21

15

 

Необходимо выбрать оптимальную стратегию.

Решение

Согласно условию задачи имеются четыре варианта спроса на транспортные услуги, что равнозначно наличию четырех состояний «природы»: Si, Si, S^, ^4. Известны также четыре стратегии разви­ тия провозных возможностей транспортного предприятия: Л], Л2, Лз» ^4- Затраты на развитие провозных возможностей при каждой паре iS} и Л/ заданы следующей матрицей (таблицей):

Л1

•^I

^3 5-4

6

12

20

24

V = R2

9

7

9

28

h

23

18

15

19

Л4

27

24

21

15.

323

Принцип Лапласа предполагает, что S^, S2, ^3, S4 равновероят­

ны. Следовательно, Р{5 = 5/} = — = •- = 0,25, / = 1, 2, 3, 4 и ожидае­

мые затраты при различных действиях Л^, /?2' ^з» ^4 составляют:

ЩЯ^) = 0,25 (6 4- 12 -f 20 + 24) = 15,5; ЩК2} = 0,25 (9 + 7 + 9 + 28) = 13,25; Ж{Лз} = 0,25 (23 + 18 + 15 + 19) = 18,75; IV{R^} = 0,25 (27 + 24 + 21 + 15) = 21,75.

Таким образом, наилучшей стратегией развития провозных воз­ можностей в соответствии с критерием Лапласа будет /?2-

Критерий Вальда (минимаксный или максиминный критерий). Применение данного критерия не требует знания вероятностей со­ стояний 5/. Этот критерий опирается на принцип наибольшей ос­ торожности, поскольку он основывается на выборе наилучшей из наихудших стратегий Rj,

Если в исходной матрице (по условию задачи) результат V^ представляет потери лица, принимающего решение, то при выборе оптимальной стратегии используется минимаксный критерий. Для определения оптимальной стратегии Rj необходимо в каждой строке матрицы результатов найти наибольший элемент max {К,/}, а затем

выбирается действие Rj (строка у), которому будет соответствовать наименьший элемент из этих наибольших элементов, т. е. дейст­ вие, определяющее результат, равный

W = min max | уЛ.

(9.29)

Если в исходной матрице по условию задачи результат Vji пред­ ставляет выигрыш (полезность) лица, принимающего решение, то при выборе оптимальной стратегии используется максиминный кри­ терий.

Для определения оптимальной стратегии Rj в каждой строке матрицы результатов находят наименьший элемент minJFy/j , а за­ тем выбирается действие Rj (строкау), которому будут соответство­ вать наибольшие элементы из этих наименьших элементов, т. е. действие, определяющее результат, равный

fF = minmax{K/J.

^^30)

324

Пример 9.5. Рассмотрим пример 9.4. Так как Vj^ в этом приме­ ре представляет потери (затраты), применим минимаксный крите­ рий. Необходимые результаты вычисления приведены в табл. 9.4:

 

 

 

 

 

 

Таблица 9.4

Х^^Состояния

 

Затраты, д. е.

 

max

 

Стра- \ v

 

 

(Vji)

 

= min max {Уц}

 

 

 

 

{Vji}

тегия Rj ^ v

Si

^2

^3

^4

 

 

^1

6

12

20

24

24

 

 

9

7

9

28

28

23

 

23

18

15

19

23

R,

27

24

21

15

27

 

Таким образом, наилучшей стратегией развития провозных воз­ можностей в соответствии с минимаксным критерием «лучшим из худших» будет третья, т. е. Яу

Минимаксный критерий Вальда иногда приводит к нелогич­ ным выводам из-за своей чрезмерной «пессимистичности». «Пес­ симистичность» этого критерия исправляет критерий Сэвиджа.

Критерий Сэвиджа использует матрицу рисков ||А}/||. Элементы данной матрицы можно определить по формулам (9.23), (9.24), ко­ торые перепишем в следующем виде:

niax|Fy/j - Vjf, если V -

выигрыш

0/ = Ку/-тш|Ку/}, если К -

(9.31)

потери.

Это означает, что /у/ есть разность между наилучшим значени­ ем в столбце / и значениями Vji при том же /. Отметим, что неза­ висимо от того, является ли Vj^ доходом (выигрышем) или потеря­ ми (затратами), rj^ в обоих случаях определяет величину потерь ли­ ца, принимаюихего решение. Следовательно, можно применять к Ау/ только минимаксный критерий. Критерий Сэвиджа рекоменду­ ет в условиях неопределенности выбирать ту стратегию Rj, при ко­ торой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален).

Пример 9.6. Рассмотрим пример 9.4. Заданная матрица опре­ деляет потери (затраты). По формуле (9.31) вычислим элементы матрицы рисков ||/yj|:

325

 

SI

Si

•^3

^4

Rx

0

5

11

9

\Ji 1 = ^2

3

0

0

13

Кг

17

11

6

4

RA

21

17

12

0

Полученные результаты вычислений с использованием крите­ рия минимального риска Сэвиджа оформим в табл. 9.5.

 

 

 

 

 

 

Таблица 9.5

\ v Состояние

 

Величина риска, д. е.

 

 

 

Стра- \ v

 

 

 

 

max {rji}= min max {/}/}

тегия Rj >v

Si

^2

^3

^4

 

 

^1

0

5

11

9

11

11

R,

3

0

0

13

13

 

17

11

6

4

17

 

RA

21

17

12

0

21

 

Введение величины риска rj^ привело к выбору первой страте­ гии Ri, обеспечивающей наименьшие потери (затраты) в самой не­ благоприятной ситуации (когда риск максимален).

Применение критерия Сэвиджа позволяет любыми путями из­ бежать большого риска при выборе стратегии, а значит, избежать большего проигрыша (потерь).

Критерий ГУрвица. Основан на следующих двух предположени­ ях: «природа» может находиться в самом невыгодном состоянии с вероятностью (1 — а) и в самом выгодном состоянии с вероятнос­ тью а, где а - коэффициент доверия. Если результат Vji — прибыль, полезность, доход и т п., то критерий Гурвица записыва­ ется так:

W = max!а max Vji + (l - a) min Vj^

(9.32)

J

 

Когда Vji представляет затраты (потери), то выбирают действие, дающее

Жп,1п=тш а min Vjj + (l - а) max Fy/

(9,33)

Если a = О, получим пессимистический критерий Вальда.

326

Если а = 1, то приходим к решающему правилу вида maxminK./ или к так называемой стратегии «здорового оптими-

j i

ста», т. е. критерий слишком оптимистичный.

Критерий Гурвица устанавливает баланс между случаями край­ него пессимизма и крайнего оптимизма путем взвешивания обоих способов поведения соответствующими весами (1 — а) и а, где О < а < 1. Значение а от О до 1 может определяться в зависимости от склонности лица, принимающего решение, к пессимизму или к оптимизму. При отсутствии ярко выраженной склонности а = 0,5 представляется наиболее разумной.

Пример 9.7. Критерий Гурвица используем в примере 9.4. По­ ложим а = 0,5. Результаты необходимых вычислений приведены в табл. 9.6.

Таблица 9.6

Wj

maxFy/

min Vjj

а • min Vji + (1 - a) • max Vj^

min IVj

 

6

24

15

15

 

7

28

17,5

 

 

15

23

19

 

 

15

27

21

 

Оптимальное решение заключается в выборе JV. Таким образом, в примере предстоит сделать выбор: по критерию Лапласа — выбор стратегии Rji

по критерию Вальда — выбор стратегии R^; по критерию Сэвиджа — выбор стратегии /?i;

по критерию Гурвица — выбор стратегии Ri при а = 0,5, а ес­ ли лицо, принимающее решение, — пессимист (а = 0), то выбор стратегии R^^

Какое из возможных решений предпочтительнее?

Это определяется выбором соответствующего критерия (Лапла­ са, Вальда, Сэвиджа или Гурвица).

Выбор критерия принятия решений в условиях неопределенно­ сти является наиболее сложным и ответственным этапом в иссле­ довании операций. При этом не существует каких-либо общих со­ ветов или рекомендаций. Выбор критерия должно производить ли­ цо, принимающее решение (ЛПР), с учетом конкретной специфи­ ки решаемой задачи и в соответствии со своими целями, а также опираясь на йрошлый опыт и собственную интуицию.

В частности, если даже минимальный риск недопустим, то сле­ дует применять критерий Вальда. Если, наоборот, определенный риск вполне приемлем и ЛПР намерено вложить в некоторое пред­ приятие столько средств, чтобы потом оно не сожалело, что. вложе­ но слишком мало, то выбирают критерий Сэвиджа.

327

9.5.Теория игр

вотличие от рассмотренных выше задач принятия решений в условиях определенности, риска и неопределенности, в которых внешняя среда (природа) предполагалась пассивной, в конфликт­ ных ситуациях имеются противодействующие стороны, интересы которых противоположны. При конфликтных ситуациях решения принимаются в условиях неопределенности двумя и более разум­ ными противниками, каждый из которых стремится оптимизиро­ вать свои решения за счет других. Теория, занимающаяся приня­ тием решений в условиях конфликтных ситуаций, называется теорией игр. Математическая модель конфликтной ситуации пред­ ставляет собой игру.

Игра — это совокупность правил, описывающих сущность кон­ фликтной ситуации. Эти правила устанавливают:

выбор образа действия игроков на каждом этапе игры;

информацию, которой обладает каждый игрок при осуществ­ лении таких выборов;

плату для каждого игрока после завершения любого этапа

игры.

Игру можно определить следующим образом:

имеются п конфликтующих сторон (игроков), принимающих решения, интересы которых не совпадают;

сформулированы правила выбора допустимых стратегий, из­ вестные игрокам;

определен набор возможных конечных состояний ифы (на­ пример, выифыш, ничья, проигрыш);

всем игрокам (участникам игры) заранее известны платежи, соответствующие каждому возможному конечному состоянию. Платежи задаются в виде матрицы Л = |lfl^y||.

В зависимости от числа конфликтующих сторон ифы делятся на парные (с двумя игроками) и множественные (имеющие не ме­ нее трех ифоков). Каждый ифок имеет некоторое множество (ко­ нечное или бесконечное) возможных выборов, т. е. стратегий.

Стратегией игры называется совокупность правил, определяю­ щих поведение ифока от начала игры до ее завершения. Стратегии каждого ифока определяют результаты или платежи в игре. Игра называется игрой с нулевой суммой, если проигрыш одного игрока равен выигрышу другого, в противном случае она называется игрой

сненулевой суммой.

Вподразд. 9.5 рассматриваются только игры двух лиц с нулевой суммой. Задание стратегий и В) двух ифоков в парной ифе пол­ ностью определяет ее исход, т. е. выигрыш одного или проигрыш другого. Игра называется конечной, если у каждого игрока имеется

328

конечное число стратегий. Результаты конечной парной игры с ну­ левой суммой можно задавать матрицей, строки и столбцы которой соответствуют различным стратегиям, а ее элементы — выигрышам одной стороны (равные проигрышам другой). Эта матрица называ­ ется платежной матрицей или матрицей игры.

Если первый ифок имеет т стратегий, а второй — п стратегий, то говорят, что мы имеем дело с игрой тхп.

Рассмотрим ифу т х п. Пусть заданы множество стратегий: для первого игрока {Ai), для второго игрока {Bj}, платежная матрица Атхп = WayW, где ау — выифыш первого игрока или проифыш вто­ рого ифока при выборе ими стратегий Ai и Bj соответственно. Каж­ дый из ифоков выбирает однозначно с вероятностью 1 некоторую стратегию, т.е. пользуется при выборе решения чистой стратегией. При этом решение ифы будет в чистых Сфатегиях. Поскольку инте­ ресы ифоков противоположны, то первый ифок сфемится макси­ мизировать свой выифыш, а второй ифок, наоборот, минимизиро­ вать свой проифыш.

Решение игры состоит в определении наилучшей стратегии каждым ифоком. Выбор наилучшей стратегии одним ифоком про­ водится при полном отсутствии информации о принимаемом ре­ шении вторым ифоком. Следует отметить, что и первый, и второй игрок являются разумными противниками, которые находятся в состоянии конфликта. Поэтому для решения ифы двух лиц с нуле­ вой суммой используется очень «пессимистичный» критерий, так называемый критерий мини-макса-максимина. Этот критерий рас­ смотрен в подразд. 9.4. Основное отличие заключается в том, что ранее «природа» не рассматривалась как активный противник, тог­ да как в теории игр каждый ифок действует разумно и, следова­ тельно, пытается активно помешать своему противнику. Так, если первый ифок применяет стратегию Л/, то второй будет сфемиться к тому, чтобы выбором соответствующей стратегии Bj свести выиг­ рыш первого ифока к минимуму, что равнозначно сведению своего проифыша к минимуму. Величина этого минимума

a/=mina,y, / = l,Aw.

(9.34)

Первый ифок (при любых ответах противника) будет стремить­ ся найти такую стратегию, при которой а, обращается в максимум:

а = maxа/ = max mm а(/•

(9.35)

Величина а называется нижней ценой игры. Ей соответствует максиминная стратегия, придерживаясь которой первый ифок при любых стратегиях противника обеспечит себе выифыш, не мень-

329