Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Игры_с_природой

.pdf
Скачиваний:
5
Добавлен:
27.05.2015
Размер:
173.67 Кб
Скачать

Министерство сельского хозяйства РФ Федеральное государственное образовательное учреждение

высшего профессионального образования «Мичуринский государственный аграрный университет»

Кафедра математического моделирования экономических систем

УТВЕРЖДЕНО протокол № 9

методической комиссии экономического факультета от 12 марта 2008г.

ИГРЫ С ПРИРОДОЙ

Учебно-методическое пособие для студентов экономических специальностей

Мичуринск наукоград РФ

2008

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

Учебно-методическое пособие составлено зав. кафедрой математи- ческого моделирования экономических систем, доктором экономических наук, профессором Б.И. Смагиным

Рецензент:

Зав. кафедрой математики и физики Мичуринского государственного

аграрного университета А.И. Бутенко

Рассмотрено на заседании кафедры Протокол № 8 от 13.02. 2008 г.

 

Содержание

 

1.

Основные понятия игры с природой………………..……..………

3

2.

Принятие решений в условиях полной неопределенности..…….

4

3.

Принятие решений в условиях риска.……………………………

7

4.

Контрольные вопросы и задания для практических занятий....…

9

 

Список литературы…………………………………………………

14

©Издательство Мичуринского государственного аграрного университета, 2008

2

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

1. ОСНОВНЫЕ ПОНЯТИЯ ИГРЫ С ПРИРОДОЙ

Отличительная особенность игры с природой состоит в том, что в ней имеется один активный игрок (игрок 1), а игрок 2 (природа) не дейст- вует сознательно против игрока 1 (по образному выражению А. Эйнштей- на, природа сложна, но не злонамеренна), а выступает как не имеющий конкретной цели партнер по игре, который выбирает свои ходы случайным образом. Термин «природа» характеризует некую объективную действи- тельность.

Платежная матрица игры с природой имеет вид:

æ a

a

K a

ö

 

ç 11

12

1n

÷

 

A = ç a21

a22

K a2n ÷

, (1)

ç K

K

K K ÷

 

ç

am2

 

÷

 

èam1

K amn ø

 

где aij выигрыш игрока 1 при выборе им i-й стратегии, а игроком 2 – j-й стратегии (i= 1,2,…,m; j = 1,2,…,n). Следует сразу отметить, что мажори- рование стратегий в игре с природой имеет определенную специфику: ис- ключать из рассмотрения можно лишь доминируемые стратегии 1-го игро- ка. Если для всех j = 1,2,…,n выполняется условие aqj akj, то q-ю страте- гию игрока 1 можно не рассматривать и удалить из матрицы А. Столбцы же, которые отвечают стратегиям игрока 2 (природы) исключать из матри- цы игры А недопустимо, т.к. природа не стремится к выигрышу и для нее нет целенаправленно выигрышных или проигрышных стратегий. С одной стороны отсутствие противодействия упрощает игроку 1 задачу выбора решения, но имеет место проблема обоснования выбора, так как гаранти- рованный результат не известен.

Методы принятия решений в играх с природой зависят от характера неопределенности в поведении игрока 2, т.е. от того, известны или нет ве- роятности состояний (стратегий) природы. В первом случае мы имеем си- туацию риска, а во втором полной неопределенности. В силу этого ино- гда игру с природой задают не в виде матрицы выигрышей, а в виде мат-

рицы рисков или матрицы упущенных возможностей

æç r11

R= çç Kr21 çè rm1

r12

K r1n ö

 

r

K r ÷

(2)

22

2n ÷

K K K ÷

 

rm2

÷

 

K rmn ø

 

Риском rij игрока 1 при использовании им i-й стратегии и при j-м со- стоянии среды (природы) называется разность между выигрышем, кото- рый игрок получил бы, если бы он знал, что наступит j-е состояние среды

3

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

и выигрышем, который игрок получит, не обладая этой информацией. Зная j-е состояние природы, игрок выбирает ту стратегию, при которой его вы- игрыш максимален, т.е.

rij = β j aij

= max aij aij

 

1 ≤ i m

Например, для матрицы выигрышей

æ

2

3

1

7

ö

 

ç

4

2

9

1

÷

 

ç

÷

(3)

A = ç

3

5

8

6

÷

ç

6

4

2

2

÷

 

ç

÷

 

ç

5

3

7

2

÷

 

è

ø

 

β1= 6; β2= 5; β3= 9; β4= 7. Поэтому матрица рисков

æ

4

2

8

0

ö

 

ç

2

3

0

6

÷

 

ç

÷

(4)

R = ç

3

0

1

1

÷

ç

0

1

7

5

÷

 

ç

÷

 

ç

1

2

2

5

÷

 

è

ø

 

2. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЕННОСТИ

В данной ситуации используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица. Применение каждого из этих критериев проил- люстрируем на примере выше рассмотренной матрицы выигрышей и свя- занной с ней матрицы рисков.

Критерий максимакса (критерий крайнего оптимизма) определяет стратегию, максимизирующую максимальные выигрыши для каждого со- стояния природы. Наилучшим признается решение, при котором достига- ется максимальный выигрыш, равный

M = max max aij

1 ≤ i m 1 ≤ j n

Легко видеть, что для матрицы А наилучшим решением будет А2, при котором достигается максимальный выигрыш, равный 9.

4

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

Ситуации, требующие применения такого критерия в экономике ис- пользуют игроки, поставленные в безвыходное положение, при котором они руководствуются принципом «или пан, или пропал».

Максиминный критерий Вальда (критерий крайнего пессимизма) рассматривает природу как агрессивно настроенного и сознательно дейст- вующего противного, аналогичного тому, который был рассмотрен в мат- ричной игре двух лиц с нулевой суммой. Выбирается решение, для которо-

го достигается значение

 

 

W = max min aij

 

 

 

1 ≤ i m 1

j n

 

 

Для платежной матрицы А имеем:

 

 

min a1 j

= min a2 j

= 1; min a3 j

= 3;

min a4 j

= min a5 j = 2.

1 ≤ j ≤ 4

1 ≤ j ≤ 4

1 ≤ j ≤ 4

 

1 ≤ j ≤ 4

1 ≤ j ≤ 4

Тогда

W = max min aij

= 3,

 

 

 

 

 

1 ≤ i m 1 ≤ j

n

 

 

что соответствует третьей стратегии А3 игрока 1.

Такая стратегия ориентируется на худший случай, когда игрок не за- интересован в крупной удаче, но хочет застраховать себя от неожиданных проигрышей.

Критерий минимаксного риска Сэвиджа аналогичен выбору стра-

тегии по критерию Вальда, но игрок руководствуется не платежной матри- цей A, а матрицей рисков R:

 

 

S = min max r

 

 

 

 

 

1 ≤ i m 1 ≤ j n ij

 

 

 

Для выше приведенной матрицы R имеем:

 

 

 

max r

= 8; max r

= 6; max r

= 3; max r

= 7; max r

= 5.

1 ≤ j ≤ 4 1 j

1 ≤ j ≤ 4 2 j

1 ≤ j ≤ 4 3 j

1 ≤ j ≤ 4

4 j

1 ≤ j ≤ 4 5 j

 

Минимально возможный из самых крупных рисков, равный 3, дости- гается при использовании третьей стратегии А3.

Критерий пессимизма – оптимизма Гурвица рекомендует руково-

дствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и оптимизмом. Согласно этому критерию

стратегия в матрице А выбирается в соответствии со значением

HA = max1≤im {p ×1minjn aij + (1- p) × max1≤ jn aij},

где р коэффициент пессимизма (p [0; 1]). При р = 0 данный критерий совпадает с максимаксным критерием М, а при р = 1 – с критерием Вальда W. Рассмотрим процедуру применения данного критерия для матрицы А при р = 0,5:

5

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

для первой стратегии

0,5

 

min a

 

+ max a

 

 

= 0,5(1+ 7) = 4;

 

 

 

 

(1≤ j≤4

1 j

 

1≤ j≤4

1 j

)

 

 

 

для второй стратегии

 

 

 

 

 

 

)

 

 

 

 

0,5

min a2 j + max a2 j

= 0,5(1+ 9) = 5;

 

 

 

 

 

 

(1≤ j≤4

 

 

 

1≤ j≤4

 

 

 

 

 

 

для третьей стратегии

 

 

 

 

)

 

 

 

 

0,5

 

min a3 j

+ max a3 j

= 0,5(3 + 8) = 5,5;

 

 

 

 

 

(1≤ j≤4

 

 

1≤ j≤4

 

 

 

 

 

для четвертой стратегии

 

 

 

 

)

 

 

 

0,5

 

min a

4 j

 

+ max a

4 j

= 0,5(2 + 6) = 4;

 

 

(1≤ j≤4

 

1≤ j≤4

 

 

 

для пятой стратегии

 

 

 

 

 

)

 

 

 

 

0,5

min a5 j + max a5 j

= 0,5(2 + 7) = 4,5.

 

 

 

(

1≤ j≤4

 

 

1≤ j≤4

 

 

 

 

 

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ij )}

 

H

A

 

= max

0,5

min a

ij

+ max a

= 5,5,

 

 

 

 

 

1≤i≤5

{

 

 

(1≤ j≤4

 

 

1≤ j≤4

 

т.е. оптимальной является третья стратегия А3. Очевидно, что при измене- нии коэффициент пессимизма р оптимальной может стать другая страте- гия. В частности при р = 0,2 оптимальной будет вторая стратегия при HA = 7,4.

Применительно к матрице рисков R критерий Гурвица имеет вид:

HR = 1minim {p × max1≤ jn rij + (1- p) ×1minjn rij }.

При р = 0 выбор стратегии осуществляется по условию наименьшего из всех возможных рисков, а при р = 1 – по критерию минимаксного риска Сэвиджа.

Рассмотрим результаты применения рассмотренных критериев на примере следующей платежной матрицы:

æ

20

15

30

42

60

ö

 

ç

15

70

45

20

35

÷

 

A = ç

÷

(5)

ç

25

20

40

75

10

÷

 

ç

÷

 

è

80

10

20

10

40

ø

 

тогда матрица рисков

6

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

æ

60

55

15

33

0

ö

 

ç

65

0

0

55

25

÷

 

R = ç

÷

(6)

ç

55

50

5

0

50

÷

 

ç

÷

 

è

0

60

25

65

20

ø

 

Для игрока 1 лучшими являются стратегии:

-по критерию максимакса А4 (М = 80);

-по критерию Вальда А1 и А2 (W = 15);

-по критерию Сэвиджа А3 (S = 55);

-по критерию Гурвица (р = 0,5) – А4 (HA = 45).

Таким образом, при отсутствии информации о вероятностях всех возможных состояниях природы нет однозначных и математически обос- нованных рекомендаций для выбора наилучшей стратегии. Принимаемые же решения в значительной степени субъективны. Тем не менее, примене- ние математических методов позволяет упорядочить имеющиеся данные, т.к. задается множество состояний природы, альтернативные решения, вы- игрыши и потери при различных состояниях природы, что способствует повышению качества принимаемых решений.

3.ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ РИСКА

Вэтом случае различным состояниям природы поставлены в соот- ветствие соответствующие вероятности. Таким образом, игрок 1 принима- ет решение на основе критерия максимального ожидаемого среднего выиг- рыша или минимального ожидаемого среднего риска.

Если для некоторой игры с природой, заданной платежной матрицей

A={aij} стратегиям природы Пj (j=1,2,…,n) соответствуют вероятности pj, то оптимальной стратегией игрока 1 будет та, которая обеспечивает ему максимальный средний выигрыш (максимизирует математическое ожида- ние выигрыша), т.е.

n

max å p j × aij (7)

1≤im j=1

Применительно к матрице упущенных возможностей (матрице рис- ков) оптимальной будет стратегия, обеспечивающая ему минимальный средний риск:

n

min å pj × rij (8)

1≤im j=1

7

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

Следует отметить, что критерии (7) и (8) эквивалентны в том смысле, что они достигаются при одной и той же оптимальной стратегии Ai игрока 1. Действительно,

n

 

n

æ

n

n

ö

 

min å pjrij = min

å pj (β j - aij ) = min ç

å pj β j - å pjaij ÷

=

1≤im j=1

1≤im

j=1

1≤im è

j=1

j=1

ø

 

 

n

 

n

 

n

= min å pjβ j - min

å pjaij = const + max å pjaij

1≤im

j=1

1≤im

j=1

1≤im

j=1

 

 

 

Таким образом, значения критериев (7) и (8) отличаются только на

постоянную величину и достигаются при одной и той же оптимальной стратегии Ai. Пусть для платежной матрицы (5) р1 = 0,1; р2 = р3 = 0,2; р4 = 0,4; р5=0,1. Тогда

для первой стратегии

5

å pja1 j = 0,1× 20 + 0,2 ×15 + 0,2 ×30 + 0,4 × 42 + 0,1× 60 = 33,8

j=1

для второй стратегии

5

å pja2 j = 0,1×15 + 0,2 ×70 + 0,2 × 45 + 0,4 × 20 + 0,1× 35 = 36

j=1

для третьей стратегии

5

å pja3 j = 0,1× 25 + 0,2 × 20 + 0,2 × 40 + 0,4 ×75 + 0,1×10 = 45,5

j=1

для четвертой стратегии

5

å pja4 j = 0,1×80 + 0,2 ×10 + 0,2 × 20 + 0,4 ×10 + 0,1× 40 = 22

j=1

Таким образом, для игры, задаваемой платежной матрицей (5) при заданных вероятностях различных состояний природы, оптимальной стра- тегий по критерию (7) является А3.

Для матрицы рисков (6) имеем:

для первой стратегии

5

å pjr1 j = 0,1× 60 + 0,2 ×55 + 0,2 ×15 + 0,4 ×33 + 0,1× 0 = 33,2

j=1

для второй стратегии

5

å pjr2 j = 0,1×65 + 0,2 ×0 + 0,2 ×0 + 0,4 ×55 + 0,1× 25 = 31

j=1

8

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

для третьей стратегии

5

å pjr3 j = 0,1×55 + 0,2 ×50 + 0,2 ×5 + 0,4 ×0 + 0,1×50 = 21,5

j=1

для четвертой стратегии

5

å pjr4 j = 0,1×0 + 0,2 ×60 + 0,2 × 25 + 0,4 × 65 + 0,1× 20 = 45

j=1

Таким образом, и для критерия (8) лучшей является стратегия А3.

Рассмотренные процедуры принятия решений в условиях риска представляют собой одноэтапные игры с природой, которые удобно ис- пользовать в задачах, имеющих одно множество альтернативных решений и одно множество состояний природы. В то же время существует целый ряд задач, требующих анализа последовательности решений и состояний природы, когда одна совокупность стратегий игрока и состояний среды порождает другое состояние подобного типа. Причем последующие реше- ния основываются на результатах предыдущих. Подобного рода игры на- зываются многоэтапными или позиционными играми. Графическим изо-

бражением последовательности решений и состояний среды с указанием соответствующих вероятностей и выигрышей для любых комбинаций аль- тернатив и состояний природы является дерево решений.

4. КОНТРОЛЬНЫЕ ВОПРОСЫ И ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ

1.Каким образом в игре с природой из платежной матрицы А полу- чается матрица рисков R?

2.Дайте интерпретацию элементов rij в матрице рисков R.

3.Какова процедура определения оптимальной стратегии при игре с природой в условиях полной неопределенности при использовании игро- ком 1 критериев:

а) максимакса; б) Вальда; в) Сэвиджа; г) Гурвица?

4.Какие критерии используются в игре с природой при принятии решений в условиях риска?

Задания для практических занятий

При игре с природой задана платежная матрица А.

æ a

a

a

a

ö

ç 11

12

13

14

÷

A = ça21

a22

a23

a24 ÷

ç a31

a32

a33

a34

÷

ç

a42

a43

a44

÷

èa41

ø

9

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com

Определить:

1.Матрицу рисков R и оптимальные стратегии первого игрока при использовании им а) критерия максимакса; б) критерия Вальда; в) крите- рия Сэвиджа и г) критерия Гурвица с коэффициентом пессимизма р;

2.Определить оптимальную стратегию при известном векторе веро- ятностей состояний природы Р = (р1, р2, р3, р4).

 

æ

10

15

 

4

 

16

ö

 

 

 

 

 

ç

12

18

 

5

 

22

÷

 

 

 

P = (0,3; 0,1; 0,2; 0,4)

1.

A = ç

 

 

÷

;

p = 0,1;

 

ç

14

12

 

18

 

11

÷

 

 

 

 

 

ç

 

 

÷

 

 

 

 

 

è

6

21

 

17

 

8

ø

 

 

 

 

 

æ

11

14

 

5

 

15

ö

 

 

 

 

 

ç

 

 

 

 

 

 

÷

 

 

 

P = (0,1; 0,2; 0,3; 0,4)

2.

A = ç

13

17

 

6

 

21÷

;

p = 0,2;

 

ç

 

11

 

19

 

10

÷

 

 

 

 

 

ç15

 

 

÷

 

 

 

 

 

è

7

20

 

18

 

7

ø

 

 

 

 

 

æ

15

14

 

11

 

18

 

ö

 

 

 

 

ç

10

19

 

12

 

20

 

÷

 

 

P = (0,1; 0,3; 0,4; 0,2)

3.

A = ç

 

 

 

÷

;

p = 0,3;

 

ç

17

16

 

29

 

8

 

 

÷

 

 

 

 

ç

 

 

 

 

÷

 

 

 

 

è

13

26

 

18

 

12

 

ø

 

 

 

 

æ

6

4

3

5

ö

 

 

 

 

 

 

 

 

 

ç

7

9

8

3

÷

 

p = 0,4; P = (0,2; 0,3; 0,4; 0,1)

4.

A = ç

÷

;

 

ç

2

6

1

8

÷

 

 

 

 

 

 

 

 

 

ç

÷

 

 

 

 

 

 

 

 

 

è

6

7

2

5

ø

 

 

 

 

 

 

 

 

 

æ

17

12

 

13

 

16

ö

 

 

 

 

ç

12

17

 

14

 

18

÷

 

 

P = (0,2; 0,1; 0,2; 0,5)

5.

A = ç

 

 

÷;

p = 0,5;

 

ç

19

14

 

27

 

10

÷

 

 

 

 

ç

 

 

÷

 

 

 

 

è

15

22

 

20

 

11

ø

 

 

 

 

æ

21

32

23

26

ö

 

 

 

 

ç

27

30

24

 

24

÷

 

 

P = (0,2; 0,2; 0,3; 0,3)

6.

A = ç

 

÷

;

p = 0,6;

 

ç

22

14

 

28

 

20

÷

 

 

 

 

ç

 

 

÷

 

 

 

 

è

15

23

28

 

29

ø

 

 

 

10

PDF created with FinePrint pdfFactory Pro trial version www.pdffactory.com