Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

4.3. Принятие решений в условиях риска

Предположим теперь, что игроку из прошлого опыта извест-

ны не только возможные состояния природы Qj , j =1, n , в кото-

рых может находиться природа Q , но и соответствующие веро-

ятности

p j = P (Q = Qj ) ,

с

которыми природа реализует

эти

состояния

(å p j =1). В

этом случае

мы отступаем от условий

полной неопределенности, и будем находиться в ситуации принятия

решений в условиях риска.

 

 

 

Рассмотрим некоторые

критерии

принятия решений в

игре

с природой в условиях риска.

 

 

 

Критерий Байеса относительно выигрышей

По этому критерию показателем эффективности стратегии

Ai , i =1, m называется среднее значение(математическое ожидание) выигрыша с учетом вероятностей всех возможных стратегий природы:

 

 

 

n

 

 

ai

= å pi aij ,i =

1, m

,

(4.20)

 

 

 

j =1

 

то есть

 

представляет

собой взвешенное среднее выигрышей

ai

i-й строки матрицы выигрышей, взятых с весами p1 , p2 , ..., pn . Оптимальной среди чистых стратегий по критерию Байеса

будет стратегия Ai0

с максимальным показателем эффективности

(4.20), то есть с максимальным выигрышем:

 

 

= max

 

 

(4.21)

 

ai

ai

0

i

 

Следовательно, выбранное таким образом решение является оптимальным не в каждом отдельном случае, а «в среднем».

№ 4.4. На промышленном предприятии готовятся к переходу на выпуск новых видов продукцииA1 , A2 , A3 , A4 . Результаты

95

принятых решений существенно зависят от степени обеспеченности производства материальными ресурсами Q1 , Q2 , Q3 . Каждому

сочетанию решений Ai , i =1, 4 и состояний среды Qj , j =1,3 со-

ответствует определенный выигрыш— эффективность выпуска новых видов продукции. Всевозможные выигрыши представлены в платежной матрице:

æ 25

35

40

ö

 

ç

70

20

30

÷

 

A = ç

÷ .

(4.22)

ç35

85

20

÷

 

ç

80

10

35

÷

 

è

ø

 

Найдите оптимальную стратегию по критерию Байеса относительно выигрышей, в предположении, что известны вероятности состояний природы p1 = 0, 2, p2 = 0,3, p3 = 0,5 .

Решение. Вычислим средние выигрыши:

a1 = 25 × 0,2 + 35 ×0,3 + 40 ×0,5= 35,5;

a2 = 70 × 0,2 + 20 × 0,3 + 30 × 0,5 = 35,0;

a3 = 35 × 0,2 + 85 ×0,3 + 20 ×0,5 = 42,5;

a4 = 80 ×0, 2 +10 ×0,3 + 35 × 0,5 = 36,5.

Тогда оптимальной по критерию Байеса является стратегия A3 , так как

a3 = max ai = 42,5 .

i

Критерий Байеса относительно рисков

Показателем эффективности стратегии Ai по критерию Байе-

са относительно рисков называется математическое ожидание рисков, расположенных в i-й строке матрицы RA :

96

n

 

ri = å p j rij ,i =1, m .

(4.23)

j=1

Иоптимальной будет стратегия с наименьшим значением среднего риска ri :

ri

= min ri .

(4.24)

0

i

 

При этом справедливо утверждение о ,томчто

критерии

(4.21)

и (4.24) эквивалентны, то есть по обоим

критериям

оптимальной будет одна та же стратегия.

 

Критерий Лапласа относительно выигрышей

В предыдущих двух критериях Байеса известные вероятности состояний природы могли быть получены, например, на основании статистических исследований. Однако часто складывается такая ситуация, при которой мы лишены возможности определить эти вероятности. Но, желая принять решение в условиях риска, мы вынуждены оценивать эти вероятности состояний природы субъективно. Существуют различные методы численной субъективной оценки степени правдоподобности состояний природы. Один из таких способов заключается в том, что мы считаем

их равновероятными: p

= p =... =p

n

=1

. То есть мы не можем

1

2

 

n

 

 

 

 

 

 

отдать предпочтение ни одному из состояний природы. Этот принцип называют еще принципом«недостаточного основания» Лапласа.

Таким образом, показатель эффективности будет равен:

 

 

1

n

ai

=

åaij ,i =

1, m

,

n

 

 

j =1

а наилучшая стратегия определяется по формуле (4.21).

97

№ 4.5. Найдите оптимальную стратегию в условиях 4№.4 по критерию Лапласа.

Решение. Вычислим средние выигрыши:

 

 

 

=

1

 

(25 + 35

+ 40) =

 

100

;

a1

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

3

 

 

 

 

 

=

 

1

(70 + 30 + 30) = 40;

 

 

 

a2

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

=

1

 

(35 + 85

 

+ 20 ) =

140

;

a3

 

 

 

 

 

 

 

 

3

 

 

3

 

 

 

 

=

1

(80 +10

+ 35) =

125

.

a4

 

 

 

 

 

3

 

3

 

 

 

Следовательно, оптимальной по критерию Лапласа является стратегия A3 , так как:

 

= max

 

=

140

.

a

a

 

3

i

i

3

 

 

 

 

Аналогично рассматривается критерий Лапласа и относительно рисков.

Критерий Байеса относительных значений вероятностей состояний природы с учетом выигрышей

Предположим, что вероятности состояний природы нам неизвестны, но мы имеем представление о том, какие состояния природы более правдоподобны, какие — менее правдоподобны. Это позволит представить (проранжировать) неизвестные вероятности состояний природы в виде убывающей или возрастающей числовой последовательности.

Например, можно считать, что последовательность неизвестных вероятностей p j состояний природы пропорциональна чле-

нам некоторой монотонной последовательности положительных чисел t1 , t2 , ..., tn :

p1 : p2 : ... : pn =t1 : t2 : ... :tn .

(4.25)

98

n

Учитывая, что å p j =1, можем получить следующие оценки

j =1

вероятностей:

p j

æ

n

ö-1

 

 

(4.26)

 

 

=t j ç

åtk ÷

, j =1, n .

 

è k =1

ø

 

 

 

 

№ 4.6. Найдите оптимальную стратегию в условиях 4№.4, если есть основания считать, что вероятности состояний природы образуют строго убывающую числовую последовательность, пропорциональную убывающей арифметической прогрессии 3, 2, 1, то есть:

p1 : p2 : p3 = 3 : 2 : 1 .

Решение. Вычислим оценки вероятностей состояний природы по формуле (4.26):

 

p =

1

 

, p

 

=

 

 

1

 

, p =

1

.

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

3

3

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда средние выигрыши будут равны:

 

 

=

1

 

× 25 +

1

×35 +

1

× 40 =

 

185

;

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

3

 

 

 

 

 

6

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

1

 

 

 

280

 

140

 

 

a2

 

× 70 +

× 20 +

×30 =

 

;

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

2

 

3

6

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

=

1

 

×35 +

1

×85 +

1

 

 

× 20 =

295

;

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

2

 

 

 

 

3

 

 

 

 

 

6

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

1

 

×80 +

1

×10 +

1

×35 =

295

.

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

2

 

 

 

 

3

 

 

 

6

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, игроку можно порекомендовать сделать

выбор

между стратегиями А3 и

A4 с наибольшими средними

выигрышами.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

99

Аналогичный критерий можно рассмотреть и для матрицы рисков.

При принятии решений в условиях риска можно применить и критерий, основанный на применении среднего квадратического отклонения — критерий минимизации среднего квадратического отклонения (вариации). Рассмотрим применение этого критерия на примере № 4.4.

Вычислим средние квадратические отклонения выигрышей:

 

2

= 25

2

×0,2 + 35

2

×0,3 + 40

2

2

32, 25

, s1 = 5,68 ;

s1

 

 

 

× 0,5 - 35,5=

s

2

= 70

2

×0,2 + 20

2

×0,3 + 30

2

2

325,0

, s2 =18,03 ;

2

 

 

 

×0,5 - 35,0=

s32 = 352 ×0, 2 + 852 ×0,3 + 202 ×0,5 - 42,52 = 806, 25 , s3 = 28,39 ;

s42 = 802 ×0, 2 +102 ×0,3 + 352 ×0,5 - 36,52 = 590, 25 , s4 = 24,30 .

Следовательно, если по критерию Байеса предпочтения игрока можно проранжировать как:

A3 f A4 f A1 f A2 ,

то по критерию минимизации среднего квадратического отклонения, получаем:

A1 f A2 f A4 f A3 .

То есть наиболее предпочтительной является стратегияA1 с наименьшим значением(5,68) среднего квадратического отклонения.

Данная ситуация наиболее характерна для задач принятия решений, когда стратегия, наиболее предпочтительная по кри-

терию максимизации среднего

выигрыша, наименее

выгодна

по критерию минимизации среднего квадратического отклонения.

Таким образом, в условиях №4.4

игроку предстоит сделать

выбор между двумя стратегиями A1

и

A3 , один из которых ( A3 )

характеризуется и большим средним выигрышем

и большим

100