Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Metodichka_MU_2012.doc
Скачиваний:
8
Добавлен:
30.08.2019
Размер:
482.3 Кб
Скачать

4.1.2 Статистические игры. Критерии для принятия решений

В рассмотренных задачах теории игр предполагалось, что в них принимают участие два участника, интересы которых противоположны. Поэтому действия каждого игрока направлены на увеличение выигрыша (уменьшение проигрыша). Однако во многих задачах, приводящихся к игровым, неопределенность вызвана отсутствием информации об условиях, в которых осуществляется действие. Эти условия зависят не от сознательных действий другого игрока, а от объективной действительности, которую принято называть природой. Такие игры называются играми с природой. Человек А в играх с природой старается действовать осмотрительно, используя, например, минимаксную стратегию, позволяющую получить наименьший проигрыш. Второй игрок В (природа) действует совершенно случайно, возможные стратегии определяются как ее состояния (например, условия погоды в данном районе, спрос на определенную продукцию, объем перевозок, некоторое сочетание производственных факторов и т.д.). В некоторых задачах для состояний природы может быть задано распределение вероятностей, в других - оно неизвестно. Условия игры, как и в рассмотренных выше задачах, задаются в виде матрицы:

a11 a12 ... a1n

A = a21 a22 ... a2n

. . . . . . . . . . . .

am1 am2 ... amn

Элемент aij равен выигрышу игрока A, если он использует стратегию Ai, а состояние природы - Рj.

Безразличие природы к игре (выигрышу) и возможность получения ЛПР дополнительной информации о её состоянии отличают игру с природой от обычной матричной игры, в которой принимают участие два сознательных игрока. Отличие в решении статистической игры состоит прежде всего в упрощении игры: выявление дублирующих и доминируемых стратегий производится только для стратегий ЛПР. Стратегии природы нельзя опускать, поскольку она не имеет "умысла" навредить и даже может реализовать состояния заведомо выгодные человеку.

В ряде случаев при решении игры рассматривают матрицу рисков R. Элементы матрицы rij представляют собой разность между выигрышем, который получил бы игрок A, если бы знал состояние Рj, и выигрышем, который он получит в тех же условиях, применяя стратегию Aj, т.е. rij = j - aij,

где j = mах aij

i

Рассмотрим ряд критериев, используемых при решении игр с природой. По критерию Байеса при известном распределении вероятностей различных состояний природы критерием принятия решения является максимум среднего выигрыша (минимум среднего риска).

Принцип недостаточного основания Лапласа: когда вероятности состояний природы неизвестны, все состояния природы полагаются равновероятными и за оптимальную принимается та чистая стратегия, при которой обеспечивается максимум среднего выигрыша.

Используют также и другие методы оценки вероятности для отдельных состояний природы. Однако во всех случаях нельзя утверждать, что принятое решение является оптимальным, оптимальным оно является только относительно принятого распределения вероятностей состояний природы.

Если вопрос распределения вероятностей состояний природы не решен, то используют следующие критерии.

Максиминный критерий Вальда, который совпадает с критерием выбора максиминной стратегии, позволяющим получить нижнюю цену игры для двух лиц с нулевой суммой. Согласно этому критерию выбирается стратегия, гарантирующая при любых условиях выигрыш, не меньший чем:

max min aij.

i j

Критерий минимального риска Сэвиджа рекомендует выбирать в качестве оптимальной стратегию, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации, т.е.

min max rij.

i j

Как критерий Вальда, так и критерий Сэвиджа основаны на самой пессимистической оценке обстановки. В отличие от них критерий Гурвица учитывает как пессимистический, так и оптимистический подход к ситуации. Принимается решение о выборе стратегии, при которой имеет место

max  min aij + (1 - ) max aij, где 0    1.

i j j

Значение выбирают на основании субъективных соображений. Чем больше желание подстраховаться в данной ситуации, тем ближе к единице значение .

При  = 0 имеем критерий крайнего оптимизма, при  = 1 – критерий пессимизма Вальда.

Решение статистической игры по рассмотренным критериям позволяет более обоснованно принимать ту стратегию, которая гарантирует ЛПР больший выигрыш по сравнению с выигрышем, принимаемым ЛПР интуитивно или исходя из опыта.

Пример 4. Возможно строительство четырех типов электростанций: А1 (тепловых), A2 (приплотинных), A3 (бесшлюзовых) и A4 (шлюзовых). Эффективность каждого из типов зависит от различных факторов: режима рек, стоимости топлива и его перевозки и т. п. Предположим, что выделено четыре различных состояния, каждое из которых означает определенное сочетание факторов, влияющих на эффективность энергетических объектов. Состояния природы обозначим через Р1, Р2, Р3 и Р4. Экономическая эффективность строительства отдельных типов электростанций изменяется в зависимости от состояний природы и задана матрицей:

5 2 8 4

А = 2 3 4 12

8 5 3 10

1 4 2 8

Согласно критерию Вальда max min aij = mах 2; 2;3; 1 = 3,

i j

следует предусмотреть строительство бесшлюзовой ГЭС.

Воспользуемся критерием Сэвиджа. Построим матрицу рисков:

3 3 0 8

R = 6 2 4 0

0 0 5 2

7 1 6 4

Покажем, например, как были получены элементы первого столбца матрицы R. Имеем maxi ai1 = a31 = 8, поэтому

r11 = a31 - a11 = 3, r21 = a31 - a21 = 6, r31 = a31 - a31 = 0, r41 = a31 - a41 = 7.

Согласно критерию Севиджа определяем min max rij = 8; 6; 5; 7 = 5.

i j

В соответствии с этим критерием также предполагается решение A3.

Воспользуемся критерием Гурвица. Положим  = 0,5;

тогда max  min aij + (1 - ) max aij = max 5; 7; 6,5; 4,5 = 7,

i i

т. е. следует принять решение о строительстве приплотинных ГЭС.

Если предположить известным распределение вероятностей для различных состояний природы, например, считать эти состояния равновероятными (q1 = q2 = q3 =q4 = 14) , то для принятия решения следует найти математические ожидания выигрыша:

M1 = 51/4 + 21/4 + 81/4 + 41/4 = 43/4,

M2 = 21/4 + 31/4 + 41/4 + 121/4 = 51/4,

M3 = 81/4 + 51/4 + 31/4 + 101/4 = 61/2,

M4 = 11/4 + 41/4 + 21/4 + 81/4 = 33/4.

Так как максимальное значение имеет М3, то следует выбрать решение А3.