Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 26.doc
Скачиваний:
19
Добавлен:
26.05.2015
Размер:
268.29 Кб
Скачать

26.7. Статистические игры

Рассмотренные выше игры часто называют стратегическими играми. В их основе лежит предположение о том, что каждый игрок действует активно и стремится, по возможности, использовать свою оптимальную стратегию для получения наибольшего выигрыша.

Однако во многих практических ситуациях один из игроков оказывается нейтральным и не стремится извлечь максимальной выгоды. В качестве такого игрока часто выступает природа, т.е. совокупность внешних обстоятельств, в которых приходится принимать решение.

Природа не имеет злого умысла по отношению к человеку и не стремится нанести ему ущерб. Она просто действует и развивается в соответствии со своими законами. Если бы человек точно знал законы природы, он мог бы их использовать с максимальной пользой. Однако во многих случаях человек не знает законов природы или знает их недостаточно точно. В такой ситуации неполной информации о законах природы существует возможность принятия ошибочных решений.

Игры, в которых одним противником является природа, а другим человек, получили название статистических игр. Обычно человека, участвующего в игре против природы, называют статистиком. Будем считать природу первым игроком, а статистика – вторым (игроком В).

Пусть имеется некоторое множество возможных состояний природы П1, П2, … , Пm. Обозначим возможные решения (стратегии) статистика B1, B2, … , Bn. При выборе какой-то стратегии статистик может потерпеть убыток aij, зависящий как от выбранной им стратегии Bj, так и от состояния Пi, которое примет природа.

Пусть известны все значения aij. Тогда матрица игры (часто называемая матрицей последствий или матрицей потерь) может быть записана либо в виде таблицы

П

В

B1

В2

Вn

П1

a11

a12

a1n

П2

a21

a22

a2n

Пm

am1

am2

amn

либо в виде обычной матрицы:

.

Иногда при решении статистической игры используется матрица рисков. Элементы rij матрицы рисков равны разности между тем убытком, который статистик получит, выбирая стратегию Bj, и минимально возможным убытком при том же состоянии природы Пi:

.

Если не известно, с какими вероятностями природа принимает состояния П1, П2, … Пm, то говорят, что решение принимается в условиях полной неопределенности. При этом для выбора оптимальной стратегии статистика можно использовать несколько правил.

Правило Вальда. За оптимальную принимается стратегия, которая в наихудших условиях гарантирует минимальный проигрыш, т.е. стратегия, соответствующая верхней цене игры :

.

Правило Сэвиджа. Рекомендуется выбирать в качестве оптимальной стратегии ту, при которой величина максимального риска минимизируется в наихудших условиях, т.е. обеспечивается

.

Правила Вальда и Сэвиджа ориентируют статистика на самые неблагоприятные состояния природы, т.е. эти правила выражают пессимистическую оценку ситуации.

Правило Гурвица является правилом пессимизма-оптимизма. За оптимальную принимается та стратегия, для которой выполняется соотношение:

,

где 0    1.

При  = 0 имеем критерий крайнего оптимизма, а при  = 1 – критерий пессимизма Вальда. При промежуточных значениях 0 <  < 1 имеем нечто среднее. Для страховки обычно  принимают близким к единице. В общем случае число  выбирают, исходя из опыта.

Пример. Задача о замене оборудования.

Установленное на предприятии оборудование после 5 лет работы может оказаться в одном из трех состояний:

П1 – оборудование вполне работоспособно и требует лишь небольшого текущего ремонта.

П2 – некоторые детали значительно износились и требуют серьезного ремонта или замены.

П3 – основные детали износились настолько, что дальнейшая эксплуатация оборудования невозможна.

Для предприятия возможны три различных способа действия:

В1 – оставить оборудование в работе еще на год, проведя незначительный ремонт своими силами.

В2 – провести капитальный ремонт оборудования с вызовом специальной бригады ремонтников.

В3 – заменить оборудование новым.

Потери, которые несет предприятие при различных способах действия, приведены в таблице в относительных денежных единицах. В потери входят стоимость ремонта или замены оборудования, а также убытки, связанные с ухудшением качества продукции и с простоями, вызванными неисправным оборудованием.

Пi

Вj

В1

В2

В3

П1

1

3

5

П2

5

2

4

П3

7

6

3

Требуется найти оптимальный способ действий для предприятия.

Решение.

а) Правило Вальда. Найдем в каждом столбце таблицы наибольшее значение, а из всех наибольших выберем наименьшее . Стратегия, соответствующая , будет оптимальным способом действий предприятия по правилу Вальда.

7

6

5

= 5

Отсюда следует, что оптимальной стратегией является стратегия В3.

б) Правило Сэвиджа. На основе матрицы последствий по формуле

составим матрицу рисков:

Пi

Вj

В1

В2

В3

П1

0

2

4

П2

3

0

2

П3

4

3

0

Найдем в каждом столбце таблицы наибольшее значение, а из всех наибольших выберем наименьшее . Стратегия, соответствующая этому значению, будет оптимальным способом действий предприятия по правилу Сэвиджа.

4

3

4

Отсюда следует, что оптимальной стратегией является стратегия В2.

в) Правило Гурвица. Рассмотрим оптимистический ( = 0) и оптимистическо-пессимистический ( = 0,5) случаи. При = 1 правило Гурвица совпадает с правилом Вальда.

= 0.

Найдем . Для этого в матрице последствий в каждом столбце найдем наименьшее значение и из них выберем наименьшее.

1

2

3

Отсюда видно, что оптимальной стратегией является стратегия В1.

= 0,5.

Найдем .

7

6

5

1

2

3

4

4

4

Отсюда видно, что все стратегии предприятия равнозначны.

В статистической игре из прошлого опыта может быть известно, как часто природа находится в состоянии Пi. То есть известно распределение вероятностей

p(Пi)=(p1, p2, … , pm).

Такая запись означает, что природа принимает состояние П1 с вероятностью p1, состояние П2 – с вероятностью p2 и т.д. В этом случае говорят, что решение принимается в условиях частичной неопределенности.

Средние потери в том случае, если статистик использует чистую стратегию Bj определяются по обычной формуле математического ожидания

.

Наилучшей стратегией для статистика, по критерию Байеса, будет стратегия Вj*, при которой средние потери Rj минимальны.

.

Пример. Пусть в задаче о замене оборудования известны вероятности состояний Пi.

Пi

рi

Вj

В1

В2

В3

П1

0,2

1

3

5

П2

0,5

5

2

4

П3

0,3

7

6

3

Вычислим средние потери статистика при использовании им стратегий В1, В2, В3:

R1 = 10,2+50,5+70,3 = 4,8;

R2 = 30,2+20,5+60,3 = 3,4;

R3 = 50,2+40,5+30,3 = 3,9.

То есть по критерию Байеса статистик должен выбрать стратегию В2, в которой средние потери равны 3,4.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]