Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
2
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

по одной оси координат и точкой максимума по другой оси, называ­ ют седловой точкой. Соответствующий элемент а^- = а (или = Р) платежной матрицы игры называют седловой точкой (седловым эле­ ментом) матрицы. О такой игре говорят, что она имеет седловую точку. В этой ситуации каждый из игроков должен придерживаться максиминной (минимаксной) стратегии. Любое отклонение от этой стратегии будет невыгодно для игрока, допустившего отклонение. Если игра не имеет седловой точки (см. табл. 4.7), то ни одна из стратегий Ai или Bj не является оптимальной. Рассмотренные стратегии игроков А и В называют чистъши. Чистые стратегии не дают устойчивости решения.

Пример. Рассмотрим некоторую матричную игру размерностью 3 x 3 , платежная матрица которой приведена в табл. 4.8. Здесь мак-

 

 

Таблица 4 .8

симинный и

минимаксный выигрыши

 

 

равны 4 (верхняя и нижняя цена иг­

Платежная матрица

ры совпадают). Выигрыш 4 является

с седловой точкой

 

Стратегия

В ,

В г

В т,

ОЦ

одновременно и максимальным из мини­

мальных выигрышей для стратегий А \,

А\

2

3

1

2

J4.2,

A3, и минимальным из максималь­

 

5

4

6

4

а 2

ных

выигрышей для стратегий В \, Вг,

А3

6

2

1

1

В т,.

Элемент

022 = 4 — седловая точка

Pi

6

4

7

 

матрицы. Исследуя данную матрицу, ста­

 

 

 

 

новится понятно, что любое отклонение от седловой точки не выгодно для игроков. Минимаксная (максиминная) стратегия является оптимальной в данном случае.

§ 4.7. Поиск оптимальной смешанной стратегии

Теория игр используется для исследования многократно повто­ ряющихся конфликтных ситуаций. Если игроки будут от игры к иг­ ре придерживаться одной и той же стратегии, рекомендуемой прин­ ципом минимакса, то один из них может оказаться в наихудшей ситуации при внезапной смене стратегии другим игроком. Здесь проявляется общее правило для игр без седловой точки: игрок, иг­ рающий по определенной (детерминированной) стратегии, оказыва­ ется в более худшем положении по сравнению с игроком, который меняет стратегию случайным образом.

Пусть игроки А и В многократно играют в игру, платежная мат­ рица шторой приведена в табл. 4.7. Если игрок А выберет опреде­ ленную стратегию, например максиминную стратегию А \, и будет придерживаться ее от игры к игре, то игрок В, поняв это, будет выбирать каждый раз стратегию В 2, в результате чего выигрыш иг­ рока А будет равен 3 уел. ед. Однако если игрок А внезапно сменит стратегию А\ на стратегию Aj, то получит выигрыш 10 уел. ед. Раз­ гадав стратегию игрока А, игрок В сменит стратегию В 2 на страте­ гию В3, уменьшив выигрыш игрока Л до 1 уел. ед.

Рассмотрим общий подход к разрешению данной проблемы. Пусть A u А 2, ..., Ат — возможные стратегии игрока А. Для полу­ чения наибольшего эффекта игрок А должен использовать все или некоторые из этих стратегий случайным образом с разными веро­ ятностями: стратегия Ai используется с вероятностью р*. В этом случае говорят, что игрок А применяет смешанную стратегию SA (PU Р2, • ■■, Рт)- В отличие от смешанных стратегий S A страте­ гии Ai, как уже указывалось, называют чистыми. При надлежащем выборе вероятностей pi смешанная стратегия может оказаться оп­ тимальной (аналог седловой точки). При этом выигрыш игрока А будет не меньше некоторого значения v, называемого ценой иг­ ры. Это значение больше нижней цены игры, но меньше верхней в принципе минимакса.

Аналогичным образом должен вести себя и игрок В. Его опти­ мальной стратегией является S B (Q\, Q2 , • •, Яп), где qj — специально подобранные вероятности, с которыми игрок В использует страте­ гии Bj, j = \,2 ,...,n .

Чтобы получить оптимальную смешанную стратегию, требу­ ется найти соответствующие вероятности pu i = 1, 2, . . . , т, и qj, j = 1,2,..., п, а также определить цену игры v. Допустим, что иг­ рок В выбирает чистую стратегию Bj. Тогда средний выигрыш

игрока А будет равен 2

aijVi- Этот выигрыш должен быть не мень­

ше цены игры v, т. е. *

 

 

771

 

 

 

j = 1,2, ... ,n .

(4.5)

г=1

т

 

При этом

(4.6)

 

 

i = l

Введем обозначения X i= pi/v, i = 1,2, ... , т, и перепишем со­ отношения (4.5), (4.6) в виде

771

 

 

 

Y j aijX i^ 1,

j

= 1,2, . . . ,n ,

(4.7)

г=1

 

 

 

771

 

 

 

! > <

=

-•

<4-8>

г=1

 

 

 

Цена игры v должна быть как можно больше, следовательно, ве­ личина 1/v должна быть как можно меньше. Таким образом, поиск оптимальной смешанной стратегии свелся к решению задачи ли­ нейного программирования: найти неотрицательные величины

i = 1,2.....т, такие, чтобы они удовлетворяли неравенствам (4.7),

(4.8) и при этом обращали в минимум сумму (целевую функ-

771

цию) 2 x i- Сформулируем следующую теорему. г=1

Теорема. Чтобы стратегия (р*, q*) была оптимальной, необ­ ходимо и достаточно выполнения неравенств

771

 

Y

7 =

1, 2, . .. ,n ,

 

г=1

 

 

п

 

 

Y

air f j ^ v’ г =

1, 2,

 

j=1

 

771

П

 

 

при 2 P i =

1, 2

Qj = 1-

 

г=1

j= 1

 

 

Чистая стратегия, которая входит в смешанную с вероятностью больше нуля, называется активной.

Теорема. Если один из игроков придерживается своей опти­ мальной стратегии, то его выигрыш остается неизменным и рав­ ным цене игры независимо от стратегии другого игрока, если только он не выходит за пределы активных стратегий.

§4.8. Решение матричных игр размерностью т х п

Впроцедуре решения матричных игр можно выделить следую­ щие этапы.

I. Необходимо проверить, существует ли седловая точка в пла­ тежной матрице игры. Если седловая точка есть, то оптимальное

решение достигается в чистых стратегиях: решением игры является тройка чисел (А*, В*, v).

И. Если седловой точки нет, то оптимальное решение достига­ ется в смешанных стратегиях. Предварительно следует попытаться упростить задачу.

1. Убрать дублирующие и доминируемые стратегии. Если в пла­ тежной матрице для двух строк элементы ащ не меньше элемен­ тов asj (т. е. akj ^ asj) и хотя бы один элемент к-й строки строго больше соответствующего элемента s-й строки, то для игрока А стратегия А^ предпочтительнее стратегии A s. Стратегия Ак на­ зывается доминирующей, стратегия А 3 —доминируемой, ее можно удалить (в смешанной стратегии получим вероятность, равную ну­ лю). Доминируемая стратегия заведомо невыгодная. Аналогично для столбцов: если соответствующие элементы /-го и г-го столбцов удовлетворяет неравенству ац (Цг и хотя бы один элемент /-го столбца строго меньше соответствующего элемента r -го столб­ ца, то стратегия Bi является доминирующей и r -й столбец ис­ ключаем. Столбцы и строки, соответствующие элементы которых равны, называются дублирующими, и в платежной матрице игры следует оставить только одну строку или один столбец из дубли­ рующих.

2.Решить, нельзя ли уменьшить число стратегий путем замены групп чистых стратегий смешанными.

3.Упростить платежную матрицу, добавив ко всем элементам матрицы некоторое число. При этом цена игры увеличится на это число, а оптимальная стратегия не изменится.

III. Если платежная матрица игры имеет размерность 2 х п или

тх 2, то используются методы решения матричной игры размер­ ностью 2 x 2.

По условию теоремы о минимаксе любая матричная игра раз­ мерностью т х п имеет оптимальное решение, принадлежащее области смешанных стратегий. Оптимальные стратегии (р*, q*) образуют седловую точку платежной матрицы и также являются минимаксными. Решить матричную игру — это значит получить оп­ тимальное решение (p*,q*, v).

Алгоритм решения определяется необходимым и достаточным

условиями оптимальности.

Ш аг

1. Найдем оптимальную стратегию

для игрока В: ве­

роятности

гипотез равны q = (qi, q j,. . qn), заданы ограничения

72

 

стратегию, игрок В

2 dijqj ^ v, i = 1,2, ... , т. Применяя такую

1

не проиграет больше v при любой чистой стратегии игрока А, при оптимальной стратегии игрока А проигрыш игрока В равен v. Сформулируем данную задачу как задачу линейного программиро-

 

Яз

£

1

 

 

вания: введем переменные yj = —,

2 J

Vj ~ ~ >т-е- получим задачу

 

v

j=i

v

 

 

 

72

 

 

 

 

 

yj -* max;

 

 

n

i =1

 

y j^ O , j = 1, 2,

 

 

 

i =

 

 

 

j = i

 

 

(

n

\ -1

 

 

 

Применяя симплекс-метод, найдем значения у*, v = ( J]

Vj )

Ш аг 2.

 

 

S

= i

1

Определим оптимальную стратегию игрока

А. Эта

стратегия должна обеспечить ему выигрыш не менее v при любой стратегии игрока В и равный v при оптимальной стратегии игро­ ка В . Из необходимого и достаточного условий следует

771

2=1

 

j = 1,2, ...,n,

 

 

771

 

 

2 ]p i =

l, P i^ O ,

i = 1, 2,

j = i

 

 

Здесь pi — вероятность

стратегии

A*. Введем новые переменные

Xi = Pi/v и перейдем к задаче ЛП:

772

^хг min;

2=1

772

 

 

 

^ G>ijXi ^ 1, j

1,2,.*., Tl,

X i ^ 0 ,

i = 1, 2, ..., 771.

i=l

 

 

 

Решаем эту задачу также симплекс-методом.

Таким образом, матричные игры размерностью т х п сводятся к решению задач линейного программирования. В матричных играх

существование решения задач ЛП обеспечено. Конкретные условия матричной игры определяют выбор метода решения задач ЛП.

Пример. Рассмотрим игру с платежной матрицей

Для игрока В имеем задачу ЛП: найти максимум целевой функции

при условиях

 

 

Яу) = У\+У2 + УЗ

 

 

 

 

 

 

4yi + 2 у2 + 2у3 ^

 

 

 

 

 

 

 

 

1,

 

 

 

 

 

 

 

2у\ + 5уг ^

1,

 

 

 

 

 

 

 

 

 

2уг + 5уз <

1,

 

 

 

 

 

 

 

У\ $= 0,

 

у2 ^ 0,

уз ^ 0.

 

 

Решением этой задачи является точка у* =

 

. Отсюда

 

У m ax

_

V

* -

35

 

-

 

1

 

- 88

 

 

~ b y

.?

88’

 

î/max

35’

 

 

 

3=1

 

 

88

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

?

=

 

9

14

12'

 

 

 

 

 

 

 

 

( - -

- )

 

 

 

 

 

 

 

 

9

 

\3 5 ’ 35’ 35/

 

 

 

 

 

Для игрока А имеем задачу ЛП: найти минимум целевой

функции

 

 

/(х ) = Х\ + Х2

+ Хз

 

 

 

 

 

 

 

 

 

 

 

при ограничениях

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4xi + 2хг ^

 

 

 

 

 

 

 

 

 

2xi + 5x2 + 2хз >

1,

 

 

 

 

 

 

2xi + 5хз ^

1,

 

 

 

 

 

 

 

 

Х\

^ 0,

 

Х2 ^

0,

х з

^

0.

 

 

«

-

 

 

 

 

 

 

 

 

*

 

/19 6

10\

Решением этой задачи является точка р

 

I — , — , — I.

В рассмотренном примере все три стратегии игроков оказались активными. Игра, в которой все стратегии активны, называется пол­

ностью усредненной.

Общий метод решения матричных игр размерностью т х п — сведение их к задачам ЛП — не всегда оказывается самым про­ стым. В ряде случаев, особенно при малой размерности задач, удается решить игру более простыми методами, если заранее опре­ делить, какие стратегии являются активными. Например, для случая полностью усредненной игры с квадратной матрицей ( т = п) нера­ венства (4.7) преобразуются в равенства, т. е. получаем системы т линейных уравнений с т неизвестными х* или у* соответствен­ но, i = 1,2, ... ,m . Решая их, найдем положительные значения х* или yi, цену игры v и вероятности Pi в оптимальной смешан­ ной стратегии S^: Pi = vx*, i = 1,2, ... , m. Так, в данном примере, заменив неравенства на равенства, можно непосредственно полу­ чить 2 д* + 5^2 = v.

В смешанных стратегиях матричных игр размерностью т х п могут присутствовать стратегии с вероятностью, равной нулю. Чис­ ло активных стратегий в таком случае не превосходит m in {т ;п}. Оптимальная стратегия находится с помощью решения соответ­ ствующей системы уравнений. Пусть вектор р содержит г вероятно­ стей, отличных от нуля, а вектор q содержит s таких вероятностей;

тогда

г

s

т

 

 

 

 

Y l Pi = Y i qj,

Z <HjPi > v,

 

 

2=1

j =1

2=1

 

 

v=zzаир*гя*=z zaijPi >z$v-

 

2=1 j=\

j =1

2=1

j=l

Отсюда следует, что если игрок не выходит за пределы актив­ ных стратегий, то для получения оптимальной стратегии достаточ­ но решить приведенную систему уравнений.

Наиболее просто смешанная оптимальная стратегия находится

для игры с платежной матрицей размерностью 2 x 2 . Рассмотрим

 

Таблица 4.9

платежную матрицу (табл. 4.9), в кото­

 

рой нет седловой точки. Если седловая

Платежная матрица

точка существует, то решение очевид­

Стратегия

В 1

Вг

но. Определим оптимальную смешан­

 

2

3

ную стратегию для данного случая, т. е.

а 2

5

4

найдем S \ = (p’ .p j), S% = (q*, <?|) и де-

ну игры V.

 

 

 

Пусть игрок В использует стратегию В \, тогда цена игры бу­

дет V = CL\\P\ + 021Р2» для

стратегии

В 2 имеем

v = anPi + a22pi,

р, + Р 2 = 1. Для стратегий

А\ и А2

соответственно имеем v =

= a\\qi + « 1292» V = Ü2I 9I + 02292. 9i +92 = 1- Решив

эти системы

уравнений, получим

 

 

 

 

 

0*22 —O'21_____

о н

— Д 12

 

Р\ = an H" a-22 — a 12 — o>2\J

Он + 0 2 2

— 012 — 021.’

Д22 —Ql2

 

ОН — 021

 

Q\ = a n + a 2 2 — ai2 — a2i ’

Оц +022 0)2 021

V =

 

0220Ц —0)2021

 

 

--------------------------.

 

 

 

Оц + Û22 —012 —021

 

 

Решению матричных

игр размерностями 2 x 2 ,

2 x n , т х 2

можно дать геометрическую интерпретацию. Рассмотрим решение игры с платежной матрицей размерностью 2 х п, т. е.

 

^

_ f OHÛ12 ... 0 |„ \

 

 

 

\02l022

• 02п/

 

Цена игры с позиции игрока А есть

 

 

v(p) = min{oijPi + a2jP2 ),

Р \

= 1 - Pi,

J

 

 

 

 

 

v(p2) =

m in{(o2j -

a \ j ) p i + û i j } .

 

 

3

 

 

 

Задача игрока A максимизировать функцию

v(p) = mm{(o2i -

Oii)p2 + оц;

(022 -

ai2)p2 + ai2}.

При P2 = 0 имеем

v(p2) = min a \ j ,

при

pi = 1 имеем v(p2) =

= min aij, j = 1, 2, . . . ,

n.

3

 

 

 

3

 

 

 

 

 

Диаграмма для цены игры размерностью 2 х 2 с позиции игро­ ка А представлена на рис. 4.15.

По оси абсцисс отложим отрезок длиной, равной единице. Ле­ вый край с координатой, равной нулю, будет отражать страте­ гию правый — стратегию А 2. На вертикальных линиях, выхо­ дящих из нуля и единицы, будем откладывать выигрыши игрока А при стратегиях В\ и В 2 игрока В, т. е. на левой линии отложим значения оц и 012, на правой— <221 и а 22. Точки на вертикальных линиях, соответствующие одной из стратегий B j , j = 1,2, соединим

Рис. 4.15. Диаграмма матричной игры размерностью 2 x 2 с позиции игрока А

прямыми линиями—линиями выигрыша. В большинстве случаев эти прямые пересекаются в точке N . Абсцисса точки N делит еди­ ничный отрезок пропорционально вероятностям р\ и р 2ордината точки N это цена игры v. На диаграмме отмечены а и (3 — нижняя и верхняя цены игры. Поскольку стратегия вд требует, чтобы ми­ нимальный выигрыш игрока А обращался в максимум, то строим нижнюю границу выигрыша, отмеченную жирной линией. Линии выигрыша могут не пересекаться. Это значит, что игрок В имеет заведомо невыгодную стратегию. Однако если игрок А имеет одну заведомо выгодную стратегию, то формальный анализ пересечения линий выигрыша может привести к ошибке. Чтобы избежать ошиб­ ки, необходимо предварительно исключить заведомо невыгодные стратегии игрока А.

Для игрока В цена игры определяется следующим образом:

Ч<?) = max {ал <?i + 0^292},

q\ = 1 - 92,

г

 

 

v(<?2) = max{(ai2 -

aiX)q2 + aiX}.

г

 

 

Игроку В необходимо минимизировать величину

v(p) = max{(oi2 —a n t e + «и;

(022 — 021)92 + 021}.

Оптимальную стратегию игрока В можно определить по диа­

грамме, приведенной на рис. 4.15:

 

 

К В Х

 

ЬВ2

Я1 “ К В Х+ К В 2'

42 ~ ЬВХ+ЬВ 2

Однако проще это сделать непосредственно, построив для игро­ ка В аналогичную диаграмму и отметив на ней минимум верхней границы выигрыша (рис. 4.16).

Рис. 4.16. Диаграмма матричной игры размерностью 2 x 2 с позиции игрока В

Поскольку любая конечная игра размерностью т х п имеет решение, в котором число активных стратегий каждой стороны не превосходит наименьшего из чисел т и п , то игра размерностью 2 х п всегда имеет решение, при котором с каждой стороны участ­ вует не более двух активных стратегий. Поэтому для решения игры размерностью 2 х п строится геометрическая интерпретация игры и ищется пара стратегий, пересекающихся в точке N (рис. 4.17). Если в точке N пересекаются больше двух стратегий, то берется из них любая пара и ищется максимум на нижней границе выиг­ рыша.

Рис. 4.17. Диаграмма матричной игры размерностью 2 х п

Для игры размерностью m х 2 строится такая же диаграмма, в шторой ищется минимум на верхней границе выигрыша.

Пример. Найдем оптимальную смешанную стратегию для кон­ кретной игры. Предположим, что сторона А нападает на сторону В. Сторона А имеет два самолета, несущие поражающие средства. Сторона В имеет четыре зенитки, защищающие объект. Чтобы объ­ ект оказался разрушенным, достаточно, чтобы к нему прорвался хотя бы один самолет. Для подхода к объекту самолеты могут вы­ брать любой из четырех воздушных коридоров. Сторона А может

Соседние файлы в папке книги