Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по ММ.doc
Скачиваний:
12
Добавлен:
08.05.2019
Размер:
1.43 Mб
Скачать
  1. Методы решения матричных игр.

Сведение к задаче линейного программирования. Пусть имеется игра mn без седловой точки c выигрышами aij>0 (это всегда можно сделать, прибавляя ко всем членам матрицы достаточно большое число, от чего цена игры увеличится, но решение не изменится). Пусть цена игры – v (v>0, т.к. матрица игры положительна)

Требуется найти решение игры, т.е. две оптимальные смешанные стратегии.

SA=(p1, p2, …, pm), SB=(q1, q2, …qn), дающие каждой стороне максимально возможный для неё выигрыш (минимальный проигрыш)

П редположим, что мы применяем свою оптимальную стратегию, а игрок В отступает от своей оптимальной смешанной стратегии и пользуется чистыми стратегиями В1, В2, … Вn . Тогда наш выигрыш не может быть меньше, чем v. Можно составить систему неравенств:

a11 p1 + a21 p2 + …+ am1 pm v

a1n p1 + a2n p2 + …+ am n pm v

Разделим неравенства на v и обозначим x1 =p1 / v, … xm =pm / v

Т огда условия примут вид

a11 х1 + a21 х2 + …+ am1 хm 1

a1n х1 + a2n х2 + …+ am n хm 1

где хi – неотрицательные переменные.

Т.к. p1 +p2 +…,+pm=1 , то х12 +…+хm=1/v

v – наш гарантированный выигрыш и мы хотим сделать его максимальным. Получили задачу линейного программирования: найти хi0, удовлетворяющие системе неравенств и обращающие в минимум линейную функцию L= х1 + х2 + …+ хm. Следовательно, все методы линейного программирования можно использовать для нахождения оптимального решения игры. И наоборот, методы решения игры, можно применить для решения задач линейного программирования.

Метод итераций – один из самых простых численных методов решения игр (приближённый метод). Идея метода: разыгрывается «мысленный эксперимент», в котором А и В поочерёдно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Игрок А выбирает произвольно одну из своих стратегий Ai. Противник отвечает ему той из своих стратегий Bj, которая хуже всего для А при стратегии Ai. Далее А выбирает ту стратегию Ak, которая даёт ему максимальный выигрыш при стратегии Bj. Теперь противник отвечает той стратегией, которая является наихудшей для нашей смешанной стратегии (Ai , Ak) , в которой до сих пор применённые стратегии встречаются с равными вероятностями=1/2. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все применённые ранее стратегии входят пропорционально частотам их применения. Такой метод сходится: при увеличении числа партий средний выигрыш на 1 партию будет стремиться к цене игры, а частоты применения стратегий – к вероятностям в оптимальных смешанных стратегиях.

ПРИМЕР 5.3.

Рассмотрим задачу «про пальцы». Увеличим на 5 все элементы матрицы. Цена игры также увеличится на 5.

В1

В2

В3

A1

7

2

9

A2

2

9

0

А3

9

0

11

Проведем мысленный эксперимент:

k

i

В1

В2

В3

J

A1

A2

А3

v

v*

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

3

2

2

2

1

3

1

2

2

1

3

2

2

1

3

9

11

13

15

22

31

0

9

18

27

29

29

11

11

11

11

20

31

2

2

3

3

3

2

2

2

3

1

2

2

3

1

2

2

4

13

22

31

33

9

18

18

18

18

27

0

0

11

22

33

33

0

4.5

3.67

2.75

4.0

4.84

9

9

6

5.5

6.6

5.5

4.5

6.75

4.84

4.13

5.3

5.17

4.79

5.3

4.78

5.1

4.87

5.2

4.84

5.07

4.9

v – нижняя оценка игры, равная минимальному накопленному выигрышу, делённому на число партий. Аналогично – верхняя оценка. v*среднее арифметическое между оценками.

v* 5, p1*=4/150.266, p2*=7/150.468, p3*=4/150.266

q1*=2/150.133, q2*=8/150.534, q3*=5/150.333

v 0, p1= q1 =1/4=0.25, p2= q2 =1/2=0.5, p3= q3 =1/4=0.25

Графический метод.

Если матричная игра имеет размерность 2хn или mx2, то найти оптимальные смешанные стратегии можно графически.

ДАНО. игра 2хn

aijвыигрыш игрока А при использовании им стратегии i, когда игрок В использует стратегию j

НАЙТИ. v – цену игры.

1*, х2*) – вероятности использования игроком А соответственно 1 и 2 стратегий

(y1*, y2*, …yn*) – вероятности использования игроком В своих стратегий.

РЕШЕНИЕ, х1 2 =1, 0x1.

Выигрыш игрока А при применении противником чистой стратегии Вi составит zi:

z1= a11х1 +a21х2= a11х1 +a21 (1–х1)=(a11 –a21) х1 +a21

z2= a12х1 +a22х2= a12х1 +a22 (1–х1)=(a12–a22) х1 +a22

zn= a1nх1 +a2nх2= a1nх1 +a2n (1–х1)=(a1n–a2n) х1 +a2n

П остроим на плоскости прямые zi(x1) .

z

z*

х* 1 x1

Нижняя огибающая этих прямых – это минимальный гарантированный выигрыш игрока А. Действуя по принципу «минимакса», найдем точку на этой огибающей с максимальным выигрышем (х*, z*). Тогда v=z*, (х1*, х2*) =(х* , 1-х*)

Нижняя огибающая является наилучшим вариантом для игрока В (проиграть как можно меньше). Худший для него случай – точка (х*, z*). Эта точка является точкой пересечения прямых, соответствующих k и l стратегиям игрока В. Эти стратегии и являются оптимальными смешанными для него. Вероятность использования остальных стратегий yi=0

При использовании игроком В пары оптимальных смешанных стратегий выигрыш игрока А будет не больше цены игры. В наилучшем случае для любой стратегии =v, т.е. a1kyk +a1l yl= a2kyk +a2l yl

Т.к. , то yl =1–yk . Решив уравнение, найдем yk

ПРИМЕР 5.4.

В1

В2

В3

A1

2

-3

4

A2

-3

4

-5

z1= 2х1 -3х2= 2х1 -3 (1–х1)=5 х1 –3

z2= -3х1 +4х2=-3х1 +4 (1–х1)=-7 х1 +4

z3= 4х1 -5х2=4х1 -5 (1–х1)=9 х1 –5

x 1

x3 x2

z1=z2 5 х1 –3=-7 х1 +4 12 х1=7 х1*=7/12 x2*=5/12 v=z*=-1/12

y3=0 2y1–3y2=-3y1+4y2 5y1-3=-7y1+4 12y1=7 y1*=7/12 y2*=5/12

Ответ: х*=(7/12, 5/12) y*=(7/12, 5/12, 0) v=-1/12