Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

645_Galkina_M.JU._Metody_optimal'nykh_reshenij_

.pdf
Скачиваний:
4
Добавлен:
12.11.2022
Размер:
1.76 Mб
Скачать

A

B

B1

B2

min в строке

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A1

 

 

10

7

7

 

 

 

 

 

 

 

A2

 

 

8

11

8

 

 

 

 

 

 

 

max в столбце

 

10

11

= 8

 

 

 

 

 

 

 

 

= 10

 

 

 

 

 

 

 

, следовательно, игра не имеет седловой точки, решение будет в сме-

шанных стратегиях.

 

 

 

 

 

,

 

)

 

Найдем аналитически оптимальную стратегию игрока А

и

соответствующую цену игры .

̅= (

 

 

 

Так как

– оптимальная, то она должна гарантировать средний выигрыш

игроку А,

равный цене игры, при любом поведении игрока В:

 

 

 

 

 

 

 

̅

 

 

 

 

 

 

 

 

 

для стратегии В1: 10p1 8p2

;

 

 

 

 

 

 

для стратегии В2: 7p1 11p2

.

 

 

 

 

 

 

С учетом того, что сумма вероятностей смешанной стратегии равна 1, получаем систему уравнений:

10p

8p

,

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7p1 11p2 ,

 

 

 

 

 

 

 

 

 

 

p

p 1.

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычтем из первого уравнения второе: 3p1 3p2 0 или

p1 p2. Значит:

 

 

 

 

 

 

 

 

p

 

1

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1 p2,

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

p1

p2 1,

 

 

 

 

 

p2

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7p 11p

.

 

2

 

 

 

 

 

1

 

1

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

̅=

,

 

 

7

 

11

 

9.

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак:

 

 

 

 

 

 

, = 9.

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично получаем систему для нахождения смешанной стратегии игрока В.

10q1 7q2 ,

8q1 11q2 ,

q1 q2 1.

Вычтем из первого уравнения второе: 2q1 4q2 0. Откуда q1 2q2 подставим

впервое уравнение (Вместо подставим найденное значение для игрока А

= 9):

20

+7 = 9,

27

= 9,

=

1

,

3

51

2 = 3.

Итак:

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

̅=

 

 

,

 

 

 

=

 

,

 

,

 

= 9

Ответ:

 

=

,

 

 

,

 

 

 

 

 

 

 

.

2. Проведем моделирование результатов решения с помощью таблицы равномерно распределенных случайных чисел. Для 30 партий хватит 60 чисел, на основе которых будут выбираться стратегии игроками. Сгенерируем 60 равномерно распределенных чисел в MS Excel функцией =СЛЧИС(). Будем выбирать стратегии игроков, используя геометрическое определение вероятности. Так как все случайные числа из отрезка [0; 1], то для того, чтобы стратегия А1 появлялась примерно в половине случаев, будем ее выбирать, если случайное число меньше 0,5; в остальных случаях выбирается стратегия А2. Аналогично для игрока В. Стратегию В1 будем выбирать, если соответствующее случайное число меньше 2/3 0,67, в противном случае выбираем стратегию В2.

Заполним расчетную табл. 1. Средний выигрыш игрока А считаем как отношение накопленного выигрыша к количеству сыгранных партий.

Табл. 1. Моделирование результатов игры из примера 13

Номер

Случайное

Стратегия

Случайное

Стратегия

Выигрыш

Накоплен-

Средний

выигрыш

партии

число иг-

игрока А

число иг-

игрока В

А

ный выиг-

А (цена

рока А

А1: < 0,5

рока В

В1: < 0,667

рыш А

 

 

 

 

 

 

 

игры)

1.

0,029

А1

0,125

В1

10

10

10,000

2.

0,611

А2

0,490

В1

8

18

9,000

3.

0,766

А2

0,958

В2

11

29

9,667

4.

0,738

А2

0,564

В1

8

37

9,250

5.

0,944

А2

0,257

В1

8

45

9,000

6.

0,416

А1

0,886

В2

7

52

8,667

7.

0,513

А1

0,226

В1

10

62

8,857

8.

0,717

А2

0,467

В1

8

70

8,750

9.

0,994

А2

0,822

В2

11

81

9,000

10.

0,412

А1

0,244

В1

10

91

9,100

11.

0,259

А1

0,176

В1

10

101

9,182

12.

0,610

А2

0,658

В1

8

109

9,083

13.

0,207

А1

0,451

В1

10

119

9,154

14.

0,071

А1

0,994

В2

7

126

9,000

15.

0,391

А1

0,724

В2

7

133

8,867

16.

0,835

А2

0,469

В1

11

144

9,000

17.

0,062

А1

0,392

В1

10

154

9,059

18.

0,181

А1

0,457

В1

10

164

9,111

19.

0,891

А2

0,336

В1

8

172

9,053

52

 

Случайное

Стратегия

Случайное

Стратегия

 

Накоплен-

Средний

Номер

Выигрыш

выигрыш

партии

число иг-

игрока А

число иг-

игрока В

А

ный выиг-

А (цена

 

рока А

А1: < 0,5

рока В

В1: < 0,667

 

рыш А

игры)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20.

0,375

А1

0,094

В1

10

182

9,100

21.

0,009

А1

0,522

В1

10

192

9,143

22.

0,255

А1

0,806

В2

7

199

9,045

23.

0,273

А1

0,562

В1

10

209

9,087

24.

0,111

А1

0,805

В2

7

216

9,000

25.

0,888

А2

0,037

В1

8

224

8,960

26.

0,392

А1

0,341

В1

10

234

9,000

27.

0,843

А2

0,808

В2

11

245

9,074

28.

0,086

А1

0,585

В1

10

255

9,107

29.

0,426

А1

0,370

В1

10

265

9,138

30.

0,562

А2

0,688

В2

11

276

9,200

Таким образом, в результате моделирования в 30 партиях цена игры (средний выигрыш) равен 9,2. Этот результат согласуется с теоретической ценой игры 9.

Из 30 партий игрок А 18 раз применял стратегию А1, 12 раз – стратегию А2. Игрок В 21 раз применял стратегию В1, 9 раз – стратегию В2. Частоты использования игроками своих чистых стратегий соответственно равны: p=(18/30;12/30)=(0,6;0,4), q=(21/30;9/30)=(0,7;0,3). Сравнивая с теоретическими оптимальными стратегиями ̅=(0,5; 0,5) и =(0,67; 0,33), можно сделать вывод, что результаты моделирования достаточно близко соответствуют теоретическим вероятностям даже для небольшого количества партий.

Пример 14

=

2

3

11 .

Решение

Решить графически игру, заданную платежной матрицей

7

5

2

 

 

 

 

Матрица игры имеет размер 2 3, поэтому решение игры будем искать для игрока А (рис. 23). Отложим отрезок единичной длины А1А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию первого игрока – (p1, p2). В частности, точке А1 соответствует стратегия А1, точке А2 – стратегия А2.

В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока В.

53

Рис. 23. Геометрическое решение игры примера 14

В соответствии с принципом минимакса ломаная B MNB – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку

пересечения прямых

 

 

и

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Уравнение

прямой, проходящей через 2 точки (x

,y

)

и (x

,y ) имеет вид

ее

 

 

 

B B

 

 

 

B B

 

 

 

 

 

 

 

 

 

1

1

 

2

2

 

 

=

 

 

. Прямая

B B

 

 

 

проходит через точки (0,3) и (1,5), следовательно,

 

 

 

 

 

 

 

 

 

 

 

(1,2),

 

 

 

 

 

=

 

 

или -2x+y=3. Прямая

B B

проходит через точки (0,11) и

 

уравнение

 

 

 

 

 

 

 

 

 

следовательно, ее уравнение

 

 

 

 

 

 

или

 

9x+y=11. Для нахождения

 

 

 

 

 

 

 

 

 

точки пересечения прямых

 

 

 

 

и

 

решим систему:

 

 

 

 

B B

 

B B

=

 

 

 

 

 

 

 

 

 

 

 

−2

 

+

 

= 3,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

+

 

= 11.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

второе, получаем -11x=-8 x=8/11,

 

 

Вычтем из

первого

 

 

уравнения

 

y=3+2x=49/11. Точка

N(8/11,49/11),

 

следовательно, p2=8/11, p1=1-8/11=3/11,

=49/11.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

, при цене игры

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из рисунка видно,=что(

стратегия, )

В1 не входит=

в оптимальную смешанную

стратегию, поэтому q3=0, и мы можем найти оптимальную смешанную страте-

гию,

удалив из платежной матрицы первый столбец. Получаем матрицу

3

11

 

 

 

 

 

5

2

, при этом столбцы ее соответствуют активным стратегиям В2, В3.

 

Так как – оптимальная, то она должна гарантировать средний выигрыш

игроку В, равный цене игры, при любом поведении игрока А:

для стратегии А1:

+11

= . ;

для стратегии А2: 3

 

С учетом того5,

что сумма вероятностей смешанной стратегии равна 1, цена

 

+2

=

игры

=

 

, получаем систему уравнений:

 

54

 

 

49

 

 

 

 

3

+11

=

11

,

 

 

 

5

+2

=

49

,

 

 

 

 

 

+

= 1.

 

 

 

 

−2 +9

= 0

−2

+9

= 0,

 

 

уравнения второе:

Вычтем из первого11

 

.

+= 1.

Решая систему, находим

9 = 11,

2 = 11.

Ответ:

 

,

 

 

 

 

 

 

 

 

.

 

= 0,

 

 

,

 

 

 

 

Оптимальная смешанная стратегия для игрока В

 

 

 

 

 

.

 

 

Пример 15= (

 

,

 

)

 

=

0,

 

,

 

,

=

 

 

 

 

 

 

 

=

4

6

 

 

 

 

 

 

 

 

 

 

 

 

Решить графически игру,

заданную платежной матрицей

 

2

7

 

 

 

6

5 .

Решение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

8

Матрица игры имеет размер 4 2, поэтому решение игры будем искать для игрока В. Аналогично примеру 14 по горизонтальной оси отложим отрезок единичной длины В1В2, каждой точке которого поставим в соответствие некоторую смешанную стратегию второго игрока – (q1, q2) (рис. 24). В частности, точке В1 соответствует стратегия В1, точке В2 – стратегия В2.

В точках В1 и В2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока А.

Рис. 24. Геометрическое решение игры примера 15

55

В соответствии с принципом минимакса ломаная A NA – верхняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш минимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока В достаточно составить уравнения прямых и найти точку пересечения

прямых

и

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1

2 2

 

 

 

 

A A

A A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ее

 

Уравнение прямой, проходящей через 2 точки (x ,y )

и (x ,y ), имеет вид

 

 

=

 

. Прямая

A A

 

проходит через точки (0,6) и (1,5), следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

(1,8),

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A A

 

 

 

 

уравнение

 

 

 

 

 

 

или

 

x+y=6. Прямая

 

проходит через точки (0,1) и

 

 

 

следовательно, ее уравнение

 

 

 

 

 

или

-7x+y=1. Для нахождения точ-

 

 

 

 

 

 

 

 

 

 

+

= 6,

 

 

 

 

 

 

 

A A

 

и

A A

 

решим систему:

 

ки пересечения прямых

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

−7

 

+

= 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычтем из первого уравнения второе, получаем 8x=5 x=5/8, y=6-x=43/8.

Точка N(5/8,43/8), следовательно, q2=5/8, q1=1-5/8=3/8, =43/8.

 

Таким образом,

 

 

 

 

 

 

 

 

при цене игры

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из рисунка видно,

что стратегии А

и А

не входят в оптимальную смешан-

 

= ( ,

 

 

)

 

 

 

 

2

3

=

 

 

 

ную стратегию, поэтому p2=0 и p3=0, и мы можем найти оптимальную смешанную стратегию, удалив из платежной матрицы вторую и третью строку. Полу-

чаем матрицу

6

 

5

, при этом строки ее соответствуют активным стратегиям

А1, А4.

 

 

 

 

 

 

 

 

Так как

 

1

оптимальная, то она должна гарантировать средний выигрыш

 

 

8

 

 

 

 

игроку А,

равный

цене игры, при любом поведении игрока В:

 

 

 

 

̅

6

 

+

=

 

 

для стратегии В1:

 

;

 

для стратегии В2:

 

.

 

С учетом того5,

что сумма вероятностей смешанной стратегии равна 1, цена

 

+8

=

 

 

игры

=

 

 

получаем систему уравнений:

 

 

6

+

 

=

43

,

 

 

 

 

 

 

 

8

 

 

 

 

 

 

5

+8

 

=

43

,

 

 

 

 

 

 

+

= 1.

 

 

 

 

 

 

 

− 7 = 0.

− 7

= 0,

 

 

 

 

 

 

 

 

Вычтем из

первого уравнения второе:

 

 

 

8

 

 

 

 

 

 

 

 

+= 1.

Решая систему, находим

 

 

 

 

 

=

7

,

 

 

 

 

 

8

 

 

 

 

 

=

1

.

 

 

 

 

 

8

̅=

,0,0,

 

 

 

56

 

 

Оптимальная смешанная стратегия для игрока А

 

 

 

 

.

Ответ:

 

,

 

 

 

 

 

 

,

 

.

 

̅=

 

,0,0,

 

 

 

= (

 

,

 

)

 

=

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, имеем следующий алгоритм графического решения простейших матричных игр 2 n ( или m 2):

1.Строим n (m) прямых, соответствующих стратегиям второго (первого)

игрока.

2.Строим нижнюю (верхнюю) границу выигрыша.

3.Выбираем на границе выигрыша точку с максимальной (минимальной) ординатой.

4.Определяем по чертежу пару активных стратегий из числа построенных для второго (первого) игрока.

5.Находим координаты точки максимума (минимума) и решение игры.

2.2.5.Сведение матричной игры к задаче линейного программирования

Если у каждого из игроков больше двух возможных стратегий, то можно решение игры свести к решению задачи линейного программирования. Найдем решение игры с платежной матрицей m n :

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

Пусть

матрица игры не содержит седловой точки. Тогда решение игры бу-

 

 

 

 

 

дем искать в смешанных стратегиях p= (p1, p2, …,

pm) и q = (q1, q2, …, qm),

где p1 + p2 +… + pm = 1 и q1 + q2 +… + qn = 1

 

 

Стратегия

является оптимальной, то есть при любой стратегии игрока B

средний

выигрыш игрока A будет больше или равен цены игры , таким обра-

 

 

̅

 

 

 

зом, получаем систему ограничений

 

 

+

 

+ +

,

 

 

+

 

+ +

,

 

 

+

 

≥ .

 

 

 

+ +

 

Будем считать, что цена игры больше нуля. Действительно, если 0, то это означает, что некоторые элементы матрицы игры не положительны. Тогда найдём число M > 0, которое прибавим ко всем элементам матрицы игры и получим новую матрицу с положительными элементами. Это сложение сделает цену новой игры, равную +M, положительной, но не изменит решения игры.

Разделим обе части всех неравенств на положительное число и обозначим

= , = ,…, = .

тогда система ограничений примет вид

+

+ +

≥ 1,

+

+ +

≥ 1,

+

≥ 1,

+ +

≥ 0,

≥ 0,…,

≥ 0.

57

Далее, так как p1 + p2 +… + pm = 1, то

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Игрок A стремится

максимизировать свой средний выигрыш , то есть ми-

 

 

 

 

1

.

 

 

 

 

+

 

+ +

=

 

 

 

 

 

 

 

 

нимизировать отношение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, получаем задачу линейного программирования:

 

 

 

 

 

 

+

 

 

 

+ +

 

 

 

 

 

≥ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

+ +

 

 

 

 

 

≥ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≥ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≥ 0,

 

≥ 0,…,

 

 

≥ 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

+

 

+ +

 

 

→ min.

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

Заметим, что эта задача всегда имеет оптимальное решение

 

 

 

 

 

Его можно найти симплекс-методом или с использованием средств(

Excel., ,…Тогда, )

цена игры

 

=

 

 

 

 

 

 

. Оптимальная смешанная стратегия первого игрока

 

 

 

 

 

 

 

,

 

 

=

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

̅= ( ,

 

,…,

 

 

)

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогичные рассуждения дают оптимальную стратегию

игрока B. При

любой стратегии игрока А проигрыш игрока В не должен превышать

цену иг-

ры. Получаем систему ограничений:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

+ +

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

+ +

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

≤ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

+

 

 

=

=

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда для

 

 

 

 

 

=

,

 

 

 

,…,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нахождения оптимальной смешанной стратегии игрока B необходи-

мо решить следующую задачу линейного программирования:

 

 

 

 

 

 

 

 

+

 

 

 

 

+ +

 

 

 

 

 

≤ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

+ +

 

 

 

 

 

≤ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≤ 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≥ 0,

 

≥ 0,…,

 

 

≥ 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=Это+

 

+ +

 

 

→ max.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

двойственная задача к ранее составленной. Задача всегда имеет опти-

мальное решение

 

 

 

 

 

 

 

, которое можно найти симплекс-методом или

по теореме равновесия( , ,

зная

решение)

ранее составленной задачи. Тогда цена

 

,…,

новой игры

=

, где

 

 

 

. Оптимальная.

смешанная стратегия второго игрока

 

= ( , ,…, )

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 16

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

2

 

−3

 

 

 

 

Найти решение игры, заданной платежной матрицей:

 

 

 

 

 

 

−1

1

 

6 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

58

 

 

 

 

 

−2

4

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение:

Найдем верхнюю и нижнюю цены игры.

B

B1

B2

B3

min в строке

A

 

 

 

 

A1

-1

1

6

-1

 

 

 

 

 

A2

5

2

-3

-3

A3

-2

4

5

-2

 

 

 

 

 

max в столбце

5

4

6

= -1

= 4

, следовательно, игра не имеет седловой точки, решение будет в смешанных стратегиях.

Чтобы свести матричную игру для игрока А к задаче линейного программирования, преобразуем платежную матрицу так, чтобы все ее элементы были больше нуля – прибавим ко всем элементам матрицы число 4. Получаем преобразованную платежную матрицу:

3

5

10 .

 

 

 

 

 

 

 

 

 

 

 

 

9

Средний6 1

выигрыш А должен быть не меньше цены игры при любом по-

ведении2 8

игрока9

В. Так, если игрок В использует свою первую стратегию, то

средний выигрыш игрока А составит:

 

 

,

 

.

Аналогично, записав неравенства для

стратегий В и В ,

получаем систему ли-

 

3

+9

2+2 3

3 +9 +2 ≥

 

нейных ограничений:

 

 

 

 

 

 

 

 

 

3

+9

+2

,

 

 

 

 

 

 

 

 

 

5

+6

+8

,

 

 

 

 

 

 

 

 

 

10

Из+

+9

1

. 2

+ p

3

= 1, разделив обе части уравнения на >0 (цена иг-

 

условия

p

+ p

 

ры больше нуля, т.к. все элементы преобразованной матрицы больше нуля), по-

лучаем целевую функцию

 

 

 

 

 

 

 

Цель игрока А – получить мак-

 

 

 

 

симальный средний выигрыш=, т.е+. +max,=а значит.

 

. Если обозначить

 

=

 

 

(i=1, 2, 3), то целевая функция

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

переменным x, разделив каждое нера-

Перейдем в системе ограничений к =

+ +

 

i

 

венство на >0:

≥ 1,

 

 

 

 

 

3

+9

+2

 

 

 

 

 

5

+6

+8

≥ 1,

 

 

 

 

 

10

+

+9

≥ 1.

 

 

 

 

 

59

Таким образом, для нахождения оптимальной стратегии игрока А необходимо решить задачу линейного программирования:

Решим задачу средствами табличного редактора MS Excel с использовани-

ем настройки Поиск решения.

1. Для решения нашей задачи создадим в Excel книгу с именем «Решение игры». Подготовим данные на листе (рис. 25).

Сначала определим ячейки, в которые будет помещен результат решения. Пусть это будут ячейки В2, С2, D2, сделаем у них заголовки. В этих ячейках нет данных, их должен будет рассчитать Excel, они выделены цветом. Далее заполним коэффициенты при неизвестных и правые части системы ограничений (строки 5–7). Заведем строку 10 для целевой функции. Цветом выделена ячейка, в которой будет находиться значение целевой функции для найденного оптимального решения.

Рис. 25. Подготовка данных на листе Excel для решения ЗЛП для игрока А

Для ячеек B2:D2 и D10 установим числовой формат с 4 знаками после запятой. Для этого выделим эти ячейки, в контекстном меню по правой кнопке мыши выберем команду Формат ячеек… и в появившемся окне Формат ячеек на вкладке Число установим нужный формат (рис. 26).

60