645_Galkina_M.JU._Metody_optimal'nykh_reshenij_
.pdfA |
B |
B1 |
B2 |
min в строке |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A1 |
|
|
10 |
7 |
7 |
|
|
|
|
|
|
|
A2 |
|
|
8 |
11 |
8 |
|
|
|
|
|
|
|
max в столбце |
|
10 |
11 |
= 8 |
|
|
|
|
|
|
|
|
|
= 10 |
|
|
|
|
|
|
|
||||
, следовательно, игра не имеет седловой точки, решение будет в сме- |
||||||||||||
шанных стратегиях. |
|
|
|
|
|
, |
|
) |
|
|||
Найдем аналитически оптимальную стратегию игрока А |
и |
|||||||||||
соответствующую цену игры . |
̅= ( |
|
|
|
||||||||
Так как |
– оптимальная, то она должна гарантировать средний выигрыш |
|||||||||||
игроку А, |
равный цене игры, при любом поведении игрока В: |
|
|
|
|
|
|
|||||
|
̅ |
|
|
|
|
|
|
|
|
|
||
для стратегии В1: 10p1 8p2 |
; |
|
|
|
|
|
|
|||||
для стратегии В2: 7p1 11p2 |
. |
|
|
|
|
|
|
С учетом того, что сумма вероятностей смешанной стратегии равна 1, получаем систему уравнений:
10p |
8p |
, |
|
|
|
|
|
|
|
|
|
|
|||||
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7p1 11p2 , |
|
|
|
|
|
|
|
|
|
|
|||||||
p |
p 1. |
|
|
|
|
|
|
|
|
|
|
||||||
1 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вычтем из первого уравнения второе: 3p1 3p2 0 или |
p1 p2. Значит: |
||||||||||||||||
|
|
|
|
|
|
|
|
p |
|
1 |
, |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
p1 p2, |
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|||
p1 |
p2 1, |
|
|
|
|
|
p2 |
|
|
, |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
||||||||
7p 11p |
. |
|
2 |
|
|
|
|
|
|||||||||
1 |
|
1 |
|
|
|||||||||||||
|
1 |
2 |
|
|
|
|
|
|
|
|
|
||||||
|
|
̅= |
, |
|
|
7 |
|
11 |
|
9. |
|
||||||
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
2 |
|
2 |
|
|
||||||||
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Итак: |
|
|
|
|
|
|
, = 9. |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
Аналогично получаем систему для нахождения смешанной стратегии игрока В.
10q1 7q2 ,
8q1 11q2 ,
q1 q2 1.
Вычтем из первого уравнения второе: 2q1 4q2 0. Откуда q1 2q2 подставим
впервое уравнение (Вместо подставим найденное значение для игрока А
= 9):
20 |
+7 = 9, |
|
27 |
= 9, |
|
= |
1 |
, |
3 |
51
2 = 3.
Итак: |
|
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
̅= |
|
|
, |
|
|
|
= |
|
, |
|
, |
|
= 9 |
|
Ответ: |
|
= |
, |
|
|
, |
|
|
|
|
|
|
|
. |
2. Проведем моделирование результатов решения с помощью таблицы равномерно распределенных случайных чисел. Для 30 партий хватит 60 чисел, на основе которых будут выбираться стратегии игроками. Сгенерируем 60 равномерно распределенных чисел в MS Excel функцией =СЛЧИС(). Будем выбирать стратегии игроков, используя геометрическое определение вероятности. Так как все случайные числа из отрезка [0; 1], то для того, чтобы стратегия А1 появлялась примерно в половине случаев, будем ее выбирать, если случайное число меньше 0,5; в остальных случаях выбирается стратегия А2. Аналогично для игрока В. Стратегию В1 будем выбирать, если соответствующее случайное число меньше 2/3 0,67, в противном случае выбираем стратегию В2.
Заполним расчетную табл. 1. Средний выигрыш игрока А считаем как отношение накопленного выигрыша к количеству сыгранных партий.
Табл. 1. Моделирование результатов игры из примера 13
Номер |
Случайное |
Стратегия |
Случайное |
Стратегия |
Выигрыш |
Накоплен- |
Средний |
выигрыш |
|||||||
партии |
число иг- |
игрока А |
число иг- |
игрока В |
А |
ный выиг- |
А (цена |
рока А |
А1: < 0,5 |
рока В |
В1: < 0,667 |
рыш А |
|||
|
|
|
|
|
|
|
игры) |
1. |
0,029 |
А1 |
0,125 |
В1 |
10 |
10 |
10,000 |
2. |
0,611 |
А2 |
0,490 |
В1 |
8 |
18 |
9,000 |
3. |
0,766 |
А2 |
0,958 |
В2 |
11 |
29 |
9,667 |
4. |
0,738 |
А2 |
0,564 |
В1 |
8 |
37 |
9,250 |
5. |
0,944 |
А2 |
0,257 |
В1 |
8 |
45 |
9,000 |
6. |
0,416 |
А1 |
0,886 |
В2 |
7 |
52 |
8,667 |
7. |
0,513 |
А1 |
0,226 |
В1 |
10 |
62 |
8,857 |
8. |
0,717 |
А2 |
0,467 |
В1 |
8 |
70 |
8,750 |
9. |
0,994 |
А2 |
0,822 |
В2 |
11 |
81 |
9,000 |
10. |
0,412 |
А1 |
0,244 |
В1 |
10 |
91 |
9,100 |
11. |
0,259 |
А1 |
0,176 |
В1 |
10 |
101 |
9,182 |
12. |
0,610 |
А2 |
0,658 |
В1 |
8 |
109 |
9,083 |
13. |
0,207 |
А1 |
0,451 |
В1 |
10 |
119 |
9,154 |
14. |
0,071 |
А1 |
0,994 |
В2 |
7 |
126 |
9,000 |
15. |
0,391 |
А1 |
0,724 |
В2 |
7 |
133 |
8,867 |
16. |
0,835 |
А2 |
0,469 |
В1 |
11 |
144 |
9,000 |
17. |
0,062 |
А1 |
0,392 |
В1 |
10 |
154 |
9,059 |
18. |
0,181 |
А1 |
0,457 |
В1 |
10 |
164 |
9,111 |
19. |
0,891 |
А2 |
0,336 |
В1 |
8 |
172 |
9,053 |
52
|
Случайное |
Стратегия |
Случайное |
Стратегия |
|
Накоплен- |
Средний |
Номер |
Выигрыш |
выигрыш |
|||||
партии |
число иг- |
игрока А |
число иг- |
игрока В |
А |
ный выиг- |
А (цена |
|
рока А |
А1: < 0,5 |
рока В |
В1: < 0,667 |
|
рыш А |
игры) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
20. |
0,375 |
А1 |
0,094 |
В1 |
10 |
182 |
9,100 |
21. |
0,009 |
А1 |
0,522 |
В1 |
10 |
192 |
9,143 |
22. |
0,255 |
А1 |
0,806 |
В2 |
7 |
199 |
9,045 |
23. |
0,273 |
А1 |
0,562 |
В1 |
10 |
209 |
9,087 |
24. |
0,111 |
А1 |
0,805 |
В2 |
7 |
216 |
9,000 |
25. |
0,888 |
А2 |
0,037 |
В1 |
8 |
224 |
8,960 |
26. |
0,392 |
А1 |
0,341 |
В1 |
10 |
234 |
9,000 |
27. |
0,843 |
А2 |
0,808 |
В2 |
11 |
245 |
9,074 |
28. |
0,086 |
А1 |
0,585 |
В1 |
10 |
255 |
9,107 |
29. |
0,426 |
А1 |
0,370 |
В1 |
10 |
265 |
9,138 |
30. |
0,562 |
А2 |
0,688 |
В2 |
11 |
276 |
9,200 |
Таким образом, в результате моделирования в 30 партиях цена игры (средний выигрыш) равен 9,2. Этот результат согласуется с теоретической ценой игры 9.
Из 30 партий игрок А 18 раз применял стратегию А1, 12 раз – стратегию А2. Игрок В 21 раз применял стратегию В1, 9 раз – стратегию В2. Частоты использования игроками своих чистых стратегий соответственно равны: p=(18/30;12/30)=(0,6;0,4), q=(21/30;9/30)=(0,7;0,3). Сравнивая с теоретическими оптимальными стратегиями ̅=(0,5; 0,5) и =(0,67; 0,33), можно сделать вывод, что результаты моделирования достаточно близко соответствуют теоретическим вероятностям даже для небольшого количества партий.
Пример 14 |
= |
2 |
3 |
11 . |
Решение |
||||
Решить графически игру, заданную платежной матрицей |
7 |
5 |
2 |
|
|
|
|
|
Матрица игры имеет размер 2 3, поэтому решение игры будем искать для игрока А (рис. 23). Отложим отрезок единичной длины А1А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию первого игрока – (p1, p2). В частности, точке А1 соответствует стратегия А1, точке А2 – стратегия А2.
В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока В.
53
Рис. 23. Геометрическое решение игры примера 14
В соответствии с принципом минимакса ломаная B MNB – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку
пересечения прямых |
|
|
и |
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
Уравнение |
прямой, проходящей через 2 точки (x |
,y |
) |
и (x |
,y ) имеет вид |
|||||||||||||||||||||||||||
ее |
|
|
|
B B |
|
|
|
B B |
|
|
|
|
|
|
|
|
|
1 |
1 |
|
2 |
2 |
||||||||||||
|
|
= |
|
|
. Прямая |
B B |
|
|
|
проходит через точки (0,3) и (1,5), следовательно, |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
(1,2), |
|
|
|
|
|
= |
|
|
или -2x+y=3. Прямая |
B B |
проходит через точки (0,11) и |
|||||||||||||||||||||||
|
уравнение |
|
|
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
следовательно, ее уравнение |
|
|
|
|
|
|
или |
|
9x+y=11. Для нахождения |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
точки пересечения прямых |
|
|
|
|
и |
|
решим систему: |
|
|
|
|
|||||||||||||||||||||||
B B |
|
B B |
= |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
−2 |
|
+ |
|
= 3, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
9 |
+ |
|
= 11. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
второе, получаем -11x=-8 x=8/11, |
|||||||||||||||
|
|
Вычтем из |
первого |
|
|
уравнения |
|
|||||||||||||||||||||||||||
y=3+2x=49/11. Точка |
N(8/11,49/11), |
|
следовательно, p2=8/11, p1=1-8/11=3/11, |
|||||||||||||||||||||||||||||||
=49/11. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
Таким образом, |
|
|
|
|
|
|
|
, при цене игры |
|
|
|
. |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
Из рисунка видно,=что( |
стратегия, ) |
В1 не входит= |
в оптимальную смешанную |
стратегию, поэтому q3=0, и мы можем найти оптимальную смешанную страте-
гию, |
удалив из платежной матрицы первый столбец. Получаем матрицу |
|||||
3 |
11 |
|
|
|
|
|
5 |
2 |
, при этом столбцы ее соответствуют активным стратегиям В2, В3. |
||||
|
Так как – оптимальная, то она должна гарантировать средний выигрыш |
|||||
игроку В, равный цене игры, при любом поведении игрока А: |
||||||
для стратегии А1: |
+11 |
= . ; |
||||
для стратегии А2: 3 |
||||||
|
С учетом того5, |
что сумма вероятностей смешанной стратегии равна 1, цена |
||||
|
+2 |
= |
||||
игры |
= |
|
, получаем систему уравнений: |
|||
|
54
|
|
49 |
|
|
|
|
||
3 |
+11 |
= |
11 |
, |
|
|
|
|
5 |
+2 |
= |
49 |
, |
|
|
|
|
|
+ |
= 1. |
|
|
|
|
−2 +9 |
= 0 |
−2 |
+9 |
= 0, |
|
|
уравнения второе: |
|||
Вычтем из первого11 |
|
. |
+= 1.
Решая систему, находим
9 = 11,
2 = 11.
Ответ: |
|
, |
|
|
|
|
|
|
|
|
. |
|
= 0, |
|
|
, |
|
|
|
|
||||
Оптимальная смешанная стратегия для игрока В |
|
|
|
|
|
. |
|
|
||||||||||||||||
Пример 15= ( |
|
, |
|
) |
|
= |
0, |
|
, |
|
, |
= |
|
|
|
|
|
|
|
= |
4 |
6 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
Решить графически игру, |
заданную платежной матрицей |
|
2 |
7 |
||||||||||||||||||||
|
|
|
6 |
5 . |
||||||||||||||||||||
Решение |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
8 |
Матрица игры имеет размер 4 2, поэтому решение игры будем искать для игрока В. Аналогично примеру 14 по горизонтальной оси отложим отрезок единичной длины В1В2, каждой точке которого поставим в соответствие некоторую смешанную стратегию второго игрока – (q1, q2) (рис. 24). В частности, точке В1 соответствует стратегия В1, точке В2 – стратегия В2.
В точках В1 и В2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока А.
Рис. 24. Геометрическое решение игры примера 15
55
В соответствии с принципом минимакса ломаная A NA – верхняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш минимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока В достаточно составить уравнения прямых и найти точку пересечения
прямых |
и |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 1 |
2 2 |
||||||||
|
|
|
|
A A |
A A |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
ее |
|
Уравнение прямой, проходящей через 2 точки (x ,y ) |
и (x ,y ), имеет вид |
|||||||||||||||||||||||||
|
|
= |
|
. Прямая |
A A |
|
проходит через точки (0,6) и (1,5), следовательно, |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
(1,8), |
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A A |
|
|
|
|||
|
уравнение |
|
|
|
|
|
|
или |
|
x+y=6. Прямая |
|
проходит через точки (0,1) и |
||||||||||||||||
|
|
|
следовательно, ее уравнение |
|
|
|
|
|
или |
-7x+y=1. Для нахождения точ- |
||||||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
+ |
= 6, |
|
|
|
|
|
|
|
A A |
|
и |
A A |
|
решим систему: |
|
|||||||||||
ки пересечения прямых |
|
|
|
|
|
|
|
|
. |
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
= |
|
|
|
|
|
||||||||||||||
−7 |
|
+ |
= 1. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Вычтем из первого уравнения второе, получаем 8x=5 x=5/8, y=6-x=43/8. |
||||||||||||||||||||||||||
Точка N(5/8,43/8), следовательно, q2=5/8, q1=1-5/8=3/8, =43/8. |
||||||||||||||||||||||||||||
|
Таким образом, |
|
|
|
|
|
|
|
|
при цене игры |
|
|
. |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
Из рисунка видно, |
что стратегии А |
и А |
не входят в оптимальную смешан- |
||||||||||||||||||||||||
|
= ( , |
|
|
) |
|
|
|
|
2 |
3 |
= |
|
|
|
ную стратегию, поэтому p2=0 и p3=0, и мы можем найти оптимальную смешанную стратегию, удалив из платежной матрицы вторую и третью строку. Полу-
чаем матрицу |
6 |
|
5 |
, при этом строки ее соответствуют активным стратегиям |
||||||||||
А1, А4. |
|
|
|
|
|
|
|
|
||||||
Так как |
|
–1 |
оптимальная, то она должна гарантировать средний выигрыш |
|||||||||||
|
|
8 |
|
|
|
|
||||||||
игроку А, |
равный |
цене игры, при любом поведении игрока В: |
||||||||||||
|
|
|
|
̅ |
6 |
|
+ |
= |
|
|
||||
для стратегии В1: |
|
; |
|
|||||||||||
для стратегии В2: |
|
. |
|
|||||||||||
С учетом того5, |
что сумма вероятностей смешанной стратегии равна 1, цена |
|||||||||||||
|
+8 |
= |
|
|
||||||||||
игры |
= |
|
|
получаем систему уравнений: |
||||||||||
|
|
|||||||||||||
6 |
+ |
|
= |
43 |
, |
|
|
|
|
|
|
|||
|
8 |
|
|
|
|
|
|
|||||||
5 |
+8 |
|
= |
43 |
, |
|
|
|
|
|
||||
|
+ |
= 1. |
|
|
|
|
|
|
|
− 7 = 0. |
||||
− 7 |
= 0, |
|
|
|
|
|
|
|
|
|||||
Вычтем из |
первого уравнения второе: |
|
||||||||||||
|
|
8 |
|
|
|
|
|
|
|
|
+= 1.
Решая систему, находим |
|
|
|
|
|
||
= |
7 |
, |
|
|
|
|
|
8 |
|
|
|
|
|
||
= |
1 |
. |
|
|
|
|
|
8 |
̅= |
,0,0, |
|
|
|||
|
56 |
|
|
||||
Оптимальная смешанная стратегия для игрока А |
|
|
|
|
. |
Ответ: |
|
, |
|
|
|
|
|
|
, |
|
. |
||||
|
̅= |
|
,0,0, |
|
|
|
= ( |
|
, |
|
) |
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
Таким образом, имеем следующий алгоритм графического решения простейших матричных игр 2 n ( или m 2):
1.Строим n (m) прямых, соответствующих стратегиям второго (первого)
игрока.
2.Строим нижнюю (верхнюю) границу выигрыша.
3.Выбираем на границе выигрыша точку с максимальной (минимальной) ординатой.
4.Определяем по чертежу пару активных стратегий из числа построенных для второго (первого) игрока.
5.Находим координаты точки максимума (минимума) и решение игры.
2.2.5.Сведение матричной игры к задаче линейного программирования
Если у каждого из игроков больше двух возможных стратегий, то можно решение игры свести к решению задачи линейного программирования. Найдем решение игры с платежной матрицей m n :
|
|
|
… |
|
. |
|
|
… |
|
… |
… |
… |
|
|
|
|
… |
|
|
|
|||
|
Пусть |
матрица игры не содержит седловой точки. Тогда решение игры бу- |
|||||
|
… |
|
|
|
|
||
дем искать в смешанных стратегиях p= (p1, p2, …, |
pm) и q = (q1, q2, …, qm), |
||||||
где p1 + p2 +… + pm = 1 и q1 + q2 +… + qn = 1 |
|
||||||
|
Стратегия |
является оптимальной, то есть при любой стратегии игрока B |
|||||
средний |
выигрыш игрока A будет больше или равен цены игры , таким обра- |
||||||
|
|
̅ |
|
|
|
||
зом, получаем систему ограничений |
|
||||||
|
+ |
|
+ + |
≥ |
, |
|
|
|
+ |
|
+ + |
≥ |
, |
|
|
|
+ |
|
… |
≥ . |
|
||
|
|
+ + |
|
Будем считать, что цена игры больше нуля. Действительно, если 0, то это означает, что некоторые элементы матрицы игры не положительны. Тогда найдём число M > 0, которое прибавим ко всем элементам матрицы игры и получим новую матрицу с положительными элементами. Это сложение сделает цену новой игры, равную +M, положительной, но не изменит решения игры.
Разделим обе части всех неравенств на положительное число и обозначим
= , = ,…, = .
тогда система ограничений примет вид
+ |
+ + |
≥ 1, |
+ |
+ + |
≥ 1, |
+ |
… |
≥ 1, |
+ + |
||
≥ 0, |
≥ 0,…, |
≥ 0. |
57
Далее, так как p1 + p2 +… + pm = 1, то |
|
|
|
|
|
|
. |
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
Игрок A стремится |
максимизировать свой средний выигрыш , то есть ми- |
|||||||||||||||||||||||||||||||
|
|
|
|
1 |
. |
|
|
|
|
+ |
|
+ + |
= |
|
|
|
|
|
|
|
|
|||||||||||||
нимизировать отношение |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Таким образом, получаем задачу линейного программирования: |
|
|
|
|
||||||||||||||||||||||||||||
|
|
+ |
|
|
|
+ + |
|
|
|
|
|
≥ 1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
+ |
|
|
|
+ + |
|
|
|
|
|
≥ 1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
+ |
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
≥ 1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
+ + |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
≥ 0, |
|
≥ 0,…, |
|
|
≥ 0, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
= |
+ |
|
+ + |
|
|
→ min. |
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
||||||||||||||
|
|
Заметим, что эта задача всегда имеет оптимальное решение |
|
|
|
|
|
|||||||||||||||||||||||||||
Его можно найти симплекс-методом или с использованием средств( |
Excel., ,…Тогда, ) |
|||||||||||||||||||||||||||||||||
цена игры |
|
= |
|
|
|
|
|
|
. Оптимальная смешанная стратегия первого игрока |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
, |
|
|
= |
|
∙ |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
̅= ( , |
|
,…, |
|
|
) |
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
Аналогичные рассуждения дают оптимальную стратегию |
игрока B. При |
|||||||||||||||||||||||||||||||
любой стратегии игрока А проигрыш игрока В не должен превышать |
цену иг- |
|||||||||||||||||||||||||||||||||
ры. Получаем систему ограничений: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
+ |
|
|
|
|
+ + |
|
|
|
|
|
≤ |
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
+ |
|
|
|
|
+ + |
|
|
|
|
|
≤ |
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
… |
|
|
+ |
|
|
|
|
|
|
≤ . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
+ |
|
|
|
|
|
+ |
|
|
= |
= |
|
|
. |
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
Тогда для |
|
|
|
|
|
= |
, |
|
|
|
,…, |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
Обозначим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
нахождения оптимальной смешанной стратегии игрока B необходи- |
|||||||||||||||||||||||||||||||
мо решить следующую задачу линейного программирования: |
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
+ |
|
|
|
|
+ + |
|
|
|
|
|
≤ 1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
+ |
|
|
|
|
+ + |
|
|
|
|
|
≤ 1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
+ |
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
≤ 1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
+ + |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
≥ 0, |
|
≥ 0,…, |
|
|
≥ 0, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
=Это+ |
|
+ + |
|
|
→ max. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
двойственная задача к ранее составленной. Задача всегда имеет опти- |
||||||||||||||||||||||||||||||||
мальное решение |
|
|
|
|
|
|
|
, которое можно найти симплекс-методом или |
||||||||||||||||||||||||||
по теореме равновесия( , , |
зная |
решение) |
ранее составленной задачи. Тогда цена |
|||||||||||||||||||||||||||||||
|
,…, |
|||||||||||||||||||||||||||||||||
новой игры |
= |
, где |
|
|
|
. Оптимальная. |
смешанная стратегия второго игрока |
|||||||||||||||||||||||||||
|
= ( , ,…, ) |
|
|
|
|
|
= |
|
∙ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
Пример 16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
2 |
|
−3 |
|
|
|||||
|
|
Найти решение игры, заданной платежной матрицей: |
|
|
|
|||||||||||||||||||||||||||||
|
|
|
−1 |
1 |
|
6 . |
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
58 |
|
|
|
|
|
−2 |
4 |
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Решение:
Найдем верхнюю и нижнюю цены игры.
B |
B1 |
B2 |
B3 |
min в строке |
A |
|
|
|
|
A1 |
-1 |
1 |
6 |
-1 |
|
|
|
|
|
A2 |
5 |
2 |
-3 |
-3 |
A3 |
-2 |
4 |
5 |
-2 |
|
|
|
|
|
max в столбце |
5 |
4 |
6 |
= -1 |
= 4 |
, следовательно, игра не имеет седловой точки, решение будет в смешанных стратегиях.
Чтобы свести матричную игру для игрока А к задаче линейного программирования, преобразуем платежную матрицу так, чтобы все ее элементы были больше нуля – прибавим ко всем элементам матрицы число 4. Получаем преобразованную платежную матрицу:
3 |
5 |
10 . |
|
|
|
|
|
|
|
|
|
|
|
|
9 |
Средний6 1 |
выигрыш А должен быть не меньше цены игры при любом по- |
||||||||||||
ведении2 8 |
игрока9 |
В. Так, если игрок В использует свою первую стратегию, то |
||||||||||||
средний выигрыш игрока А составит: |
|
|
, |
|
. |
|||||||||
Аналогично, записав неравенства для |
стратегий В и В , |
получаем систему ли- |
||||||||||||
|
3 |
+9 |
2+2 3 |
3 +9 +2 ≥ |
|
|||||||||
нейных ограничений: |
|
|
|
|
|
|
|
|
|
|||||
3 |
+9 |
+2 |
≥ |
, |
|
|
|
|
|
|
|
|
|
|
5 |
+6 |
+8 |
≥ |
, |
|
|
|
|
|
|
|
|
|
|
10 |
Из+ |
+9 |
≥1 |
. 2 |
+ p |
3 |
= 1, разделив обе части уравнения на >0 (цена иг- |
|||||||
|
условия |
p |
+ p |
|
ры больше нуля, т.к. все элементы преобразованной матрицы больше нуля), по-
лучаем целевую функцию |
|
|
|
|
|
|
|
Цель игрока А – получить мак- |
||||||||
|
|
|
|
|||||||||||||
симальный средний выигрыш=, т.е+. +max,=а значит. |
|
→ |
. Если обозначить |
|||||||||||||
|
||||||||||||||||
= |
|
|
(i=1, 2, 3), то целевая функция |
|
|
|
. |
|||||||||
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
переменным x, разделив каждое нера- |
|||||||
Перейдем в системе ограничений к = |
+ + |
|
i → |
|
||||||||||||
венство на >0: |
≥ 1, |
|
|
|
|
|
||||||||||
3 |
+9 |
+2 |
|
|
|
|
|
|||||||||
5 |
+6 |
+8 |
≥ 1, |
|
|
|
|
|
||||||||
10 |
+ |
+9 |
≥ 1. |
|
|
|
|
|
59
Таким образом, для нахождения оптимальной стратегии игрока А необходимо решить задачу линейного программирования:
Решим задачу средствами табличного редактора MS Excel с использовани-
ем настройки Поиск решения.
1. Для решения нашей задачи создадим в Excel книгу с именем «Решение игры». Подготовим данные на листе (рис. 25).
Сначала определим ячейки, в которые будет помещен результат решения. Пусть это будут ячейки В2, С2, D2, сделаем у них заголовки. В этих ячейках нет данных, их должен будет рассчитать Excel, они выделены цветом. Далее заполним коэффициенты при неизвестных и правые части системы ограничений (строки 5–7). Заведем строку 10 для целевой функции. Цветом выделена ячейка, в которой будет находиться значение целевой функции для найденного оптимального решения.
Рис. 25. Подготовка данных на листе Excel для решения ЗЛП для игрока А
Для ячеек B2:D2 и D10 установим числовой формат с 4 знаками после запятой. Для этого выделим эти ячейки, в контекстном меню по правой кнопке мыши выберем команду Формат ячеек… и в появившемся окне Формат ячеек на вкладке Число установим нужный формат (рис. 26).
60