- •Введение
- •Раздел I. Математические методы в исследовании операций.
- •1. Основные понятия.
- •2. Классификация моделей.
- •3. Выбор решения в условиях неопределенности.
- •4. Многокритериальные задачи.
- •Раздел II. Линейное программирование.
- •1. Математические модели задач линейного программирования.
- •Задача о пищевом рационе.
- •Задача производственного планирования.
- •Задачи раскроя.
- •2.Основная задача линейного программирования (озлп)
- •Найти неотрицательные значения переменных x1 , x2 , …, xn , которые удовлетворяли бы условиям-равенствам
- •3. Геометрическая интерпретация озлп.
- •4. Симплекс-метод.
- •4. Двойственные задачи линейного программирования.
- •5. Транспортная задача.
- •Раздел III. Графовые модели.
- •1.Элементы теории графов.
- •2. Задача о кратчайшем пути.
- •3. Кратчайший путь в ориентированном графе.
- •4. Построение графа наименьшей длины.
- •5. Транспортная задача в сетевой постановке.
- •6. Метод ветвей и границ.
- •7. Максимальный поток на сети.
- •Раздел IV. Динамическое программирование.
- •Раздел V. Имитационное моделирование
- •Теория игр.
- •Антагонистические матричные игры.
- •Задачи, приводимые к матричным играм.
- •Преобразование матричных игр.
- •Методы решения матричных игр.
- •Игры с природой.
- •Раздел VI. Теория массового обслуживания.
- •Задачи теории массового обслуживания.
- •Формула Литтла.
- •Простейшие системы массового обслуживания.
- •Решение задач
Методы решения матричных игр.
Сведение к задаче линейного программирования. Пусть имеется игра mn без седловой точки c выигрышами aij>0 (это всегда можно сделать, прибавляя ко всем членам матрицы достаточно большое число, от чего цена игры увеличится, но решение не изменится). Пусть цена игры – v (v>0, т.к. матрица игры положительна)
Требуется найти решение игры, т.е. две оптимальные смешанные стратегии.
SA=(p1, p2, …, pm), SB=(q1, q2, …qn), дающие каждой стороне максимально возможный для неё выигрыш (минимальный проигрыш)
П редположим, что мы применяем свою оптимальную стратегию, а игрок В отступает от своей оптимальной смешанной стратегии и пользуется чистыми стратегиями В1, В2, … Вn . Тогда наш выигрыш не может быть меньше, чем v. Можно составить систему неравенств:
a11 p1 + a21 p2 + …+ am1 pm v
…
a1n p1 + a2n p2 + …+ am n pm v
Разделим неравенства на v и обозначим x1 =p1 / v, … xm =pm / v
Т огда условия примут вид
a11 х1 + a21 х2 + …+ am1 хm 1
…
a1n х1 + a2n х2 + …+ am n хm 1
где хi – неотрицательные переменные.
Т.к. p1 +p2 +…,+pm=1 , то х1 +х2 +…+хm=1/v
v – наш гарантированный выигрыш и мы хотим сделать его максимальным. Получили задачу линейного программирования: найти хi0, удовлетворяющие системе неравенств и обращающие в минимум линейную функцию L= х1 + х2 + …+ хm. Следовательно, все методы линейного программирования можно использовать для нахождения оптимального решения игры. И наоборот, методы решения игры, можно применить для решения задач линейного программирования.
Метод итераций – один из самых простых численных методов решения игр (приближённый метод). Идея метода: разыгрывается «мысленный эксперимент», в котором А и В поочерёдно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Игрок А выбирает произвольно одну из своих стратегий Ai. Противник отвечает ему той из своих стратегий Bj, которая хуже всего для А при стратегии Ai. Далее А выбирает ту стратегию Ak, которая даёт ему максимальный выигрыш при стратегии Bj. Теперь противник отвечает той стратегией, которая является наихудшей для нашей смешанной стратегии (Ai , Ak) , в которой до сих пор применённые стратегии встречаются с равными вероятностями=1/2. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все применённые ранее стратегии входят пропорционально частотам их применения. Такой метод сходится: при увеличении числа партий средний выигрыш на 1 партию будет стремиться к цене игры, а частоты применения стратегий – к вероятностям в оптимальных смешанных стратегиях.
ПРИМЕР 5.3.
Рассмотрим задачу «про пальцы». Увеличим на 5 все элементы матрицы. Цена игры также увеличится на 5.
-
В1
В2
В3
A1
7
2
9
A2
2
9
0
А3
9
0
11
Проведем мысленный эксперимент:
k |
i |
В1 |
В2 |
В3 |
J |
A1 |
A2 |
А3 |
v |
|
v* |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
3 2 2 2 1 3 1 2 2 1 3 2 2 1 3 |
9 11 13 15 22 31 |
0 9 18 27 29 29 |
11 11 11 11 20 31 |
2 2 3 3 3 2 2 2 3 1 2 2 3 1 2 |
2 4 13 22 31 33 |
9 18 18 18 18 27 |
0 0 11 22 33 33 |
0 4.5 3.67 2.75 4.0 4.84 |
9 9 6 5.5 6.6 5.5 |
4.5 6.75 4.84 4.13 5.3 5.17 4.79 5.3 4.78 5.1 4.87 5.2 4.84 5.07 4.9 |
v – нижняя оценка игры, равная минимальному накопленному выигрышу, делённому на число партий. Аналогично – верхняя оценка. v* – среднее арифметическое между оценками.
v* 5, p1*=4/150.266, p2*=7/150.468, p3*=4/150.266
q1*=2/150.133, q2*=8/150.534, q3*=5/150.333
v 0, p1= q1 =1/4=0.25, p2= q2 =1/2=0.5, p3= q3 =1/4=0.25
Графический метод.
Если матричная игра имеет размерность 2хn или mx2, то найти оптимальные смешанные стратегии можно графически.
ДАНО. игра 2хn
aij– выигрыш игрока А при использовании им стратегии i, когда игрок В использует стратегию j
НАЙТИ. v – цену игры.
(х1*, х2*) – вероятности использования игроком А соответственно 1 и 2 стратегий
(y1*, y2*, …yn*) – вероятности использования игроком В своих стратегий.
РЕШЕНИЕ, х1 +х2 =1, 0x1.
Выигрыш игрока А при применении противником чистой стратегии Вi составит zi:
z1= a11х1 +a21х2= a11х1 +a21 (1–х1)=(a11 –a21) х1 +a21
z2= a12х1 +a22х2= a12х1 +a22 (1–х1)=(a12–a22) х1 +a22
…
zn= a1nх1 +a2nх2= a1nх1 +a2n (1–х1)=(a1n–a2n) х1 +a2n
П остроим на плоскости прямые zi(x1) .
z
z*
х* 1 x1
Нижняя огибающая этих прямых – это минимальный гарантированный выигрыш игрока А. Действуя по принципу «минимакса», найдем точку на этой огибающей с максимальным выигрышем (х*, z*). Тогда v=z*, (х1*, х2*) =(х* , 1-х*)
Нижняя огибающая является наилучшим вариантом для игрока В (проиграть как можно меньше). Худший для него случай – точка (х*, z*). Эта точка является точкой пересечения прямых, соответствующих k и l стратегиям игрока В. Эти стратегии и являются оптимальными смешанными для него. Вероятность использования остальных стратегий yi=0
При использовании игроком В пары оптимальных смешанных стратегий выигрыш игрока А будет не больше цены игры. В наилучшем случае для любой стратегии =v, т.е. a1kyk +a1l yl= a2kyk +a2l yl
Т.к. , то yl =1–yk . Решив уравнение, найдем yk
ПРИМЕР 5.4.
-
В1
В2
В3
A1
2
-3
4
A2
-3
4
-5
z1= 2х1 -3х2= 2х1 -3 (1–х1)=5 х1 –3
z2= -3х1 +4х2=-3х1 +4 (1–х1)=-7 х1 +4
z3= 4х1 -5х2=4х1 -5 (1–х1)=9 х1 –5
x 1
x3 x2
z1=z2 5 х1 –3=-7 х1 +4 12 х1=7 х1*=7/12 x2*=5/12 v=z*=-1/12
y3=0 2y1–3y2=-3y1+4y2 5y1-3=-7y1+4 12y1=7 y1*=7/12 y2*=5/12
Ответ: х*=(7/12, 5/12) y*=(7/12, 5/12, 0) v=-1/12