- •Лекции по дисциплине
- •Основные этапы операционного исследования
- •Глава 1. Задачи линейного программирования
- •Возможные случаи допустимого множества решений задачи линейного программирования
- •Возможные случаи оптимальных решений (планов) задачи линейного программирования.
- •Графоаналитический способ решения задач линейного программирования
- •Симплекс-метод
- •Алгоритм симплекс-метода
- •1.5. Метод искусственного базиса (м-метод)
- •Алгоритм м-метода:
- •1.6. Элементы теории двойственности
- •Основная теорема двойственности
- •Вторая теорема двойственности
- •Глава 2. Элементы матричных игр
- •2.1. Формальное представление игр. Понятие матричной игры
- •2.2. Принцип миинимакса решения матричных игр.
- •2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.
- •2.4. Методы решения матричных игр.
- •Упрощение игр с помощью отбрасывания доминируемых стратегий.
- •3. Графический метод решения игр 2хn и mх2.
- •Метод сведения матричной игры к задаче линейного программирования.
- •4.5. Итерационный метод Брауна – Робинсон.
- •2.5. Игры с природой.
- •Список рекомендуемой литературы.
2.4. Методы решения матричных игр.
Теорема Неймана о минимаксе, гарантируя каждому игроку успех на пути отыскания оптимальной стратегии, тем не менее, ни слова не говорит о том, как эти стратегии найти. В этом параграфе мы рассмотрим несколько конструктивных методов нахождения оптимальных стратегий игроков.
Сразу заметим, что первым этапом поиска решения любой матричной игры является анализ игры на наличие седловой точки (см. п.2.1). Только при отсутствии таковой переходят к более тонким методам нахождения решения. Среди таких методов имеются как универсальные, которые применимы к любой матричной игре, так и частные, используемые для отдельных классов игр
Игра 2х2.
Пусть игра задана матрицей
.
Предположим, что седловая точка отсутствует. Однако, согласно теореме Неймана, оптимальное решение игры существует и определяется парой смешанных стратегий SA*=(p1*,p2*), SB*=(q1*,q2*). Используя свойство 3 решения игр и элементарные алгебраические преобразования (подробный вывод мы опускаем), приходим к следующим формулам:
р1=(а22–а21)/(а11+а22–а12–а21), р2=1–р1,
q1=(a22–a12)/(a11+a22–a12–a21), q2=1–q1, (2.7)
vS=(a22·a11-a12·a21)/(a11+a22–a12–a21).
При этом отсутствие седловой точки в игре гарантирует необращение в 0 знаменателей в приведенных формулах.
Пример 2.4. Найдем решение в смешанных стратегиях игры, рассмотренной в примере 2.1 о двух игроках с двумя монетами. Платежная матрица этой игры имеет вид:
Нижняя и верхняя цены этой игры =–3 и =2. Следовательно, седловая точка отсутствует.
Найдем оптимальные стратегии игроков и цену игры, применяя формулы (4.1.). Имеем:
р1=(4–(–3))/(2+4–(–3)–(–3))=7/12, р2=1–7/12=5/12,
q1=(4–(–3))/(2+4–(–3)–(–3))=7/12, q2=5/12,
vS=(42–(–3)(–3))/(2+4–(–3)–(–3))=–1/12.
Итак, решением игры является пара смешанных стратегий SA*=(7/12,5/12), SB*=(7/12,5/12), цена игры vS=–1/12. Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая 1-ю стратегию (положить 1 руб.) с вероятностью 7/12, а 2-ю стратегию (положить 2 руб.) – с вероятностью 5/12.
Отрицательная цена игры vS=–1/12 показывает, что при использовании игроками своих оптимальных стратегий, первый игрок проигрывает второму в каждой партии «в среднем» 1/12 рубля. Тем самым можно говорить об изначальной несправедливости условий игры.
Упрощение игр с помощью отбрасывания доминируемых стратегий.
Стратегия Аi игрока А называется доминирующей над стратегией Аk (а стратегия Аk доминируемой стратегией Аi), если все элементы i-й строки платежной матрицы не меньше соответствующих элементов k-й строки, т. е. аi1ak1, ai2ak2, …, aimakm (в том же смысле можно говорить и о доминировании строк).
Стратегия Вj игрока В называется доминирующей над стратегией Вl (а стратегия Вl - доминируемой стратегией Вj), если все элементы j-го столбца платежной матрицы не больше соответствующих элементов l-го столбца, т. е. a1ja1l, a2ja2l,…, amjaml (здесь также можно говорить и о доминировании столбцов платежной матрицы).
Доминируемая стратегия является заведомо невыгодной для игрока, ее выбирающего, и потому при дальнейшем исследовании игры может быть отброшена. В оптимальную смешанную стратегию она войдет с нулевой вероятностью. Следует также заметить, что при отбрасывании доминируемых стратегий некоторые из оптимальных стратегий игроков могут быть потеряны. Однако цена игры не изменится, и по усеченной матрице может быть найдена, по крайней мере, одна пара оптимальных смешанных стратегий.
Пример 2.5. Найдем оптимальное решение игры, заданной платежной матрицей
Результаты процесса отбрасывания доминируемых стратегий отобразим в таблице:
|
В1 |
В2 |
В3 |
В4 |
А1 |
3 |
-2 |
5 |
-1 |
А2 |
4 |
0 |
6 |
1 |
А3 |
2 |
-1 |
3 |
2 |
А4 |
1 |
3 |
7 |
4 |
Комментарии:
1) Строка А2 доминирует над строкой А1 (43, 0–2, 65, 1–1); следовательно, строку А1 отбрасываем (вычеркиваем).
2) В оставшейся части матрицы столбец В2 доминирует над столбцами В3 и В4 (06, –13, 37 и 01, –12, 34); следовательно, вычеркиваем столбцы В3 и В4.
3) Наконец, в полученной матрице строка А2 доминирует над строкой А3 (42, 2–1); вычеркиваем строку А3.
Оставшаяся матрица
не имеет доминируемых стратегий и относится к классу игр 2х2.
Используя формулы (2.7), найдем оптимальные смешанные стратегии игроков в полученной игре, а также ее цену:
=(3–1)/(4+3–1–0)=2/6=1/3, =1–1/3=2/3, =(3–0)/(4+3–1–0)=1/2,
=1–1/2=1/2, =(43–01)/(4+3–1–0)=2.
Итак, =(1/3,2/3),=(1/2,1/2) – оптимальное решение игры, заданной матрицей. Учитывая вычеркнутые доминируемые стратегии игроков, запишем оптимальное решение исходной игры:SA*=(0,1/3,0,2/3), SB*=(1/2,1/2,0,0). Цена игры - та же v*=2.