- •Раздел 4. Теория игр.
- •4.1. Понятие об игровых моделях.
- •4.2. Классификация игр.
- •4.3. Решение матричных игр в чистых стратегиях.
- •4.4. Смешанное расширение матричной игры.
- •4.5. Свойства решений матричных игр.
- •4.6. Графический метод решения игр и .
- •4.7. Сведение матричной игры к задаче линейного программирования.
- •4.8. Принятие решения в условиях неопределённости
- •4.8.1. Понятие о статистических играх
- •4.8.2. Критерии принятия решения
- •4.8.2.1. Критерий максимального математического ожидания выигрыша
- •4.8.2.2. Критерий недостаточного основания Лапласа
- •4.8.2.3. Максиминный критерий Вальда
- •4.8.2.4. Критерий минимаксного риска Сэвиджа
- •4.8.2.5. Критерий пессимизма-оптимизма Гурвица
- •4.8.2.6. Критерий Ходжа-Лемана
- •Пример.
- •4.9. Определение экономического эффекта информации с использованием методов теории игр
- •Пример.
- •4.10. Моделирование банковской деятельности «играми с природой».
- •A). Критерии, основанные на известных вероятностях условий
- •Б). Критерии, основанные на субъективной основе
- •В). Критерии крайнего пессимизма
- •4.11. Использование методов теории игр в предпринимательской деятельности.
- •4.12. Кооперативные игры.
- •4.12.1. Природа и структура кооперативных игр
- •4.12.2. Некоторые понятия решения кооперативной игры
- •4.12.2.1. С-ядро
- •4.12.2.2. Вектор Шепли
4.6. Графический метод решения игр и .
Поясним метод на примерах.
Пример 1. Рассмотрим игру, заданную платёжной матрицей.
На плоскости хОу введём систему координат и на оси Ох отложим отрезок единичной длины A1, А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию игрока 1 (х, 1 - х). В частности, точке A1 (0;0) отвечает стратегия A1, точке А2 (1;0) - стратегия А2 и т.д.
В точках A1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью Оу) отложим выигрыш игрока 1 при стратегии A1, а на втором - при стратегии A2. Если игрок 1 применит стратегию A1, то выиграет при стратегии B1 игрока 2-2, при стратегии В2 - 3, а при стратегии В3 - 11. Числам 2, 3, 11 на оси Ox соответствуют точки B1, B2, B3
Если же игрок 1 применит стратегию А2, то его выигрыш при стратегии B1 равен 7, при В2 - 5, а при В3 - 2. Эти числа определяют точки B’1, B’2, B’3 на перпендикуляре, восстановленном в точке А2. Соединяя между собой точки B1 и B’1, B2 и B’2, B3 и B’3 и получим три прямые, расстояние до которых от оси Ох определяет средний выигрыш при любом сочетании соответствующих стратегий. Например, расстояние от любой точки отрезка B1B’1 до оси 0х определяет средний выигрыш υ1 при любом сочетании стратегий A1A2 (с частотами х и 1-х) и стратегией В1 игрока 2. Это расстояние равно
2х1 +6 (1 – х2) = υ1
(Вспомните планиметрию и рассмотрите трапецию А1В1В`1А2). Таким образом, ординаты точек, принадлежащих ломанной В1 М N B’3 определяют минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта минимальная величина является максимальной в точке N; следовательно этой точке соответствует оптимальная стратегия X* = (х, 1-х), а её ордината равна цене игры υ. Координаты точки N находим как точку пересечения прямых B2B’2 и B3B’3
Соответствующие два уравнения имеют вид
.
Следовательно , при цене игры . Таким образом, мы можем найти оптимальную стратегию при помощи матрицы
Оптимальные стратегии для игрока 2 можно найти из системы и, следовательно, ). (Из рисунка видно, что стратегия B1 не войдёт в оптимальную стратегию).
Пример 2. Найти решение игры, заданной матрицей
Решение. Матрица имеет размерность 2х4. Строим прямые, соответствующие стратегиям игрока 1.
Ломанная A1 К А'4 соответствует верхней границе выигрыша игрока 1, а отрезок N К - цене игры. Решение игры таково
4.7. Сведение матричной игры к задаче линейного программирования.
Предположим, что цена игры положительна (v > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и, следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются.
Итак, пусть дана матричная игра с матрицей А порядка т х п. Согласно свойству 7 оптимальные смешанные стратегии х = (x1, ..., хm), у = (y1, ..., уn) соответственно игроков 1 и 2 и цена игры и должны удовлетворять соотношениям.
(1)
(2)
Разделим все уравнения и неравенства в (1) и (2) на (это можно сделать, т.к. по предположению v > 0) и введём обозначения:
Тогда (1) и (2) перепишется в виде:
Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi, чтобы цена игры была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных значений рi (i = ), при которых
Поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры v была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных значений qj (j = ), при которых
(4)
Формулы (3) и (4) выражают двойственные друг другу задачи линейного программирования (ЛП).
Решив эти задачи, получим значения рi (i = ), qj (j = ) и . Тогда смешанные стратегии, т.е. хi и уj получаются по формулам :
х=vpi (i = ), y = vqj (j = )
Для того чтобы число v было ценой игры, а , были оптимальными стратегиями игроков А и В, необходимо и достаточно выполнение неравенства:
(гарантированный выигрыш)
(гарантированный проигрыш)
Игрок А имеет «m»-стратегий, а игрок В – «n»-стратегий.
Для 1-го игрока:
. Получаем задачу линейного программирования для игрока А.
. |
Для 2-го игрока:
Получаем задачу линейного программирования для игрока B.
. |
Эти две задачи являются двойственными задачами линейного программирования. Решая одну из них, получаем решение и другой задачи. За основу лучше брать задачу для игрока В (решение симплекс-методом). При составлении симплекс-таблицы следует помнить, что базисным переменным 2-ой задачи соответствуют свободные переменные 1-ой задачи, а базисным переменным 1-ой задачи – наоборот.
Пример 1.
Молочный комбинат «Ставропольский» планирует выпуск двух видов новой продукции: питьевой биойогурт и пудинг сливочный. Спрос на эти продукты не определен, но можно предположить, что он принимает одно из двух состояний: хороший и удовлетворительный. В зависимости от этих состояний прибыль комбината различна и определяется матрицей К: .
Найти оптимальное соотношение между объемами выпуска каждого из продуктов, при котором комбинату гарантирована средняя прибыль при любом состоянии спроса.
Решение.
Минимизируем элементы строк матрицы
α1= min (3,5)=3
α2= min (4,2)=2
Найдем нижнюю цену игры
α= maxmin (3,2)=3
Максимизируем элементов столбцов матрицы
β1=max(3,4)=4
β2=max(5,2)=5
Найдем верхнюю цену игры
α =minmax(4,5)=4
Т. К. нижняя и верхняя цены игры не равны, то игра производится в смешанных стратегиях, седловой точки нет.
Решим игру в смешанных стратегиях. Пусть х – вероятность применения 1 стратегии 1 игроком, (1-х) – вероятность применения 2 стратегии 1 игроком. Тогда
V = 3x + 4 - 4x = 4 – x - уравнение прямой L1
V = 5x + 2 - 2x = 3x + 2 - уравнение прямой L2
Строим систему координат х0у и на оси 0х отложим отрезок единичной длины (т.к. мы находим вероятность применения каждым из игроков своих смешанных стратегии, а вероятность находится от 0 до 1).
Строим прямые L1 и L2. Из точки пересечения прямых опускаем перпендикуляр на ось 0х и находим х.
4 - х = 3х + 2
4х = 2
х = ½ - вероятность применения 1 стратегии
1 – х = 1 – ½ = ½ - вероятность применения 2 стратегии.
Х( ½ , ½ )
Найдем цену игры
V = 4 – ½ = 3 ½
Пусть у – вероятность применения 1 стратегии 2 игроком, (1-у) – вероятность применения 2 стратегии 2 игроком.
Аналогично находим:
У = ¾
1 – у = 1 – ¾ = ¼
У( ¾ , ¼ )
Найдем цену игры:
V = 2 ¾ + 2 =3 ½
Также данную задачу можно решить путем сведения ее к задаче линейного программирования.
Составим пару взаимно – двойственных задач.
Для 1 игрока:
3t1 + 4t2 ≥1
5t1 + 2t2 ≥1
Z 1 = t1 + t2 min
Для 2 игрока:
3h1 + 5h2 ≤ 1
4h1 + 2h2 ≤ 1
Z2 = h1 + h2 max
Приведем системы к каноническому виду.
3 t1 + 4t2 - t3 = 1
5t1 + 2t2 – t4 = 1
t 3 = - 1 – (-3t1 – 4t2)
t4 = - 1 – (-5t1 – 2t2)
Z 1 = 0 – (-t1 – t2) min
3 h1+ 5h2 – h3= 1
4h1+ 2h2– h4 = 1
h 3 = 1 – (3h1 + 5h2)
h4= 1 – (4h1 + 3h2)
Z 2= 0 – (-h1– h2) max
Решим задачу симплекс - методом.
Симплекс таблица № 1
|
Bi |
h1 |
h2 |
h3 |
1 |
3 |
5 |
h4 |
1 |
4 |
2 |
Z2 |
0 |
-1 |
-1 |
Т.к. строка Z2 имеет отрицательные элементы, то строим симплекс-таблицу №2.
Симплекс таблица № 2
|
Bi |
h1 |
h3 |
h2 |
1/5 |
-3/4 |
1/5 |
h4 |
3/5 |
14/5 |
-2/5 |
Z2 |
1/5 |
-2/5 |
1/5 |
Т.к. строка Z2 имеет отрицательные элементы, то строим симплекс
таблицу №3.
Симплекс таблица № 3
|
Bi |
h4 |
h3 |
h2 |
1/14 |
-3/14 |
2/7 |
h1 |
3/14 |
5/14 |
-1/7 |
Z2 |
2/7 |
1/7 |
1/7 |
Из таблицы находим:
t1 = 1/7
t2 = 1/7
Zmin = 2/7
h1 = 3/14
h2 = 1/14
Zmax = 2/7
Получаем:
V = 1/Z = 7/2 = 3 ½
Отсюда:
X1 = vt1 = 7/2* 1/7 = ½
X2= vt2 = 7/2 * 1/7 = ½
Y1 = vh1 = 7/2 * 3/14 =3/4
Y2= vh2= 7/2 * 1/14 = ¼
Ответ: для комбината гарантирована средняя прибыль 3 ½ при производстве 50% от всего товара продукта А и при производстве 50% продукта В.