Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр и исследование операций.doc
Скачиваний:
248
Добавлен:
12.03.2015
Размер:
561.66 Кб
Скачать

2.4. Методы решения матричных игр.

Теорема Неймана о минимаксе, гарантируя каждому игроку успех на пути отыскания оптимальной стратегии, тем не менее, ни слова не говорит о том, как эти стратегии найти. В этом параграфе мы рассмотрим несколько конструктивных методов нахождения оптимальных стратегий игроков.

Сразу заметим, что первым этапом поиска решения любой матричной игры является анализ игры на наличие седловой точки (см. п.2.1). Только при отсутствии таковой переходят к более тонким методам нахождения решения. Среди таких методов имеются как универсальные, которые применимы к любой матричной игре, так и частные, используемые для отдельных классов игр

  1. Игра 2х2.

Пусть игра задана матрицей

.

Предположим, что седловая точка отсутствует. Однако, согласно теореме Неймана, оптимальное решение игры существует и определяется парой смешанных стратегий SA*=(p1*,p2*), SB*=(q1*,q2*). Используя свойство 3 решения игр и элементарные алгебраические преобразования (подробный вывод мы опускаем), приходим к следующим формулам:

р1=(а22а21)/(а11+а22а12а21), р2=1р1,

q1=(a22a12)/(a11+a22a12a21), q2=1q1, (2.7)

vS=(a22·a11-a12·a21)/(a11+a22a12a21).

При этом отсутствие седловой точки в игре гарантирует необращение в 0 знаменателей в приведенных формулах.

Пример 2.4. Найдем решение в смешанных стратегиях игры, рассмотренной в примере 2.1 о двух игроках с двумя монетами. Платежная матрица этой игры имеет вид:

Нижняя и верхняя цены этой игры =3 и =2. Следовательно, седловая точка отсутствует.

Найдем оптимальные стратегии игроков и цену игры, применяя формулы (4.1.). Имеем:

р1=(4(3))/(2+4(3)(3))=7/12, р2=17/12=5/12,

q1=(4(3))/(2+4(3)(3))=7/12, q2=5/12,

vS=(42(3)(3))/(2+4(3)(3))=1/12.

Итак, решением игры является пара смешанных стратегий SA*=(7/12,5/12), SB*=(7/12,5/12), цена игры vS=1/12. Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая 1-ю стратегию (положить 1 руб.) с вероятностью 7/12, а 2-ю стратегию (положить 2 руб.) – с вероятностью 5/12.

Отрицательная цена игры vS=1/12 показывает, что при использовании игроками своих оптимальных стратегий, первый игрок проигрывает второму в каждой партии «в среднем» 1/12 рубля. Тем самым можно говорить об изначальной несправедливости условий игры.

  1. Упрощение игр с помощью отбрасывания доминируемых стратегий.

Стратегия Аi игрока А называется доминирующей над стратегией Аk (а стратегия Аk доминируемой стратегией Аi), если все элементы i-й строки платежной матрицы не меньше соответствующих элементов k-й строки, т. е. аi1ak1, ai2ak2, …, aimakm (в том же смысле можно говорить и о доминировании строк).

Стратегия Вj игрока В называется доминирующей над стратегией Вl (а стратегия Вl - доминируемой стратегией Вj), если все элементы j-го столбца платежной матрицы не больше соответствующих элементов l-го столбца, т. е. a1ja1l, a2ja2l,…, amjaml (здесь также можно говорить и о доминировании столбцов платежной матрицы).

Доминируемая стратегия является заведомо невыгодной для игрока, ее выбирающего, и потому при дальнейшем исследовании игры может быть отброшена. В оптимальную смешанную стратегию она войдет с нулевой вероятностью. Следует также заметить, что при отбрасывании доминируемых стратегий некоторые из оптимальных стратегий игроков могут быть потеряны. Однако цена игры не изменится, и по усеченной матрице может быть найдена, по крайней мере, одна пара оптимальных смешанных стратегий.

Пример 2.5. Найдем оптимальное решение игры, заданной платежной матрицей

Результаты процесса отбрасывания доминируемых стратегий отобразим в таблице:

В1

В2

В3

В4

А1

3

-2

5

-1

А2

4

0

6

1

А3

2

-1

3

2

А4

1

3

7

4

Комментарии:

1) Строка А2 доминирует над строкой А1 (43, 02, 65, 11); следовательно, строку А1 отбрасываем (вычеркиваем).

2) В оставшейся части матрицы столбец В2 доминирует над столбцами В3 и В4 (06, 13, 37 и 01, 12, 34); следовательно, вычеркиваем столбцы В3 и В4.

3) Наконец, в полученной матрице строка А2 доминирует над строкой А3 (42, 21); вычеркиваем строку А3.

Оставшаяся матрица

не имеет доминируемых стратегий и относится к классу игр 2х2.

Используя формулы (2.7), найдем оптимальные смешанные стратегии игроков в полученной игре, а также ее цену:

=(31)/(4+310)=2/6=1/3, =11/3=2/3, =(30)/(4+310)=1/2,

=11/2=1/2, =(4301)/(4+310)=2.

Итак, =(1/3,2/3),=(1/2,1/2) – оптимальное решение игры, заданной матрицей. Учитывая вычеркнутые доминируемые стратегии игроков, запишем оптимальное решение исходной игры:SA*=(0,1/3,0,2/3), SB*=(1/2,1/2,0,0). Цена игры - та же v*=2.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]