Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Уральский государственный экономический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ТИГР_last.doc

Скачиваний:

Добавлен:

13.05.2015

Размер:

5.6 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 103 4 5 6 7 8 9 10 > Следующая >>>

Тема 2. Решение игр в смешанных стратегиях

Смешанной стратегией игрока называется применение чистых стратегий с вероятностями причем

Смешанные стратегии игрока записываются в виде матрицы

или .

Аналогично смешанные стратегии игрока обозначаются

или

Чистые стратегии можно считать частным случаем смешанных стратегий. Их можно задавать строкой, в которой 1 соответствует активной чистой стратегии, остальные элементы строки равны 0.

На основании принципа минимакса определяется оптимальное решение (или решение) игры: это пара оптимальных стратегий и обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не выгодно отступать от своей.

Выигрыш, соответствующий оптимальному решению, называется ценой игры v.

, где – нижняя и верхняя цены игры.

Теорема Неймана (основная теорема теории игр).

Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.

Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.

Теорема. Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий (теорема позволяет строить модели нахождения оптимальных стратегий при отсутствии седловой точки).

Тема 2.1. Игры размера 2 × 2 и их аналитическое решение

Простейший случай конечной игры.

Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.

Если седловой точки нет, воспользуемся теоремой об активных стратегиях.

Если игрок I придерживается своей оптимальной стратегии , то его средний выигрыш будет равен цене игры v, какой бы активной стратегией ни пользовался игрок II. Для игры 2 × 2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Поэтому средний выигрыш игрока I(оптимальная стратегия) будет равен v и для 1-й, и для 2-й стратегии противника.

Выигрыш игрока I (проигрыш игрока II) – случайная величина, математическое ожидание которой является ценой игры.

Пусть игра задана платежной матрицей .

Средний выигрыш игрока I, если он использует оптимальную смешанную стратегию а игрок II – чистую стратегию , равен цене игры v.

Если игрок II использует чистую стратегию , то для игрока I получаем

В итоге имеем систему уравнений

Решая эту систему, получим оптимальную стратегию

и цену игры

Аналогично находится оптимальная стратегия II игрока:

Пример 3. Найти оптимальные стратегии игры «Орлянка».

Игра задана платежной матрицей

, седловой точки нет.

Ищем решение в смешанных стратегиях.

Решая эти системы, получаем

Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы выбирать «Орел» или «Решка» с вероятностью 0,5, при этом средний выигрыш будет равен 0.

Тема 2.2. Игры размера 2 × n и m × 2 и их графоаналитическое решение

Рассмотрим игру заданную матрицей выигрышей размера

У игрока I есть две стратегии

Для графического решения используем ортогональную декартову систему координат X0Y.

По оси абсцисс от точки 0 отложим единичный отрезок ,

точка () соответствует стратегии (1-ой стратегии игрока I),

точка () соответствует стратегии (2-ой стратегии игрока I).

Все промежуточные точки отрезка – смешанные стратегии игрока I.

Отрезок это вероятность стратегии ,

отрезок это вероятность стратегии .

Когда смешанная стратегия совпадает с чистой стратегией вероятность , и наоборот,

когда смешанная стратегия совпадает с чистой стратегией вероятность .

Группа 54

Группа 5 Группа 3

На оси ординат 0Y откладываем выигрыши игрока I при стратегии и различных стратегиях игрока II, отмечая их точками

На прямой, проходящей через точку параллельно оси 0Y, откладываем выигрыши игрока I при стратегии и различных стратегиях игрока II, отмечая их точками

Строим прямые ‘ для .

Ординаты точек лежащих на прямой ‘ равны среднему выигрышу игрока I, когда игрок II использует i-ую стратегию, и могут быть вычислены по формуле математического ожидания для соответствующих смешанных стратегий.

Группа 32

В соответствии с принципом минимакса оптимальная стратегия ‘ такова, что минимальный выигрыш игрока I (при наихудшем поведении игрока II) обращается в максимум.