Добавил:

Yanus Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский Государственный Технический Университет

Предмет:

Методы оптимизации

Файл:

Методичка по теории игр.doc

Скачиваний:

Добавлен:

15.06.2014

Размер:

1.97 Mб

Скачать

☆

<<< < Предыдущая 12 / 122 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

1.2. Матричные игры

Матричной игрой называется конечная игра двух лиц с нулевой суммой.

Так как число стратегий каждого игрока в матричной игре конечно, то их можно пронумеровать. Будем считать, что игрок имеет стратегии =1, …, m, а игрок - стратегии =1, …, n. В дальнейшем будем называть ихчистыми стратегиями (ч.с.)

Функции выигрыша игроков в матричной игре могут быть заданы в виде платежной матрицы =() размера, где- выигрыш игрока (и, соответственно, проигрыш игрока ) в ситуации (,).

Пример 1.2. Игра "Два числа".

Играют двое. Каждый из игроков втайне от другого записывает одно из двух чисел: 1 или 2. Затем числа предъявляются и подводится итог. Если оба записали 1, то выигрывает 1 очко, а если оба записали 2, то выигрывает 2 очка. Если записал меньшее число, то выигрывает 1 очко; в противном случае выигрывает 2 очка. В любой ситуации выигрыш игрока равен проигрышу соперника.

Здесь у каждого из игроков имеется по две ч.с.: записать 1 или записать 2. Платежная матрица игры изображена на рис. 2, строки соответствуют стратегиям игрока , столбцы - стратегиям игрока .

	1	2		О	Р
1	-1	1	О	-1	1
2	-2	2	Р	1	-1

Рис. 3

Рис. 2

Пример 1.3. Игра в орлянку.

Игрок кладет монету, игрок , не видя, пытается угадать, какой стороной положил монету игрок - "орлом" (О) или "решкой" (Р). Угадал - выиграл 1 очко (а в этом случае проиграл 1 очко), не угадал - проиграл 1 очко (а выиграл 1 очко).

В этой игре у каждого из игроков имеется по две ч.с. : у игрока - положить монету "орлом" или "решкой", у игрока - назвать "орел" или "решку". Платежная матрица игры изображена на рис. 3.

1.3. Принцип минимакса. Седловые точки

Будем предполагать, что игроки ведут себя разумно и каждый из них стремится максимизировать свой выигрыш. Попытаемся выяснить, как следовало бы действовать игрокам в матричной игре, чтобы добиться поставленной цели.

Предположим, что игроки и участвуют в матричной игре с платежной матрицей =() размера. Выбирая чистую стратегию, игрок выбирает строку , а игрок - столбец . Выигрыш или, что то же, проигрыш в этой ситуации равен . Ясно, что игрок будет стараться увеличить , в то время как будет пытаться его уменьшить.

Если игрок выбрал ч.с. , то должен ответить такой стратегией , чтобы выигрышбыл наименьшим среди чисел, обозначим его:

Величина есть наименьший, то естьгарантированный выигрыш игрока при выборе им ч.с. . Значит, игроку выгодно выбрать ту стратегию, которая даст наибольшее значение :

Стратегия , для которой,максиминной стратегией игрока .

Аналогично рассуждая, получаем, что величина

есть наибольший, то есть гарантированный проигрыш игрока при выборе им ч.с. . Игроку из всех стратегий выгодно выбрать минимаксную ч.с., при которой его гарантированный проигрыш минимален:

Величины иназываются соответственнонижней и верхней ценой игры в ч.с.

Еще раз подчеркнем, что выбрав максиминную ч.с., игрок гарантированно получит выигрыш, не меньший , а игрок , выбрав минимаксную ч.с., не проиграет больше .

Описанные рассуждения носят название принципа минимакса (или принципа гарантированного результата). Кратко этот принцип может быть сформулирован следующим образом: каждый игрок должен стремиться максимально увеличить свой гарантированный выигрыш.

Легко показать, что в любой матричной игре . Например, в игре "Два числа" (пример 1.2), а в игре в орлянку (пример 1.3).

Хорошо известно [2], что равенство имеет место тогда и только тогда, когда платежная матрица имеет седловую точку, то есть существует такая пара номеров , что

для любых ,.

Седловая точка платежной матрицы дает ситуацию равновесия

в матричной игре, когда игроку невыгодно отступать от своей максиминной ч.с. , а игроку - от минимаксной ч.с. , поскольку отклоняясь от этих стратегий, игроки могут разве что уменьшить свой выигрыш. Если- седловая точка, то стратегииназываютсяоптимальными ч.с. Пара оптимальных ч.с. называетсярешением игры в ч.с., а сама матричная игра - разрешимой в ч.с. Величина называется в этом случаеценой игры в ч.с.

Если же , то матрица не имеет седловой точки. В такой игре ситуации равновесия нет, и она не разрешима в ч.с.

Между играми с седловой точкой и без нее существует огромная разница, которая проявляется особенно ярко при многократном повторении игры. Поясним эту разницу на примерах 1.2 и 1.3.

Рассмотрим игру "Два числа" (пример 1.2) и подумаем, как поведут себя разумные игроки в этой игре. Если выберет ч.с. 1, то есть запишет 1, он может выиграть 1 очко (если запишет 2), но может и проиграть 1 очко (если запишет 1). Если же выберет ч.с. 2, то он может выиграть 2 очка (если запишет 2), но может и проиграть 2 очка (если запишет 1). А поскольку игрок разумен, то он наверняка выберет ч.с. 1 (при этом он вообще не проигрывает). И тогда игроку ничего другого не остается, как выбрать меньшее из зол и записать число 1.

Итак, в этой игре есть ситуация равновесия (1,1), когда игрокам невыгодно отступать от своих оптимальных ч.с. =1,=1, сколько бы ни продолжалась игра. Правда, при этом каждый раз будет проигрывать 1 очко, но, выбирая число 2, он проиграет еще больше. Игроку тем более невыгодно отступать от избранной стратегии, так как записав число 2, он вместо выигрыша проиграет 1 очко. Оба даже могут заранее объявить о своих намерениях, секретность в играх с седловой точкой не имеет никакого значения.

Иное дело в игре в орлянку (пример 1.3). В этой игре седловой точки нет, и игрокам имеет смысл скрывать свои намерения от соперника. Если при многократном повторении игры один из игроков будет все время придерживаться какой-либо одной ч.с. или даже выбирать свои ч.с. по некоторой заранее определенной схеме, то его разумный соперник может понять это и принять контрмеры. Единственный разумный выход видится в следующем: в такой игре игроки должны выбирать свои ч.с. случайно, но сама схема рандомизации должна выбираться разумно. В этом и состоит идея использования смешанных стратегий.

<<< < Предыдущая 12 / 122 3 4 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете Методы оптимизации

#
15.06.2014293.02 Кб3023.jpg
#
15.06.201454.49 Кб4025.jpg
#
15.06.201428.67 Кб17Вопрсы методы опт..doc
#
15.06.2014686.08 Кб12Записка2.doc
#
15.06.20141.74 Mб55Методичка по математич.программир.doc
#
15.06.20141.97 Mб89Методичка по теории игр.doc
#
15.06.20145.11 Mб52Методичка.doc
#
15.06.20141.84 Mб48Методичка_по_МП_для_ОмГУ.doc
#
15.06.2014392.7 Кб27РГР.doc
#
15.06.201471.68 Кб11ТЗ на РГР.doc
#
15.06.201430.72 Кб83Титульный лист.doc