Добавил:

Yanus Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский Государственный Технический Университет

Предмет:

Методы оптимизации

Файл:

Методичка по теории игр.doc

Скачиваний:

Добавлен:

15.06.2014

Размер:

1.97 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 123 4 5 6 7 8 9 10 11 12 > Следующая >>>

1.4. Смешанные стратегии

Смешанной стратегией (с.с.) игрока в матричной игре называется вероятностное распределение на множестве его ч.с. Таким образом, если - чистые стратегии игрока , а - чистые стратегии игрока , то с.с. игрока - это вероятностный вектор , где- вероятность выбора игроком чистой стратегии ,. Очевидно, вектордолжен удовлетворять условиям:

. (1)

Аналогично, с.с. игрока - это вероятностный вектор , удовлетворяющий условиям

. (2)

Обозначим множество всех с.с. игрока через , а игрока - через . Если выбрал с.с. , а - , товыигрышем игрока (соответственно проигрышем игрока в ситуации естественно считать математическое ожидание

. (3)

В соответствии с принципом минимакса гарантированный, то есть наименьший выигрыш игрока при выборе им с.с. будет равен

. (4)

Поэтому игроку выгодно выбрать так, чтобы максимально увеличить:

. 5)

Аналогично, гарантированный, то есть наибольший проигрыш игрока при выборе им с.с. равен

. (6)

и игроку выгодно минимизировать :

. (7)

Числа ,называются соответственнонижней и верхней ценой игры в смешанных стратегиях.

Замечание. Строго говоря, следовало бы доказать, что все минимумы и максимумы в (4)-(7) существуют. Однако, это очевидно, так как в силу (1), (2) множества , компактны, а функции (3), (4) и (6) непрерывны.

Следующая лемма дает более простые, чем (4), (6) выражения величин ,.

Лемма 1.1[2] (о гарантированных выигрышах).

для всякой с.с. ;

для всякой с.с. .

Матричная игра называется разрешимой в с.с., если , а стратегии*,*, для которых, называютсяоптимальными с.с. Пара (*,*) оптимальных с.с. образуетситуацию равновесия в с.с., а величина -цена игры в с.с. - равна ожидаемому среднему выигрышу игрока (и, соответственно, ожидаемому среднему проигрышу игрока ).

Как и в случае чистых стратегий, несложно показать, что всегда . Однако, замечательно, что в случае смешанных стратегий строгое неравенствоневозможно. Это вытекает из следующей основной теоремы матричных игр, доказанной Дж. фон Нейманом в 1928 г.

Теорема 1.2[2] (о минимаксе). Для любой матричной игры имеет место равенство Другими словами, любая матричная игра разрешима в с.с.

Оптимальные с.с. игроков, а также цена игры в с.с. могут быть найдены как решения пары двойственных задач линейного программирования:

, (8)

Здесь - элементы платежной матрицы , переменные ,- компоненты смешанных стратегий игроков , соответственно, - гарантированный выигрыш игрока , - гарантированный проигрыш игрока в с.с.

1.5. Пример полного решения матричной игры

Задача. Решить игру с платежной матрицей

Решение. 1. Выясним, имеет ли игра решение в ч.с. Для этого вычислим нижнюю и верхнюю цены игры в ч.с.:

; .

, следовательно, матрица не имеет седловой точки, и игра не разрешима в ч.с.

2. Будем искать решение игры в с.с. Смешанная стратегия игрока - это вероятностный вектор:

, где ;.

Аналогично, смешанная стратегия игрока - это вероятностный вектор:

, где ;.

3. Заметим, что каждый элемент строки 1 не меньше соответствующего элемента строки 3, то есть выигрыш игрока при выборе им ч.с. 1 не меньше его выигрыша при выборе им ч.с. 3. Ясно, что разумный игрок предпочтет стратегию 1 стратегии 3. В этом случае говорят, что ч.с. 1 игрока доминирует над его ч.с. 3. Аналогично, каждый элемент столбца 2 не больше соответствующего элемента столбца 3, и ч.с. 2 игрока доминирует над его ч.с. 3. Легко понять, что в оптимальные с.с. доминируемые ч.с. войдут с нулевыми вероятностями ,. Поэтому в дальнейшем мы можем рассматривать сокращенную матрицу игры, полученную из исходной вычеркиванием третьей строки и третьего столбца:

4. "Сдвиг" матрицы. Вместо матрицы рассмотрим матрицу

полученную из матрицы добавлением одного и того же числа ко всем ее элементам. Число это (в данном случае 2) выбирается так, чтобы все элементы матрицыстали неотрицательными. Несложно показать, что такой сдвиг платежной матрицы не приводит к изменению оптимальных смешанных стратегий игроков. Изменяется только значение цены игры, в данном случае оно увеличивается на 2.

Смысл такого сдвига в следующем. В игре с платежной матрицей выигрыш игрока в любой ситуации неотрицателен, а значит не отрицательны и все его гарантированные выигрыши, а также цена игры в с.с. Это дает нам право, составляя пару двойственных задач ЛП, считать переменные неотрицательными.

5. Составляем пару двойственных задач ЛП для игры с платежной матрицей :

(9)

Прежде чем решать их, удобно сделать замену переменных ,,=1,2. Тогда задачи принимают вид:

(10)

6. Приводим вторую задачу к канонической форме (вводя дополнительные переменные ), и решаем ее симплекс-методом [1]:

	t₀	t₁	t₂	t₃	t₄
f	0	-1	-1	0	0
t₃	1	3	1	1	0
t₄	1	0	4	0	1

	t₀	t₁	t₂	t₃	t₄
f	1/3	0	-2/3	1/3	0
t₃	1/3	1	1/3	1/3	0
t₄	1	0	4	0	1

	t₀	t₁	t₂	t₃	t₄
f	1/2	0	1	1/3	1/6
t₃	1/4	1	0	1/3	-1/12
t₄	1/4	0	1	0	1/4

Оптимальное решение , .Используя вторую теорему двойственности, находим оптимальное решение двойственной задачи:,. Возвращаясь к исходным переменным и вспоминая, что,, получаем оптимальные с.с. игроков:,. Цена игры в с.с. равна 0 (с учетом сдвига матрицы).

Комментарий. Оптимальные с.с. игроков диктуют им следующие действия при многократном повторении игры: игроку следует выбирать свою первую ч.с. с вероятностью 2/3, а вторую - с вероятностью 1/3. Игроку - выбирать как первую, так и вторую ч.с. с вероятностью 1/2. При этом ожидаемый средний выигрыш игрока (и проигрыш игрока ) будет равен нулю - ничья.

<<< < Предыдущая 1 23 / 123 4 5 6 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете Методы оптимизации

#
15.06.2014293.02 Кб3023.jpg
#
15.06.201454.49 Кб4025.jpg
#
15.06.201428.67 Кб17Вопрсы методы опт..doc
#
15.06.2014686.08 Кб12Записка2.doc
#
15.06.20141.74 Mб55Методичка по математич.программир.doc
#
15.06.20141.97 Mб88Методичка по теории игр.doc
#
15.06.20145.11 Mб52Методичка.doc
#
15.06.20141.84 Mб48Методичка_по_МП_для_ОмГУ.doc
#
15.06.2014392.7 Кб27РГР.doc
#
15.06.201471.68 Кб11ТЗ на РГР.doc
#
15.06.201430.72 Кб83Титульный лист.doc