Глава 6 Элементы теории игр

6.1.Платежная матрица. Нижняя и верхняя цена игры.

6.2. Решение игры в смешанных стратегиях.

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Финансовый университет при Правительстве РФ

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Методы оптимальных решений.pdf

Скачиваний:

1711

Добавлен:

13.03.2015

Размер:

1.09 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 1914 15 16 17 18 19 > Следующая >>>

Вэкономике и других сферах деятельности достаточно часто встречаются ситуации, в которых две (или более) стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнера. Такие ситуации называются кон-

фликтными.

Теория игр - математическая теория конфликтных ситуаций, при этом математическая модель называется игрой, а исход конфлик-

та выигрышем.

Стратегией игрока называется совокупность правил, определяющих поведение игрока на каждом ходе в зависимости от сложившейся ситуации.

Оптимальная стратегия игрока обеспечивает ему при много-

кратном повторении игры максимально возможный выигрыш. Парная игра, в которой выигрыш одного из игроков равен

проигрышу другого, называется антагонистической или игрой с ну-

левой суммой.

Пусть игрок А располагает m стратегиями A1, A2, ..., Am, а игрок В – n стратегиями В1, В2,…,Вn. Обозначим через aij выигрыш игрока А при выборе стратегий Ai и Bj.

a11	a12	a1n
Матрица a21	a22	a2n	называется платежной матрицей

	am2
am1		amn

или матрицей игры.

Пусть αi – наименьший выигрыш игрока А при выборе им

стратегии Ai	для всех возможных стратегий игрока В, αi = minαij . То-
	j=1,n

гда гарантированный выигрыш игрока А при любой стратегии игрока В равен

α = maxαi = max minαij
i=1,m	i=1,m j=1,n

Число α называется нижней ценой игры.

Число β = min maxαij называется верхней ценой игры. Это гаран-

j=1,n i=1,m

тированный проигрыш игрока В.

Замечание 6.1. α ≤ β .

Если α = β =ν , то ν называется чистой ценой (ценой игры), а пара чистых оптимальных стратегий Ai и Bj, для которой αij =ν , на-

зывается седловой точкой матрицы.

Пример 6.1. Определить нижнюю и верхнюю цену игры, за-

	0,5		0,6	0,8
данной платежной матрицей		0,9	0,7	0,8	. Имеет ли игра седло-
	P =
		0,7	0,6	0,6

вую точку?

Решение. Для нахождения нижней цены игры найдем минимальные значения каждой строки матрицы и выберем среди них наибольшее.

α1 = min(0,5; 0,6; 0,8) = 0,5 ;

α2 = min(0,9; 0,7; 0,8) = 0,7 ;

α3 = min(0,7; 0,6; 0,6) = 0,6;

α= max(0,5; 0,7; 0,6) = 0,7 .

Для нахождения верхней цены игры найдем максимальное значение в каждом столбце и выберем среди них наименьшее.

β1 = max(0,5; 0,9; 0,7) = 0,9 ;

β2 = max(0,6; 0,7; 0,6) = 0,7 ;

β3 = max(0,8; 0,8; 0,6) = 0,8 ;

β= min(0,9; 0,7; 0,8) = 0,7 .

Так как α = β = 0,7 , то цена игры ν = 0,7 , и она достигается на

одной и той же паре стратегий (А2; В2).

Ответ. α = β = 0,7 ; Седловая точка – (А2; В2).

Задачи для самостоятельного решения.

№ 83-89. Для платежной матрицы Р определить нижнюю, верхнюю цену игры и оптимальные решения игры, если существует седловая точка.

		2	10	25	0			14		27	18	19	23
		13	14	19	6				2	17	16	24	2
83.							84.
	Р =	−5 3		−2	−4	.		Р =	29	3 7 15			22	.

		18	5	−3	−5				5	20	17	23	10


	4 5 6				7 9					2 5			3			1		4	5	9
		3	4 6		5 6						6 4		5			1		4	5	9
85.		3	4 6		5 6			. 86.	Р =		6 4		5		87.		3	8	4	3
85.	Р =	7	6	10				. 86.	Р =		3 7		6	.	87.	Р =	3	8	4	3	.
		7	6	10	8 11						3 7		6				4	6	6	2
		8	5	4	7 3						2 3		4				4	6	6	2
		8	5	4	7 3						2 3		4
	0 1			3	0	2			4 9				5	3
		0	0	0	1	1				7		8	6	9
88.		0	0	0	1	1	. 89.			7		8	6	9
88.	Р =	1	0	3	1	0	. 89.		Р =	7		4	2	6	.
		1	0	3	1	0				7		4	2	6
		0	0	1	2	1				8		3	4	7
		0	0	1	2	1				8		3	4	7

Пример 6.4.

Найти решение игры P =

Нижняя цена игры α = 2 . Верхняя цена игры β =3.

Если α < β , то применение чистых стратегий не дает опти-

мального решения игры. Его можно получить случайным образом чередуя чистые стратегии, т.е. в смешанных стратегиях.

Определение 6.1. Смешанной стратегией SА игрока А называется применение чистых стратегий A1, A2, ..., Am с вероятностями

p1,p2,…,pm, ∑pi =1

i=1

SA = A1	A2		Am .
p	p	2		p
1		2			m

Аналогично для игрока В:

B1	B2		Bn		n
				,	∑q j =1.
SB =	q2			,	∑q j =1.
q1	q2	qn			j=1

Теорема Неймана. Каждая конечная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.

Пример 6.2. Найти решение игры в смешанных стратегиях,

4		2
заданной платежной матрицей			.
	3	5
	3	5

Решение. Для данной игры α =3 , β = 4 , α ≠ β . Средний выигрыш игрока А, если он использует оптимальную смешанную страте-

гию	SA*		A	A	, а игрок В – чистую стратегию В1	(первый столбец
гию	SA*	=	1	2	, а игрок В – чистую стратегию В1	(первый столбец
		p*		p*
			1	2

платежной матрицы), равен цене игры ν :

4 p1* +3p2* =ν

Тот же средний выигрыш получает игрок А, если второй игрок применяет стратегию В2 (второй столбец платежной матрицы), т.е.

2 p1* +5 p2* =ν

Получаем систему:

4 p1* +3p2* =ν

2 p1* +5 p2* =ν ,p1* + p2* =1

решением которой является p1* = p2* = 12 , ν = 72 . Аналогично, система для игрока В имеет вид

4q1* +2q2* =ν

3q1* +5q2* =ν ,q1* +q2* =1

решением которой является q1* = 34 , q2* = 14 , ν = 72 .

Оптимальная стратегия игрока А состоит в том, чтобы чередовать свои стратегии, выбирая их с вероятностью 12 , при этом средний

выигрыш равен 72 .

Ответ. pопт = (12 ; 12) , qопт = (34 ; 14) , ν = 72

Игру в смешанных стратегиях, заданную платежной матрицей размерностью 2×2 , можно решить геометрическим способом.

Пример 6.3. Найти решение игры, заданной платежной мат-

рицей	1,5		3	, геометрическим способом.
рицей	P =			, геометрическим способом.
		2	1
		2	1

Решение.α =1,5 , β = 2 . Так как α ≠ β , то седловой точки нет,

следовательно, игра может быть решена в смешанных стратегиях. На оси Ох отложим единичный отрезок А1А2. Прямая х=0 со-

ответствует стратегии А1 игрока А, а прямая х=1 соответствует стра-

тегии А2.

Пусть второй игрок В примет стратегию В1. Отложим на прямых х=0 и х=1 соответствующие выигрыши а11 и а21. Обозначим эти точки В1. Если второй игрок В выберет стратегию В2, то соответствующие выигрыши а12 и а22. Отложим их так же на прямых х=0 и х=1. Обозначим эти точки В2.

B2 •

N • B1

B1 •

• B2

•

• A2

Ординаты точек, лежащий на ломаной B1NB2 показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии. В точке N минимальный выигрыш достигает своего максимума, следовательно, это и есть оптимальная стратегия SA* = ( p1* , p2* ) .

Ордината точки N равна цене игры ν .

Точка N есть пересечение прямых В1В1 и В2В2.

Уравнение В1В1: 1x−−00 = 2y −−1,51,5 y = 0,5x +1,5

Уравнение В2В2: 1x−−00 = 1y−−33

y = −2x +3

y = 0,5x +1,5

y = −2x +3

Решением этой системы является точка (0,6;1,8). Следовательно

p2* = 0,6 , p1* =1− p2* = 0,4 , ν =1,8 .

Геометрически можно определить оптимальную стратегию игрока В, если поменять игроков А и В местами и вместо максимума нижней границы рассмотреть минимум верхней границы.

• А1 (1, 3)

А2 (0, 2)	•		M
			M
А1 (0, 1,5)	•
				•	А2 (1, 1)
				•	А2 (1, 1)
В1	•			•	В2	x
Уравнение А1А1:	x −0	=		y −1,5
Уравнение А1А1:	1−0	=		3 −1,5
	1−0			3 −1,5
	y =1,5x +1,5
Уравнение А2А2:	x −0		=	y −2
Уравнение А2А2:	1−0		=	1−2
	1−0			1−2

y = −x +2

Координаты точки М есть решение системы

y =1,5x +1,5

y = −x +2 x = 0,2 y =1,8

Следовательно, q2* = 0,2 , q1* =1−q2* = 0,8, ν =1,8 .

Ответ. pопт = (0,4;0,6) , qопт = (0,8;0,2) , ν =1,8

Замечание 6.2. Если в платежной матрице Р все элементы i-й строки не меньше соответствующих элементов k-й строки, аij ≥ аkj , j =1,n , а по крайней мере один строго больше, то i-я строка называется доминирующей, а k-я строка – доминируемой.

Игроку А не выгодно применять стратегии, которым соответствуют доминируемые строки, а игроку В – доминирующие столбцы. Поэтому, при решении игры, можно уменьшить размер платежной матрицы путем удаления из нее доминируемых строк и доминирующих столбцов.

Так как α ≠ β , то решение игры будем искать в смешанных стратеги-

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 1314 / 1914 15 16 17 18 19 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
24.03.201670.45 Кб100Методология разработки информационных систем.docx
#
24.12.2018185.86 Кб2методология соц прогнозирования курсовая.doc
#
13.03.2015226.82 Кб5Методуказания ВКР бакалавры ФиК выпуск2015.doc
#
13.03.2015381.52 Кб19Методуказания к к_р_Сист Анализ в Экономике.pdf
#
13.03.2015112.13 Кб56Методы активизации творческой деятельности.doc
#
13.03.20151.09 Mб1711Методы оптимальных решений.pdf
#
24.03.201642.5 Кб39Методы планирования бюджетных расходов.doc
#
26.05.2015223.23 Кб43МетОптРеш_МУ по вып контр раб_2012.doc
#
16.12.201895 Кб4микра 1-3 темы.docx
#
22.07.201991.97 Кб3Микра 31-35.docx
#
10.12.201869.91 Кб3мИКРА С 45 -53 ВОПРОСЫ.docx