Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Самарский национальный исследовательский университет им. ак. С.П. Королёва (бывш. СГАУ, СамГУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Дуплякин В.М. Теория игр

.pdf

Скачиваний:

Добавлен:

16.03.2015

Размер:

1.53 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2016 17 18 19 20 > Следующая >>>

Т Е О Р И Я		И Г Р													В.М.Дуплякин
					f 2
					140
									M4 ( -20 ; 120)
					120
					100							M1 ( 20 ; 70)
												M1 ( 20 ; 70)
					80
					60										M3 ( 100 ; 40)
															M3 ( 100 ; 40)
N3					40				N1
N3									N1
y 1	1
y 1	0,9				20
	0,9				20
	0,8
	0,7				0
	0,6				0
	0,6
	0,5				-20
	0,4				-20									M2 ( 60 ; -40)
	0,3													M2 ( 60 ; -40)
	0,3
	0,2				-40
	0,1								x 1
	0	0,1	0,2	0,3	-60	0,7	0,8	0,9	x 1							120 f 1
	0	0,1	0,2	0,3	0,4 0,5 0,6	0,7	0,8	0,9	1
N4					-40				-20N2	0	20	40	60	80	100
Рис. 14. 6 – "Заметание" отрезка											x1 = 0,1 ( x2		= 0,8); 0 ≤ y1 ≤ 1 ( 1 ≤ y2			≤ 0)

Выполняя "заметание" серией параллельных отрезков проведённых с некоторым шагом в единичном квадрате, как это показано на рис. 14.7, выявим область возможных решений рассматриваемой задачи. Обратим внимание на то, что точка Нэш-оптимальности оказалась внутри заметаемой области, что вполне закономерно.

Построив серию "заметаемых" отрезков, следует найти точки их пересечения и провести через эти точки огибающую линию, которая будет нелинейной границей области возможных решений.

150

Т Е О Р И Я	И Г Р							В.М.Дуплякин
f 2
140
		M4 ( -20 ; 120)
120
100				M1 ( 20 ; 70)
				M1 ( 20 ; 70)
80						Nopt
60							M3 ( 100 ; 40)
							M3 ( 100 ; 40)
40					Огибающая заметаемых линий
					Огибающая заметаемых линий
20
0
-20						M2 ( 60 ; -40)
						M2 ( 60 ; -40)
-40
-60									f 1
-40	-20	0	20	40	60	80	100	120	f 1

Рис. 14.7 – Построение огибающей заметаемых линий

В конечном итоге, убрав заметаемые отрезки, построим область возможных решений, как в смешанных, так и в чистых стратегиях, представив её на рис. 14.8.

151

Т Е О Р И Я	И Г Р							В.М.Дуплякин
f 2
140
120	M4 ( -20 ; 120)
120
100				M1 ( 20 ; 70)
				M1 ( 20 ; 70)
80
60							M3 ( 100 ; 40)
							M3 ( 100 ; 40)
40					Nopt
					Nopt
20
0
-20
-40						M2 ( 60 ; -40)
-40
-60									f 1
-40	-20	0	20	40	60	80	100	120	f 1
		Рис. 14.8 – Область возможных решений

Выявление Парето-множества решений в смешанных стратегиях иллюстрируется на рис. 14.9. Следует отметить, что две точки, соответствующие выбору чистых стратегиях, а именно точки М3 и М4 непосредственно примыкают к множеству Парето-оптимальных решений в чистых стратегиях.

152

Т Е О Р И Я	И Г Р							В.М.Дуплякин
f 2
140	M4 ( -20 ; 120)
	M4 ( -20 ; 120)
120				π − opt
100				π − opt
100
80
60
		M1 ( 20 ; 70)
40					Nopt
					Nopt		M3 ( 100 ; 40)
							M3 ( 100 ; 40)
20
0
-20
-40						M2 ( 60 ; -40)
						M2 ( 60 ; -40)
-60									f 1
-40	-20	0	20	40	60	80	100	120	f 1

Рис. 14.9 – Парето-множество решений в смешанных стратегиях

Если рассматривать Парето-оптимальность только в чистых стратегиях, то она достигается в трёх точках: М1, М3, М4. Если же рассматривать Парето- оптимальность как в чистых, так и в смешанных стратегиях, то точка М1 перестаёт принадлежать Парето-множеству.

153

Т Е О Р И Я И Г Р

В.М.Дуплякин

15. МАКСИМИЗАЦИЯ РЕЗУЛЬТАТИВНОСТИ ПОВТОРЯЮЩИХСЯ БИМАТРИЧНЫХ ИГР

Повторение биматричных игр позволяет реализовать траектории выбора стратегий, обеспечивающие повышение результативности игроков по сравнению с одноходовым вариантом.

15.1.Игра "Семейный спор"

15.1.1.Доминирование. Решение по Нэшу. Парето-оптимальность

Рассмотрим возможности повышения результативности на известном

примере игры "Семейный спор". В этой игре предполагается, что некая семейная пара (скорее всего молодожёны) пытается найти наилучшие варианты распределения свободного времени: совместное посещение театра или футбола, или те же варианты, но порознь. Естественно, что каждый из игроков Р1 – "ОН", Р2 – "ОНА" имеет свою шкалу предпочтений и соответственно степень удовлетворения, т.е. налицо игровая задача с конфликтом интересов и выбором оптимальных стратегий. Платёжная матрица выигрышей этой игры, где мерой

выигрыша является субъективная оценка полезности или степени удовлетворении, приведена на рис. 15.1.

[u(P1,P2)]

Стратегии Р2 - "ОНА"

"Театр"

"Футбол"

Стратегии

"Театр"

(3; 5)

(-1;-1)

Р1 – "ОН"

"Футбол"

(2; 2)

(5; 3)

Рис. 15.1 – Платёжная матрица игры "Семейный спор"

Сначала выполним анализ доминирования строк или столбцов платёжной матрицы, как это показано на рис. 15.2. Убеждаемся, что в представленной матрице нет ни доминирующих строк, ни столбцов, поэтому отсутствует оптимальное равновесие в доминирующих стратегиях.

Как видно из графического анализа, представленного рис. 15.2, в двух игровых ситуациях "1" и "4" имеет место равновесие по Нэшу.

154

Т Е О Р И Я И Г Р

В.М.Дуплякин

Стратегии Р1 - "ОН"

[u (P1,P2)]	Стратегии Р2 - "ОНА"
[u (P1,P2)]
	"Театр"	"Футбол"
"Театр"	3 ; 5	-1 ; -1
		1 2
"Футбол"		3 4
"Футбол"	2 ; 2	5 ; 3

N opt

Рис. 15.2 – Графический анализ доминирования

Схематично выбор стратегий оптимальных по Парето оформляется следующим образом

Nopt	ψ (1)	= ((1;0);(1;0))	Þ	f (1)	= (3;5)
Nopt	ψ (4)	= ((0;1);(0;1))	Þ	f (4)	= (5;3)

Рис. 15.3 – Формализованный выбор Нэш-оптимальных стратегий

Сравнивая найденные Нэш-оптимальные стратегии, убеждаемся в их зеркальной симметрии и как следствие этого в том, что в одноходовом варианте данная игра несправедливая, т.к. один игрок всегда получает больше другого.

Рассмотрим нахождение Парето-множества оптимальных решений данной игры, предполагая, что согласованное поведение игроков в принципе может дать возможность увеличить их выигрыши.

В данном случае, как видно из рис. 15.4, Парето-множество совпадает с множеством Нэш-эффективных решений, поэтому согласованное поведение игроков здесь не даёт выигрыша ни одному из них по сравнению и Нэш- оптимальным выбором стратегий. Игра остаётся несправедливой.

Т Е О Р И Я	И Г Р
		f2
	8
	6			М1	π − opt
				М1
	4		N − opt		М4
					М4
	2			М3
	2
	0	М2
		М2
	-2
	-2	0	2	4	6	8
		Рис. 15. 4 – Выявление Парето-множества

В.М.Дуплякин

15.1.2. Решение в смешанных стратегиях

Найдём оптимальные по Нэшу решения в смешанных стратегиях.

x(0)

b22 −b21

3−2

= 1 ≈0,143;

b11

−b12 −b21 +b22

5+1−2+3 7

x2(0)

=1− x1(0)

=1−

6 ≈0,857 ;

(0)

é1

;

6ù

»[0,143; 0,857].

=ëx1 ;

û =

ë7

7û

y(0)

a22 − a12

5+1

= 6 ≈ 0,857;

a11 − a12

− a21 + a22

3+1− 2 +5 7

y2(0)

=1− y1(0) =1−

= 1 ≈0,143 ;

éy(0) ù

é6

é0,857ù

y(0)

= ê

1(0) ú

= ê

7ú

» ê

ú.

ê1

0,143

2 û

7û

Вследствие симметрии предпочтений игроков оптимальные смеси стратегий являются как бы зеркально симметричными.

156

Т Е О Р И Я И Г Р

В.М.Дуплякин

Оценим средние возможные результаты игры при случайном перемешивании стратегий с найденными оптимальными по Нэшу пропорциями.

Средний выигрыш первого игрока при равновесии по Нэшу составляет

×[A]× é y(0)

-1

é6

17 » 2,429 .

= éx(0)

× ê

ú =

ê 1

ë2

Средний выигрыш второго игрока при равновесии по Нэшу равен

é1

6ù

-1

é6

(0) ù

(0 _ ù

» 2,429 .

f2 = ëx

×[B]× ë y

= ê

× ê

ê 1

ë7

7û

ë2

7û

Анализируя полученные результаты, отметим главное:

При найденной оптимальной смеси стратегий игра становится справедливой.

С помощью статистического имитационного моделирования убедимся в сходимости средних результатам к полученным теоретическим значениям средних выигрышей. Результаты статистического имитационного моделирования выполненного на ЭВМ и представленные на рис. 15.5 – 15.8,

подтверждают сходимость средних результатов игроков именно к полученным теоретическим значениям, но скорость сходимости весьма невелика. Как видно из приведенных данных, безусловная устойчивая сходимость наблюдается после числа повторений игры n > 400 , хотя при рассматриваемой

статистической имитации хорошее совпадение с теоретическими расчётами наблюдается при n = 50, что можно считать случайным совпадением.

157

Т Е О Р И Я И Г Р

В.М.Дуплякин

f	*
	1
	3
	2
	Теор. сред. выигрыш Р1, f 1ср=2,429

0						n
0	200	400	600	800	1000	n

Рис. 15.5 – Сходимость среднего выигрыша игрока Р1

f2*
3
2		Теор. сред. выигрыш Р2, f 2ср=2,429
		Теор. сред. выигрыш Р2, f 2ср=2,429
1
0						n
0	200	400	600	800	1000	n
Рис. 15.6 – Сходимость среднего выигрыша игрока Р2

158

Т Е О Р И Я	И Г Р						В.М.Дуплякин
	x *
	1
	0,20
	0,18
	0,16
	0,14		х1=0,143
	0,12
	0,10
	0,10
	0,08
	0,06
	0,04
	0,02
	0,00						n
	0	200	400	600	800	1000	n
Рис. 15.7 – Сходимость частоты появления первой стратегии игрока Р1

y *
1
1,0
0,9
0,8		у1=0,857
0,7		у1=0,857
0,6
0,5
0,4
0,3
0,2
0,1
0,0						n
0	200	400	600	800	1000	n
Рис. 15.8 – Сходимость частоты появления первой стратегии игрока Р2

Очевидно, что скорость сходимости данной игры к справедливой игре при выборе оптимальной смеси стратегий невелика настолько, что реальные игроки вряд ли дождутся впечатления о том, что выбираемые ими смеси стратегий

оптимальны и скорее всего будут использовать равновероятный случайный выбор стратегий.

159

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 2016 17 18 19 20 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.03.20152.42 Mб12Дополнение к лециям Савченко .doc
#
04.08.2019137.73 Кб3дополнение мешков.doc
#
07.06.2015209.41 Кб17Дополнения по местному самоуправлению.doc
#
16.03.2015208.95 Кб13Дубровский Д.И. ЧЕЛОВЕК И КОМПЬЮТЕР.rtf
#
16.03.20151.3 Mб43Дуплякин В.М. Статистический анализ.pdf
#
16.03.20151.53 Mб85Дуплякин В.М. Теория игр.pdf
#
16.03.201540.73 Mб27Еленев Компьютерные сети.doc
#
07.06.201579.67 Кб11жил.п.docx
#
07.06.201598.3 Кб12Жилищ. право 6 з.о 2012-2013.doc
#
07.06.2015112.63 Кб160жилищное (1).docx
#
07.06.2015187.9 Кб27Жилищное право.doc