Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирский Государственный Университет Телекоммуникаций и Информатики

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

645_Galkina_M.JU._Metody_optimal'nykh_reshenij_

.pdf

Скачиваний:

Добавлен:

12.11.2022

Размер:

1.76 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 96 7 8 9 > Следующая >>>

min в строке

max в столбце

= 8

= 10

, следовательно, игра не имеет седловой точки, решение будет в сме-

шанных стратегиях.

)

Найдем аналитически оптимальную стратегию игрока А

соответствующую цену игры .

̅= (

Так как

– оптимальная, то она должна гарантировать средний выигрыш

игроку А,

равный цене игры, при любом поведении игрока В:

для стратегии В1: 10p1 8p2

;

для стратегии В2: 7p1 11p2

С учетом того, что сумма вероятностей смешанной стратегии равна 1, получаем систему уравнений:

10p		8p	,
	1	2
7p1 11p2 ,
p	p 1.
1		2
Вычтем из первого уравнения второе: 3p1 3p2 0 или												p1 p2. Значит:
				p		1	,
				p			,
p1 p2,				1	2
p1 p2,					2
					1
p1	p2 1,			p2				,
p1	p2 1,			p2				,
7p 11p			.		2
7p 11p			.		1					1
	1	2			1					1
		̅=	,	7					11		9.
				7					11		9.
					2					2
					2					2

Итак:				, = 9.
Итак:				, = 9.

Аналогично получаем систему для нахождения смешанной стратегии игрока В.

10q1 7q2 ,

8q1 11q2 ,

q1 q2 1.

Вычтем из первого уравнения второе: 2q1 4q2 0. Откуда q1 2q2 подставим

впервое уравнение (Вместо подставим найденное значение для игрока А

= 9):

20	+7 = 9,
27	= 9,
=	1	,
	3

2 = 3.

Итак:

̅=

= 9

Ответ:

2. Проведем моделирование результатов решения с помощью таблицы равномерно распределенных случайных чисел. Для 30 партий хватит 60 чисел, на основе которых будут выбираться стратегии игроками. Сгенерируем 60 равномерно распределенных чисел в MS Excel функцией =СЛЧИС(). Будем выбирать стратегии игроков, используя геометрическое определение вероятности. Так как все случайные числа из отрезка [0; 1], то для того, чтобы стратегия А1 появлялась примерно в половине случаев, будем ее выбирать, если случайное число меньше 0,5; в остальных случаях выбирается стратегия А2. Аналогично для игрока В. Стратегию В1 будем выбирать, если соответствующее случайное число меньше 2/3 0,67, в противном случае выбираем стратегию В2.

Заполним расчетную табл. 1. Средний выигрыш игрока А считаем как отношение накопленного выигрыша к количеству сыгранных партий.

Табл. 1. Моделирование результатов игры из примера 13

Номер	Случайное	Стратегия	Случайное	Стратегия	Выигрыш	Накоплен-	Средний
Номер	Случайное	Стратегия	Случайное	Стратегия	Выигрыш	Накоплен-	выигрыш
партии	число иг-	игрока А	число иг-	игрока В	А	ный выиг-	А (цена
партии	рока А	А1: < 0,5	рока В	В1: < 0,667	А	рыш А	А (цена
							игры)
1.	0,029	А1	0,125	В1	10	10	10,000
2.	0,611	А2	0,490	В1	8	18	9,000
3.	0,766	А2	0,958	В2	11	29	9,667
4.	0,738	А2	0,564	В1	8	37	9,250
5.	0,944	А2	0,257	В1	8	45	9,000
6.	0,416	А1	0,886	В2	7	52	8,667
7.	0,513	А1	0,226	В1	10	62	8,857
8.	0,717	А2	0,467	В1	8	70	8,750
9.	0,994	А2	0,822	В2	11	81	9,000
10.	0,412	А1	0,244	В1	10	91	9,100
11.	0,259	А1	0,176	В1	10	101	9,182
12.	0,610	А2	0,658	В1	8	109	9,083
13.	0,207	А1	0,451	В1	10	119	9,154
14.	0,071	А1	0,994	В2	7	126	9,000
15.	0,391	А1	0,724	В2	7	133	8,867
16.	0,835	А2	0,469	В1	11	144	9,000
17.	0,062	А1	0,392	В1	10	154	9,059
18.	0,181	А1	0,457	В1	10	164	9,111
19.	0,891	А2	0,336	В1	8	172	9,053

	Случайное	Стратегия	Случайное	Стратегия		Накоплен-	Средний
Номер	Случайное	Стратегия	Случайное	Стратегия	Выигрыш	Накоплен-	выигрыш
партии	число иг-	игрока А	число иг-	игрока В	А	ный выиг-	А (цена
	рока А	А1: < 0,5	рока В	В1: < 0,667		рыш А	игры)
							игры)

20.	0,375	А1	0,094	В1	10	182	9,100
21.	0,009	А1	0,522	В1	10	192	9,143
22.	0,255	А1	0,806	В2	7	199	9,045
23.	0,273	А1	0,562	В1	10	209	9,087
24.	0,111	А1	0,805	В2	7	216	9,000
25.	0,888	А2	0,037	В1	8	224	8,960
26.	0,392	А1	0,341	В1	10	234	9,000
27.	0,843	А2	0,808	В2	11	245	9,074
28.	0,086	А1	0,585	В1	10	255	9,107
29.	0,426	А1	0,370	В1	10	265	9,138
30.	0,562	А2	0,688	В2	11	276	9,200

Таким образом, в результате моделирования в 30 партиях цена игры (средний выигрыш) равен 9,2. Этот результат согласуется с теоретической ценой игры 9.

Из 30 партий игрок А 18 раз применял стратегию А1, 12 раз – стратегию А2. Игрок В 21 раз применял стратегию В1, 9 раз – стратегию В2. Частоты использования игроками своих чистых стратегий соответственно равны: p=(18/30;12/30)=(0,6;0,4), q=(21/30;9/30)=(0,7;0,3). Сравнивая с теоретическими оптимальными стратегиями ̅=(0,5; 0,5) и =(0,67; 0,33), можно сделать вывод, что результаты моделирования достаточно близко соответствуют теоретическим вероятностям даже для небольшого количества партий.

Пример 14	=	2	3	11 .
Решение
Решить графически игру, заданную платежной матрицей		7	5	2

Матрица игры имеет размер 2 3, поэтому решение игры будем искать для игрока А (рис. 23). Отложим отрезок единичной длины А1А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию первого игрока – (p1, p2). В частности, точке А1 соответствует стратегия А1, точке А2 – стратегия А2.

В точках А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока В.

Рис. 23. Геометрическое решение игры примера 14

В соответствии с принципом минимакса ломаная B MNB – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку

пересечения прямых

Уравнение

прямой, проходящей через 2 точки (x

)

и (x

,y ) имеет вид

ее

B B

. Прямая

B B

проходит через точки (0,3) и (1,5), следовательно,

(1,2),

или -2x+y=3. Прямая

B B

проходит через точки (0,11) и

уравнение

следовательно, ее уравнение

или

9x+y=11. Для нахождения

точки пересечения прямых

решим систему:

B B

−2

= 3,

= 11.

второе, получаем -11x=-8 x=8/11,

Вычтем из

первого

уравнения

y=3+2x=49/11. Точка

N(8/11,49/11),

следовательно, p2=8/11, p1=1-8/11=3/11,

=49/11.

Таким образом,

, при цене игры

Из рисунка видно,=что(

стратегия, )

В1 не входит=

в оптимальную смешанную

стратегию, поэтому q3=0, и мы можем найти оптимальную смешанную страте-

гию,	удалив из платежной матрицы первый столбец. Получаем матрицу
3	11
5	2	, при этом столбцы ее соответствуют активным стратегиям В2, В3.
	Так как – оптимальная, то она должна гарантировать средний выигрыш
игроку В, равный цене игры, при любом поведении игрока А:
для стратегии А1:				+11	= . ;
для стратегии А2: 3
	С учетом того5,			что сумма вероятностей смешанной стратегии равна 1, цена
				+2	=
игры		=	, получаем систему уравнений:

		49
3	+11	=	11		,
5	+2	=	49	,
	+	= 1.					−2 +9	= 0
−2	+9	= 0,				уравнения второе:	−2 +9	= 0
Вычтем из первого11						уравнения второе:		.

+= 1.

Решая систему, находим

9 = 11,

2 = 11.

Ответ:		,							.	= 0,	,
Оптимальная смешанная стратегия для игрока В													.
Пример 15= (	,		)	=	0,	,	,	=				=		4	6
Пример 15= (	,		)	=	0,	,	,	=						4	6
Решить графически игру,					заданную платежной матрицей									2	7
Решить графически игру,					заданную платежной матрицей									6	5 .
Решение														1	8

Матрица игры имеет размер 4 2, поэтому решение игры будем искать для игрока В. Аналогично примеру 14 по горизонтальной оси отложим отрезок единичной длины В1В2, каждой точке которого поставим в соответствие некоторую смешанную стратегию второго игрока – (q1, q2) (рис. 24). В частности, точке В1 соответствует стратегия В1, точке В2 – стратегия В2.

В точках В1 и В2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыши игрока А при соответствующих стратегиях и строить прямые, соответствующие стратегиям игрока А.

Рис. 24. Геометрическое решение игры примера 15

В соответствии с принципом минимакса ломаная A NA – верхняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш минимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока В достаточно составить уравнения прямых и найти точку пересечения

прямых

1 1

2 2

A A

ее

Уравнение прямой, проходящей через 2 точки (x ,y )

и (x ,y ), имеет вид

. Прямая

A A

проходит через точки (0,6) и (1,5), следовательно,

(1,8),

A A

уравнение

или

x+y=6. Прямая

проходит через точки (0,1) и

следовательно, ее уравнение

или

-7x+y=1. Для нахождения точ-

= 6,

A A

решим систему:

ки пересечения прямых

−7

= 1.

Вычтем из первого уравнения второе, получаем 8x=5 x=5/8, y=6-x=43/8.

Точка N(5/8,43/8), следовательно, q2=5/8, q1=1-5/8=3/8, =43/8.

Таким образом,

при цене игры

Из рисунка видно,

что стратегии А

и А

не входят в оптимальную смешан-

= ( ,

)

ную стратегию, поэтому p2=0 и p3=0, и мы можем найти оптимальную смешанную стратегию, удалив из платежной матрицы вторую и третью строку. Полу-

чаем матрицу

, при этом строки ее соответствуют активным стратегиям

А1, А4.

Так как

–1

оптимальная, то она должна гарантировать средний выигрыш

игроку А,

равный

цене игры, при любом поведении игрока В:

для стратегии В1:

;

для стратегии В2:

С учетом того5,

что сумма вероятностей смешанной стратегии равна 1, цена

игры

получаем систему уравнений:

= 1.

− 7 = 0.

− 7

= 0,

Вычтем из

первого уравнения второе:

+= 1.

Решая систему, находим
=	7	,
=	8	,
=	1	.
=	8	.	̅=	,0,0,
	56		̅=	,0,0,
Оптимальная смешанная стратегия для игрока А					.

Ответ:			,				,		.
	̅=	,0,0,		= (	,	)		=
	̅=	,0,0,		= (	,	)		=

Таким образом, имеем следующий алгоритм графического решения простейших матричных игр 2 n ( или m 2):

1.Строим n (m) прямых, соответствующих стратегиям второго (первого)

игрока.

2.Строим нижнюю (верхнюю) границу выигрыша.

3.Выбираем на границе выигрыша точку с максимальной (минимальной) ординатой.

4.Определяем по чертежу пару активных стратегий из числа построенных для второго (первого) игрока.

5.Находим координаты точки максимума (минимума) и решение игры.

2.2.5.Сведение матричной игры к задаче линейного программирования

Если у каждого из игроков больше двух возможных стратегий, то можно решение игры свести к решению задачи линейного программирования. Найдем решение игры с платежной матрицей m n :

			…		.
…		…	…	…
…		…	…	…
	Пусть		матрица игры не содержит седловой точки. Тогда решение игры бу-
	Пусть		…
дем искать в смешанных стратегиях p= (p1, p2, …,							pm) и q = (q1, q2, …, qm),
где p1 + p2 +… + pm = 1 и q1 + q2 +… + qn = 1
	Стратегия			является оптимальной, то есть при любой стратегии игрока B
средний		выигрыш игрока A будет больше или равен цены игры , таким обра-
средний				̅
зом, получаем систему ограничений
	+			+ +	≥	,
	+			+ +	≥	,
	+			…	≥ .
	+			+ +	≥ .

Будем считать, что цена игры больше нуля. Действительно, если 0, то это означает, что некоторые элементы матрицы игры не положительны. Тогда найдём число M > 0, которое прибавим ко всем элементам матрицы игры и получим новую матрицу с положительными элементами. Это сложение сделает цену новой игры, равную +M, положительной, но не изменит решения игры.

Разделим обе части всех неравенств на положительное число и обозначим

= , = ,…, = .

тогда система ограничений примет вид

+	+ +	≥ 1,
+	+ +	≥ 1,
+	…	≥ 1,
+	+ +	≥ 1,
≥ 0,	≥ 0,…,	≥ 0.

Далее, так как p1 + p2 +… + pm = 1, то

Игрок A стремится

максимизировать свой средний выигрыш , то есть ми-

+ +

нимизировать отношение

Таким образом, получаем задачу линейного программирования:

+ +

≥ 1,

+ +

≥ 1,

…

≥ 1,

+ +

≥ 0,

≥ 0,…,

≥ 0,

+ +

→ min.

Заметим, что эта задача всегда имеет оптимальное решение

Его можно найти симплекс-методом или с использованием средств(

Excel., ,…Тогда, )

цена игры

. Оптимальная смешанная стратегия первого игрока

∙

̅= ( ,

,…,

)

где

Аналогичные рассуждения дают оптимальную стратегию

игрока B. При

любой стратегии игрока А проигрыш игрока В не должен превышать

цену иг-

ры. Получаем систему ограничений:

+ +

≤

+ +

≤

…

≤ .

Тогда для

,…,

Обозначим

нахождения оптимальной смешанной стратегии игрока B необходи-

мо решить следующую задачу линейного программирования:

+ +

≤ 1,

+ +

≤ 1,

…

≤ 1,

+ +

≥ 0,

≥ 0,…,

≥ 0,

=Это+

+ +

→ max.

двойственная задача к ранее составленной. Задача всегда имеет опти-

мальное решение

, которое можно найти симплекс-методом или

по теореме равновесия( , ,

зная

решение)

ранее составленной задачи. Тогда цена

,…,

новой игры

, где

. Оптимальная.

смешанная стратегия второго игрока

= ( , ,…, )

∙

Пример 16

−3

Найти решение игры, заданной платежной матрицей:

−1

6 .

−2

Решение:

Найдем верхнюю и нижнюю цены игры.

B	B1	B2	B3	min в строке
A
A1	-1	1	6	-1

A2	5	2	-3	-3
A3	-2	4	5	-2

max в столбце	5	4	6	= -1
max в столбце	5	4	6	= 4

, следовательно, игра не имеет седловой точки, решение будет в смешанных стратегиях.

Чтобы свести матричную игру для игрока А к задаче линейного программирования, преобразуем платежную матрицу так, чтобы все ее элементы были больше нуля – прибавим ко всем элементам матрицы число 4. Получаем преобразованную платежную матрицу:

10 .

Средний6 1

выигрыш А должен быть не меньше цены игры при любом по-

ведении2 8

игрока9

В. Так, если игрок В использует свою первую стратегию, то

средний выигрыш игрока А составит:

Аналогично, записав неравенства для

стратегий В и В ,

получаем систему ли-

2+2 3

3 +9 +2 ≥

нейных ограничений:

≥

Из+

≥1

. 2

+ p

= 1, разделив обе части уравнения на >0 (цена иг-

условия

+ p

ры больше нуля, т.к. все элементы преобразованной матрицы больше нуля), по-

лучаем целевую функцию

Цель игрока А – получить мак-

симальный средний выигрыш=, т.е+. +max,=а значит.

→

. Если обозначить

(i=1, 2, 3), то целевая функция

переменным x, разделив каждое нера-

Перейдем в системе ограничений к =

+ +

i →

венство на >0:

≥ 1,

≥ 1.

Таким образом, для нахождения оптимальной стратегии игрока А необходимо решить задачу линейного программирования:

Решим задачу средствами табличного редактора MS Excel с использовани-

ем настройки Поиск решения.

1. Для решения нашей задачи создадим в Excel книгу с именем «Решение игры». Подготовим данные на листе (рис. 25).

Сначала определим ячейки, в которые будет помещен результат решения. Пусть это будут ячейки В2, С2, D2, сделаем у них заголовки. В этих ячейках нет данных, их должен будет рассчитать Excel, они выделены цветом. Далее заполним коэффициенты при неизвестных и правые части системы ограничений (строки 5–7). Заведем строку 10 для целевой функции. Цветом выделена ячейка, в которой будет находиться значение целевой функции для найденного оптимального решения.

Рис. 25. Подготовка данных на листе Excel для решения ЗЛП для игрока А

Для ячеек B2:D2 и D10 установим числовой формат с 4 знаками после запятой. Для этого выделим эти ячейки, в контекстном меню по правой кнопке мыши выберем команду Формат ячеек… и в появившемся окне Формат ячеек на вкладке Число установим нужный формат (рис. 26).

<<< < Предыдущая 1 2 3 4 56 / 96 7 8 9 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.11.20223.85 Mб16636_Nosov_V.I._Seti_radiodostupa_CH.1_.pdf
#
12.11.20225.17 Mб13637_Nosov_V.I._Seti_radiodostupa_CH.2_.pdf
#
12.11.20223.71 Mб10638_Nosov_V.I._RRL_STSI_Osnovy_TSPS__i_postroenija_RRL_.pdf
#
12.11.20222.45 Mб2639_Nosov_V.I._RRL_STSI._Mnogourovnevyj_kodek_.pdf
#
12.11.2022525.57 Кб2644_Galkina_M.JU._Vychislitel'naja_matematika_.pdf
#
12.11.20221.76 Mб4645_Galkina_M.JU._Metody_optimal'nykh_reshenij_.pdf
#
12.11.20222.2 Mб15647_Pinegina_T.JU._Praktikum_po_kursu_fiziki_.pdf
#
12.11.2022736.72 Кб2651_Zelentsov_B.P._Matrichnye_modeli_funktsionirovanija_.pdf
#
12.11.20229.18 Mб5652_Maglitskij_B.N._Printsipy_postroenija_sputnikovogo_televidenija_.pdf
#
12.11.2022811.62 Кб3656_Lytkina_D.V._Algebraicheskie_struktury_.pdf
#
12.11.20225.99 Mб5657_Smolovik_G.N._Teorija_menedzhmenta_.pdf