Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дуплякин В.М. Теория игр

.pdf
Скачиваний:
85
Добавлен:
16.03.2015
Размер:
1.53 Mб
Скачать

Т Е О Р И Я И Г Р

 

 

 

В.М.Дуплякин

Информационное поле графически отображает возможность

игрока получать информацию о предшествующем выборе хода

другим игроком при последовательном выполнении ходов.

 

 

Ω2

Ω3

Ω1

 

"1"

(139; 50)

 

 

 

"1"

2

(138; 43)

 

(52; 50)

1

"2"

 

 

"1"

(118; 84)

 

"1"

"2"

 

2

(114; 31)

 

 

 

2

 

"2"

 

 

"1"

(133; 84)

 

 

 

"1"

"2"

"1"

2

(132; 77)

(22; 68)

1

"2"

 

"1"

(112; 118)

 

 

"2"

 

 

2

 

 

 

 

(108; 65)

1

 

 

"2"

 

 

"1"

(117; 79)

 

 

 

 

 

"1"

2

(116; 72)

 

(58; 21)

"2"

 

1

"2"

"1"

(96; 113)

"1"

"2"

 

 

2

(92; 60)

 

 

 

 

2

 

"2"

 

 

"1"

(87; 95)

 

 

 

 

"2"

"1"

2

(86; 88)

 

"2"

 

(74; 55)

1

"1"

(66; 129)

 

 

"2"

 

 

2

 

 

 

 

(62; 76)

 

 

 

"2"

1-й ход

2-й ход

3-й ход

4-й ход

 

Рис. 13.5 – Граф смешанной игры

 

140

Т Е О Р И Я И Г Р

В.М.Дуплякин

Так, например, на рис. 13.5 представлен граф смешанной игры с информационными полями Ω1, Ω2 , Ω3 . В круглых скобках приведены значения текущих выигрышей, накопленных с начала игры.

Информационное поле Ω1 охватывает выполнение первого хода, его делает игрок Р1, и выполнение второго хода (Р2). Это значит, что игрок Р2, делая свой ход, знает, как походил противник. Если Р1 выбрал стратегию "1", то Р2 выберет стратегию "2". Если Р1 выберет "2", то для Р2 наилучшим ходом является выбор стратегии "1". Таким образом, первые два хода реализуют последовательную игру.

Информационное поле Ω2 охватывает выполнение третьего хода, его делает игрок Р1. Поскольку это поле не пересекается с информационными полями смежных ходов, и так же не пересекается с соседними информационное поле четвёртого хода Ω3 , то это означает, что 3-й и 4-й ходы реализуют одновременную одноходовую игру.

141

Т Е О Р И Я И Г Р

В.М.Дуплякин

14.ПАРЕТО-ЭФФЕКТИВНОСТЬ БИМАТРИЧНЫХ ИГР

ВСМЕШАННЫХ СТРАТЕГИЯХ

14.1.Понятие Парето-эффективности в смешанных стратегиях

Определение. Пара смешанных стратегий

x* = (x* ; x* ),

y* = ( y*; y* )

1

2

1

2

называется эффективной (оптимальной) по Парето в смешанных стратегиях, если не существует такой пары смешанных стратегий

x = (x1 ; x2 ), y = ( y1 ; y2 ),

для которой выполняются неравенства

f (x*; y* ) f (x ; y ) и f

2

(x*; y* ) f

2

(x ; y )

1

1

 

 

среди которых по крайней мере одно неравенство должно быть строгим.

Примечание. Стратегии x* = (x*; x* ),

y* = ( y* ; y* )

могут быть и

1

2

1

2

 

чистыми стратегиями, однако произвольно выбираемые для анализа стратегии

x = (x1 ; x2 ), y = ( y1 ; y2 ),

в

данном

контексте

предполагаются

смешанными стратегиями.

 

 

 

 

Пояснение. Равновесие по Нэшу означает, что ни один игрок, действуя в одиночку, не может увеличить свой выигрыш. В случае эффективной по Парето пары смешанных стратегий, все игроки, действуя совместно, не могут строго увеличить выигрыш хотя бы одного игрока, не уменьшая строго выигрыш другого игрока.

142

Т Е О Р И Я И Г Р

В.М.Дуплякин

14.2.Выявление множества Парето-эффективных решений

всмешанных стратегиях

Рассмотрим методику выявления Парето-множества решений в смешанных стратегиях на примере биматричной повторяющейся игры , платёжная матрица которой приведена на рис. 14.1.

 

[u(P1, P2)]

Стратегии Р2

 

 

 

 

 

Стратегия "1"

 

Стратегия "2"

 

 

 

 

 

 

 

 

 

 

Р1

 

Стратегия "1"

( 20 ; 70)

 

( 60 ; -40 )

Стратегии

 

 

 

 

 

1

2

 

 

 

3

4

 

Стратегия "2"

( 100 ; 40)

 

(-20 ; 120 )

 

 

 

 

 

 

 

 

 

 

 

Рис. 14.1 – Платёжная матрица игры при поиске Парето-множества решений в

смешанных стратегиях

Предварительно выполним графический анализ доминирования и поиск решений по Нэшу в чистых стратегиях, как это показано на рис. 14.2.

 

[u (P1,P2)]

Стратегии Р2

 

 

 

 

 

Стратегия "1"

Стратегия "2"

Стратегии Р1

Стратегия "1"

( 20 ; 70)

( 60 ; -40 )

 

 

1 2

Стратегия "2"

 

3 4

( 100 ; 40)

(-20 ; 120 )

Рис. 14.2 – Выявление Нэш-оптимальных решений в чистых стратегиях

Собственно, решение в смешанных стратегиях уже подразумевает неоднократное повторение игры.

143

Т Е О Р И Я И Г Р

В.М.Дуплякин

Выполненный графический анализ показал отсутствие Нэш-оптимальных решений в чистых стратегиях (об этом свидетельствует то, что ни одна из возможных игровых ситуаций 1,2,3,4 одновременно не собирает в

соответствующей клетке платёжной матрицы двух геометрических признаков оптимальности, таких как ).

Найдём оптимум по Нэшу в смешанных стратегиях, который должен быть по теореме Дж. Неймана. Воспользуемся аналитическим решением

 

 

 

 

 

x(0)

=

 

b22 b12

 

 

 

;

 

x(0)

= 1- x(0) ;

 

 

 

 

 

 

 

1

 

b11

- b12 - b21 + b22

 

 

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y(0)

=

 

a22 - a12

 

 

 

 

 

;

y(0)

= 1- y(0) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

a11

- a12 - a21

+ a22

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

После подстановки компонент платёжной матрицы рассматриваемой

игры получим следующие численные результаты

 

 

 

 

 

 

 

 

 

x(0) =[0,421; 0,579]

;

 

y(0)

=[0,500 ; 0,500]T .

 

Средние

значения

выигрышей,

 

соответствующие

найденным

оптимальным смесям вычисляются как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= éx(0)

ù ×[A]× é y(0)

ù = 40,00

;

 

 

 

 

= éx(0)

ù

×[B]× é y

(0) ù = 52,63.

 

f

1

f

2

 

 

ë

û

ë

 

û

 

 

 

 

ë

û

ë

û

 

Далее займёмся построением области возможных результатов в

плоскости выигрышей.

 

 

 

 

 

 

 

 

 

 

 

 

 

Воспользуемся

аналитическим

 

представлением

функций средних

выигрышей

f1(x, y) = [x]×[A]×[y] = a11x1 y1 + a12 x1 y2 + a21x2 y1 + a22 x2 y2 ,

f2 (x, y) = [x]×[B]×[y] = b11x1 y1 + b12 x1 y2 + b21x2 y1 + b22 x2 y2 .

Сгруппируем слагаемые по y1 и y2

f1 = y1(a11x1 + a21x2 ) + y2 (a12 x1 + a22 x2 ) ,

f2 = y1(b11x1 + b21x2 ) + y2 (b12 x1 + b22 x2 ) .

Именно построение границы области возможных результатов позволит найти множество Парето-оптимальных решений в смешанных стратегиях.

144

Т Е О Р И Я И Г Р

В.М.Дуплякин

Продемонстрированные аналитические преобразования платёжных функций повторим, используя численные данные рассматриваемого примера

 

 

(x, y) = [x ; x

]´[A]´

é y1

ù

= [x ; x

]´

é 20

60 ù

´ é y1 ù

,

f

 

1

1

2

 

ê ú

1

2

 

ê

 

ú

 

ê ú

 

 

 

 

 

 

 

ë y2

û

 

 

 

ë100

-20û

 

ë y2 û

 

 

 

 

(x, y) = [x ; x

]´[B]´

é y1

ù

= [x ; x

]´

é70

-40ù ´

é y1 ù .

 

f

2

 

 

1

2

 

ê ú

1

2

 

ê

 

ú

 

ê ú

 

 

 

 

 

 

 

ë y2

û

 

 

 

ë40

 

120û

 

ë y2 û

 

Запишем результат перемножения матриц с одновременной

группировкой по y1

и y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= y1(20× x1 + 100× x2 ) + y2 (60× x1 - 20× x2 ) ,

 

 

 

 

 

 

f1

 

 

 

 

 

 

 

 

= y1 (70× x1 + 40× x2 ) + y2 (-40× x1 +120× x2 ) .

 

 

 

 

 

 

f2

 

Представим полученные соотношения в виде векторной функции

 

 

 

é

 

 

 

éx

é20ù + x

é100ùù + y

éx

é

60 ù + x

é-20ùù .

 

 

=

f1 ù

= y

 

f

 

 

 

 

 

 

 

 

 

 

ê ú

1

ê 1

ê ú

2 ê

úú

2 ê 1

ê

ú

2 ê

úú

 

 

 

ë f2 û

 

ë

ë70û

ë

40 ûû

ë

ë

-40û

ë120

ûû

Матрицы-столбцы в правой части полученного выражения для платёжной векторной функции представляют собой координаты точек, соответствующих игровым ситуациям рассматриваемого примера, поэтому ниже в под каждым из

этих столбцов подпишем обозначение соответствующей игровой ситуации в виде М1, М2, М3, М4.

 

 

é

 

 

 

 

ù

 

æ

é20ù

 

é100ùö

 

æ

é

60 ù

 

é-20ùö

 

 

 

f

1

 

 

 

 

 

 

 

 

 

 

 

 

 

f = ê

 

ú

= y1

ç x1

ê ú

+ x2

ê

 

ú÷

+ y2

ç x1

ê

ú

+ x2

ê

ú÷

(14.1)

 

 

 

 

40

 

 

ë f2

û

 

è

ë70û

 

ë

ûø

 

è

ë

-40û

 

ë120

ûø

 

 

 

 

 

 

 

 

 

 

М1

 

 

М3

 

 

 

 

М2

 

М4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогичным образом выполним группировку аргументов векторной

функции средних выигрышей по x1

и x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

é

 

 

 

 

ù

 

æ

é20ù

 

é

60 ùö

 

æ

é100ù

 

é-20ùö

 

 

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f = ê

1

ú

= x1

ç y1

ê ú

+ y2 ê

ú÷

+ x2

ç y1

ê

ú

+ y2

ê

ú÷

(14.2)

 

 

 

 

 

 

 

ë f2

û

 

è

ë70û

 

ë

-40ûø

 

è

ë 40

û

 

ë120

ûø

 

 

 

 

 

 

 

 

 

 

 

 

М1

 

 

М2

 

 

М3

 

 

М4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

145

Т Е О Р И Я И Г Р

В.М.Дуплякин

Введём в рассмотрение плоскость выбора возможных решений, как в чистых, так и в смешанных стратегиях (см. рис. 14.3). Сначала отметим в этой плоскости точки, которые соответствуют выбору чистых стратегий, обозначив их следующим образом:

N1 = N(ψ1 ) = N(x1 = 1 ; y1 = 1 ), N2 = N(ψ2 ) = N(x1 = 1 ; y1 = 0), N3 = N(ψ3 ) = N(x1 = 0; y1 = 1 ), N4 = N(ψ4 ) = N(x1 = 0; y1 = 0).

y 1

N3

N1

1

 

 

0,9

 

 

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0 x 1

N4

0

0,1

0,2 0,3 0,4

0,5 0,6 0,7 0,8 0,9

1

N2

Рис. 14.3 – Плоскость выбора возможных стратегий

Внутри единичного квадрата N1–N2–N3–N4 находятся точки соответствующие выбору всех возможных смешанных стратегий. Границы квадрата, т.е. его грани N1–N2, N2–N3, N3–N4 за исключением вершин представляют решения, при которых один из игроков выбирает чистую стратегию, а другой игрок использует произвольную смесь стратегий. Например, грань N2–N1 является геометрическим местом точек, представляющих решения, при которых первый игрок выбирает первую стратегию x1 = 1, а второй игрок выбирает любую смешанную стратегию 0 < y1 < 1. Соответствующие вторые стратегии: x2 = 0 и 1 < y2 < 0.

146

Т Е О Р И Я И Г Р

В.М.Дуплякин

Очевидно, что точки N1, N2, N3, N4 отображаются в плоскости возможных результатов в соответствующие им точки М1, М2, М4, М3, как это показано на рис. 14.4

N1

Þ M1,

N2

Þ M2,

N3

Þ M3,

N4

Þ M4.

Точки М1(20;70), М2(60;–40), М3(100;40), М4(–20;120) принадлежат множеству возможных решений, отражая выбор решений в чистых стратегиях. Кроме того на рис. 14.4 отметим так же точку Нэш-равновесия Nopt (40 ; 52,63) .

 

 

 

 

 

 

 

 

 

 

 

f 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

140

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M4 ( -20 ; 120)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

N3

 

 

 

 

 

 

 

 

N1

80

 

 

 

M1 ( 20 ; 70)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y 1

1

 

 

 

 

 

 

 

 

 

60

 

 

 

Nopt

 

 

 

 

 

0,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

0,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M3 ( 100 ; 40)

 

 

 

0,6

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

0,3

 

 

 

 

 

 

 

 

 

-20

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M2 ( 60 ; -40)

 

 

 

 

0,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x 1

-40

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0,1 0,2

0,3

0,4

0,5 0,6

0,7

0,8

0,9

1

 

 

 

 

 

 

 

 

 

 

 

N2

-60

 

 

 

 

 

 

 

 

 

 

N4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f 1

 

 

 

 

 

 

 

 

 

-40

-20

0

20

40

60

80

100

120

а) Плоскость выбора решений

 

 

 

 

б) Плоскость результатов

 

 

 

 

 

Рис. 14.4 – Отображение решений в чистых стратегиях

 

 

 

Далее встаёт вопрос о том, каким образом в плоскости возможных результатов соединить между собой точки М1, М2, М3, М4. Попробуем соединить отмеченные точки отрезками прямых линий М1-М2, М1-М3, М3-М4, как показано на рис.5. Поскольку функции результатов имеют линейный характер (см. уравнения 14.1 и 14.2), то очевидно, что отмеченные отрезки принадлежат области возможных решений и, наверное, совпадают с границей области возможных решений. Однако последнее утверждение насчёт границы множества не выдерживает никакой критики, если обратить внимание на то,

147

Т Е О Р И Я И Г Р

В.М.Дуплякин

что точка Нэш-оптимальности в смешанных стратегиях, которая, безусловно, принадлежит области возможных средних результатов, находится за пределами многоугольника М1-М2-М4-М3.

Пользуясь теорией выпуклых множеств, можно показать, что в рассматриваемой задаче многоугольник М1-М2-М4-М3 представляет границу области возможных состояний, только в том случае, если он выпуклый, но в нашем примере этот многоугольник не является выпуклым.

f 2

 

 

 

 

 

 

 

 

 

140

 

 

 

 

 

 

 

 

 

 

 

M4 ( -20 ; 120)

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

100

 

 

 

M1 ( 20 ; 70)

 

 

 

 

 

 

 

 

 

 

 

 

80

 

 

 

 

 

 

 

 

 

60

 

 

 

 

 

 

M3 ( 100 ; 40)

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Nopt ( 40 ; 52,63)

 

 

 

20

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

-20

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M2 ( 60 ; -40)

 

 

-40

 

 

 

 

 

 

 

 

 

-60

 

 

 

 

 

 

 

 

f 1

-40

-20

0

20

40

60

80

100

120

Рис. 14.5 – Отображение выбора решений в чистых стратегиях

Что бы уточнить границы области возможных решений, включающей все без исключения решения, в том числе и решения в смешанных стратегиях, воспользуемся так называемым приёмом заметания, который представляет собой графический анализ векторных функций решения (14.1) и (14.2). При

таком методе анализа рассматривается изменение результатов при фиксированной чистой стратегии одного игрока и условии, что другой игрок выбирает произвольную смешанную стратегию.

148

Т Е О Р И Я И Г Р В.М.Дуплякин

Рассмотрим применение отмеченного приёма, начиная с грани единичного квадрата N3–N1. Заметание представим как движение точки на грани N3–N1, начиная от точки N3 и двигаясь дольше к точке N1, при этом

координаты функции выбора решений будут изменяться следующим образом y1 = 1; y2 = 0; 0 x1 1; 1 x2 0.

Поскольку в рассматриваемом заметании стратегии второго игрока чистые, т.е. y1 = 1, y2 = 0 , то поэтому обратимся к векторной функции решения

(14.1), которая с учётом стратегий Р2 преобразуется к виду

 

 

 

 

é

 

 

 

ù

 

é20ù

 

é100ù

 

 

 

 

 

=

f1

= x

+ x

 

 

 

 

f

 

 

 

 

 

 

ê

 

 

 

ú

1

ê

ú

 

2 ê

ú

 

(14.3)

 

 

 

 

ë f2

û

 

ë70û

 

ë

40 û

 

 

 

 

 

 

 

 

 

 

 

М1

 

 

М3

 

 

 

 

 

 

 

 

 

 

 

 

 

Очевидно, что, если

0 x1 1

и одновременно 1 x2 0 , то

векторная

функция решения линейно изменяет свои значения в соответствии с перемещением от точки М3 к точке М1 в плоскости возможных результатов

М1 М3

Таким образом, движение по отрезку N3–N1 в плоскости выбора решений "заметает" отрезок М3–М1 в плоскости возможных результатов.

Повторяя аналогичные рассуждения, рассмотрим "заметание" при движении по всем граням единичного квадрата, которое приводит к

следующему

N1- N2 Þ M1 - M2;

N2 - N4 Þ M2 - M4;

N3 - N4 Þ M3- M4;

N1 - N3 Þ M1 - M3.

Перенося результаты "заметания" на рис. 4, можно соединить точки М1, М2, М3, М4 отрезками прямых линий, которые по существу являются

отображением соответствующих граней единичного квадрата в плоскости выбора решений.

Далее рассмотрим "заметание" отрезка внутри единичного квадрата, который параллелен одной из осей координат, например, параллелен оси y . Из

предыдущего анализа ясно, что результатом "заметания" будет отрезок прямой линии, как это показано на рис. 14.6.

149