Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Дуплякин В.М. Теория игр

.pdf
Скачиваний:
85
Добавлен:
16.03.2015
Размер:
1.53 Mб
Скачать

Т Е О Р И Я И Г Р

В.М.Дуплякин

5.1.2. Единичные индикаторные матрицы выбора стратегий

С целью формализации структурирования платёжных матриц, исходя из их естественного представления участниками игры, вводятся единичные

индикаторные матрицы [Xi ], i=1,...,m для игрока Р1 и единичные матрицы

éY j ù

, j=1,...,n для игрока Р2.

ë û

 

Заполнение единичных индикаторных матриц при выборе игроками

конкретных стратегий иллюстрируется для случая игры с размерностью (2×2)

на приведенной ниже схеме

i=1

®

[X1 ]=[1;0] - игрок Р1 выбрал 1-ю стратегию;

P1 ® [Xi ]

 

 

 

 

 

 

 

 

i=2

® [X2 ]=[0;1]- игрок Р1 выбрал 2-ю стратегию.

 

 

 

 

 

 

 

 

 

 

 

 

 

P2

 

 

 

 

 

 

 

 

 

¯

 

 

 

 

 

 

 

 

é

j ù

 

 

 

 

 

 

 

ëY

û

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

j=2

 

 

 

 

 

 

 

¯

 

¯

 

 

 

 

 

é 1

ù

é1ù

 

é

2 ù

é0ù

 

 

 

ëY

û

= ê ú

 

ëY

û

= ê ú

 

 

 

 

 

ë0û

 

 

 

ë1û

 

 

Игрок Р2 выбрал

 

Игрок Р2 выбрал

 

 

1-ю стратегию

 

2-ю стратегию

 

Пример. Если платёжная матрица имеет размерность (5×7) и игрок Р1 выберет 3-ю стратегию, а игрок Р2 выберет 6-ю стратегию, то соответствующие

индикаторные матрицы имеют вид

 

 

é0ù

 

 

 

 

 

 

 

 

 

 

ê0ú

 

 

 

 

 

ê

ú

 

 

 

 

 

ê0ú

[X

3

]= [0; 0; 1; 0; 0];

éY6

ù

= ê0ú.

 

 

ë

û

ê

ú

 

 

 

 

 

ê

ú

 

 

 

 

 

ê0ú

 

 

 

 

 

ê1ú

 

 

 

 

 

ê

ú

 

 

 

 

 

ë0û

40

Т Е О Р И Я И Г Р

В.М.Дуплякин

5.1.3. Платёжная функция

Рассмотрим процедуру определения выигрыша игрока Р1, выбравшего стратегию ai при условии, что игрок Р2 выбрал стратегию a j .

Решение найдём на пересечении i й строки и j го столбца платёжной матрицы [A], введя следующие обозначения

u1 (i, j) = ai j .

Очевидно, что при тех же условиях игры с нулевой суммой решении для игрока Р2 получается как

u2 (i, j) = u1 (i, j) = ai j .

С использованием индикаторных единичных матриц процедура поиска решения среди элементов платёжной матрицы может быть формализована следующим образом

u

(i, j) = éX ù

×[A]× éY j ù

= a

i j

.

1

ë i û

ë û

 

 

Очевидно, что результат этой процедуры известен заранее, но в данном

случае логические манипуляции с содержимым платёжной матрицы заменяются формальным перемножением матриц.

Пример. u1

éa

 

a

 

ù

é1ù

= [a 21; a 22

é1ù

= a 21 .

(2, 1) = [0,1]× ê

11

 

12

ú

× ê ú

]× ê ú

 

ëa 21

a 22 û

ë0û

 

ë0û

 

Допустим,

что игра с заданной платёжной матрицей [A] повторяется N

раз при неизменном выборе стратегии ai для игрока Р1 и a j для Р2.

Суммарный выигрыш для Р1 найдём как

u

1Σ

(i, j) = N ×éX ù

×[A]× éYj ù

= N ×a

i j

.

 

ë i û

ë û

 

 

Средний выигрыш для игрока Р1 составит

u

(i, j) =

1

N ×éX ù

×[A]× éYj ù

= éX ù

×[A]× éYj ù

= a

i j

.

 

1

 

N

ë i û

ë û

ë i û

ë û

 

 

 

 

 

 

 

 

 

 

 

Отметим, что при фиксированном выборе стратегий, средний выигрыш игроков не зависит от числа повторений игры, да и не может зависеть, поскольку каждый раз получается один и тот же выигрыш или проигрыш.

41

Т Е О Р И Я И Г Р

В.М.Дуплякин

Приведенные соображения позволяют ввести понятие платёжной функции в частном случае неизменного выбора стратегий

f (X,Y) =[X]×[A]×[Y] .

Здесь матричные аргументы X и Y выступают как обобщение единичных индикаторных функции выбора стратегий.

Понятно, что результатом вычисления платёжной функции при заданных аргументах является средний выигрыш игрока Р1.

Продолжая рассматривать матричную игру с нулевой суммой размерностью (2×2), перейдём к более общему случаю, когда стратегии

игроков смешиваются случайным образом с заданными вероятностями в течение N го числа партий

 

 

 

a1

: N1 раз выбрана 1-я стратегия,

0 N1 N ;

 

 

P1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2

: N2

раз выбрана 2-я стратегия,

N2 = N - N1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a1

:

M1

раз выбрана 1-я стратегия,

0 £ M1 £ N;

 

 

P2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2

:

M2

раз выбрана 2-я стратегия,

M2 = N - M1.

 

Суммарный выигрыш игрока Р1 за N партий вычислим следующим

образом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

éM

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u1Σ =[N1; N2

 

 

 

ù

 

 

 

 

 

 

 

 

 

 

 

 

]×[A]× ê

 

 

1

ú.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ëM2 û

 

 

 

 

 

 

Найдем средний выигрыш для Р1 при тех же условиях

 

 

 

 

 

 

 

 

 

u =

1

×[N

; N

 

]×[A]×

1

 

×

éM1

ù .

 

 

 

 

 

 

 

 

 

 

 

2

 

ê

 

 

 

 

 

 

 

 

 

 

 

 

1

N

 

1

 

 

 

 

 

N

 

 

ú

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ëM2

û

 

 

 

 

 

Введём обозначения:

x =

N1

,

 

 

x = N2

,

 

 

y

=

M1 ,

y

2

= M2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

1

N

 

 

2

N

 

 

 

1

 

N

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отметим,

что

поскольку N1 + N2 = N

 

 

и M1 + M2

= N , то между

введёнными величинами существует очевидная взаимосвязь

 

 

 

 

x1 + x2 = 1,

y1 + y2 = 1;

x2 = 1- x1,

y2 =1- y1.

42

Т Е О Р И Я И Г Р В.М.Дуплякин

С использованием введённых обозначений средний выигрыш Р1

определяется зависимостью

u =[x]×[A]×[y],

где [x]= [x ; x

2

],

[y]=

é y1

ù .

1

1

 

 

ê

ú

 

 

 

 

 

ë y2

û

Раскрывая матричные произведения, получим

u1 = a11x1y1 + a12x1y2 + a21x2 y1 + a22x2y1 .

Платёжная функция в случае использования смешанных стратегий перемешиваемых случайным образом даёт средний выигрыш и вычисляется следующим образом

f (x,y) = [x]×[A]×[y].

Использование платёжной функции, дающей средний выигрыш, в случае

смешивания стратегий предполагает реализацию достаточно представительной статистики, при которой как минимум частота появления соответствующих

стратегий должна сходиться к заданным вероятностям соответствующих стратегий.

5.2. Понятие оптимальности в смешанных стратегиях

Определение.

 

 

 

 

 

 

 

 

 

Смешанные стратегии x(0) =

éx(0)

; x(0)

ù,

é y(0) ù =

é y1(0)

ù

являются

 

 

ë 1

2

û

ë

û

ê (0)

ú

 

 

 

 

 

 

 

 

ë y2

û

 

 

оптимальными, если любое отклонение от них даёт снижение

 

выигрыша, хотя бы одному из игроков, что соответствует условию

 

f(x , y(0) ) £ f(x(0) , y(0) ) £ f(x(0) , y ) .

 

 

 

 

 

 

 

 

Примечание. Если цена игры

ν=f(x(0) , y(0) ),

то игра "справедливая" в

том смысле, что выигрыш одного игрока в среднем равен выигрышу другого игрока.

43

Т Е О Р И Я И Г Р

В.М.Дуплякин

5.3. Теорема Джона Фон Неймана

Теорема. Для любой матричной игры с нулевой суммой и с заданной платёжной матрицей [A] можно найти

оптимальное решение (x(0) ; y(0) ) в смешанных или в чистых стратегиях, причём цена игры определяется как

ν = max min

[x]×[A]×[y] или

x

y

 

ν = min max [x]×[A]×[y].

y

x

 

______________________________________

Примечание 1. Теорема Дж. Фон Неймана утверждает, что решение есть всегда, но другое дело, что, если нет решения в чистых стратегиях, то его можно найти в смешанных стратегиях.

Примечание 2. Оптимизм, вселяемый этой теоремой, несколько убавляется при её практическом применении, т.к. теорема не даёт инструмента нахождения оптимального решения (так называемая неконструктивная теорема). Однако, если есть понимание того, что в рассматриваемых задачах всегда можно найти оптимальное решение, то поиск этого решения из принципиальной проблемы переходит в техническую проблему, которую можно решить например численным путём, имитируя на ЭВМ перебор возможных игровых ситуаций.

6. ОСНОВНЫЕ ЗАКОНОМЕРНОСТИ МАТРИЧНЫХ ИГР

Рассмотрим без доказательства известные закономерности матричных игр, сформулированные в виде так называемых утверждений. По сути, эти утверждения представляют собой некие вспомогательные теоремы, но гораздо меньшего в принципиальном плане значения, чем те теоремы, которые именно теоремами называются в теории игр.

Утверждение 1. Линейное преобразование платёжных матриц не отражается на выборе оптимальных стратегий.

44

(x(0) ; y(0) )

Т Е О Р И Я И Г Р В.М.Дуплякин

Если - оптимальные стратегии игрока Р1, Р2 в матричной игре с платёжной матрицей [A] размерностью (m×n), где m

число строк и n число столбцов и сформирована матрица

[B] = α[A] + [G] где α > 0, gi j = g const ,

то тогда для матричной игры с платёжной матрицей [B]стратегии (x(0) ; y(0) )

так же оптимальны, а цена игры составляет

νB = α × ν A +g ,

где νA - цена игры с платёжной матрицей [A].

В справедливости данного утверждения легко убедиться, рассмотрев несколько конкретных примеров.

Примечание 1. Использование данного утверждения позволяет заменить матрицу [A] с отдельными отрицательными элементами на матрицу [B] только

с положительными элементами, что чисто технически может быть удобнее при поиске оптимальных решений численными методами (перебор возможных игровых ситуаций) с использованием ЭВМ.

Примечание 2. В игры с положительной платёжной матрицей мало кто играет, т.к. здесь при реализации оптимальных стратегий роли игроков строго определены: один выигрывает, другой проигрывает.

Примечание 3. Линейное преобразование платёжной матрицы может иметь практический смысл, если в игре участвует третий игрок Р3, который сам не играет, но заинтересован в линейном преобразовании платёжной матрицы, за счёт которого игру можно сделать справедливой или в какой-то мере приблизить игру к справедливой. Таким третьим игроком может выступать "Общество" в лице такого выразителя своих интересов как "Государство".

Утверждение 2. Чистые стратегии включаются в условие оптимальности смешанных стратегий матричных игр.

Если ν − цена игры с платёжной матрицей [A] размерностью

(m×n), для которой найдены оптимальные смешанные стратегии игроков Р1,

Р2 связанные с ценой игры соотношением

ν= f(x

(0)

;y

(0)

) =

é

(0) ù

é

(0) ù

 

 

 

ëx

û

×[A]× ë y

û

,

45

Т Е О Р И Я И Г Р В.М.Дуплякин

то тогда для любой стратегии игрока Р1

[x]= [x1

 

 

; ... ; xi ; ... ; xm ],

 

m

 

 

 

 

; x2

(åxi =1)

 

 

и для любой стратегии игрока Р2

 

 

 

 

i=1

 

 

 

 

 

 

 

 

n

 

 

 

 

[y]= éy

; y

 

; ... ; y

 

; ... ; y

ù,

(

y

=1)

 

 

2

j

å

 

 

ë 1

 

 

 

m û

 

j

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

при известной платёжной функции f(x;y) справедливы неравенства

 

 

ν £ f(x(0) ;y) или ν £ éx(0)

ù ×[A]×[y]

 

; f(x;y(0) ) £ ν или [x]×[A]× é y(0)

ù

£ ν ,

ë

û

 

 

 

 

 

 

 

 

ë

û

 

которые более компактно можно записать в виде

f(x;y(0) ) f(x(0);y(0) ) f(x(0) ;y) .

Примечание 1. Для смешанных стратегий данное утверждение очевидно из определения оптимальности решений в смешанных стратегиях, но здесь имеет место расширение понятия для любых стратегий, включая и чистые стратегии.

Утверждение 3. В матричных играх условие оптимальности смешанных стратегий можно распространять на случай чистых стратегий.

Если ν − цена игры с платёжной матрицей [A] размерностью (m×n)

и если для выбранных стратегий (x(0) ; y(0) ) игроков Р1, Р2 и ЛЮБЫХ

других стратегий (включая чистые стратегии) справедливы

неравенства

ν £ f(x(0) ;y), т.е. ν £

éx(0)

ù

×[A]

×[y]

и f(x;y(0) ) £ ν, т.е. [x]×[A]× é y(0)

ù

£ ν,

 

ë

û

 

 

ë

û

 

то тогда стратегии

(x(0) ;

y(0) )

являются оптимальными стратегиями

игроков Р1, Р2.

 

 

 

 

 

 

 

Примечание. Очевидно, что утверждения 2 и 3 взаимнообратны.

Следствие из утверждения №3.

В матричных играх имеет место сочетание и взаимосвязь чистых и смешанных стратегий при выборе оптимальных стратегий.

46

Т Е О Р И Я И Г Р

В.М.Дуплякин

Рассмотрим стратегии (x; y) , выбрав из них как частный случай чистые стратегии ei , ej

P1: [x] = [x1,x2,...,xm ] Þ

ei =[0,0,0,...,1,...,0]

 

 

j

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

P2: [y]

= [y , y ,...,

y

n

]Т

Þ

ej =[0,0,...,1,...,0,0,0]Т

 

1 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Воспользуемся определением оптимальной игры в виде

f(x;y(0) ) f(x(0);y(0) ) f(x(0) ;y) ,

которое представим следующим образом

 

 

 

éx

ù

×[A]× é y(0)

ù £ ν £

éx(0)

ù

×[A]× é y

ù .

ë

û

ë

û

ë

û

ë

û

Так как [x] и [y]

 

могут быть любыми,

то возьмём вместо них чистые

стратегии ei , ej

éa

11

a

12

...

a

1n

ù

é y(0)

ù

 

ê

 

 

 

ú

ê 1(0)

ú

 

[0,...,1,...,0]× êa21

a11

...

a2n ú

× ê y2

ú

£

ê ...

...

...

... ú

ê ...

ú

 

ê

 

am2

...

 

 

ú

ê (0)

ú

 

ëam1

amn û

ë ym

û

 

ν£ éx(0)

ë1

é a11

êa , ..., x(0) ù × ê 21

n û ê ...

êëam1

a12

...

a1n

ù

é

0

ù

a11

...

a2n

ú

ê

 

ú

ú

× ê...ú

...

...

... ú

ê

1

ú .

am2

...

 

ú

ê

0

ú

amn û

ë

û

После перемножения матриц получим

[a

i

]× éy(0)

ù

£ ν £

éx(0)

ù

× éaj ù

, "(i=1,...,m; j=1,...,n).

 

ë

û

 

ë

û

ë û

 

47

 

 

Т Е О Р И Я И Г Р

В.М.Дуплякин

 

Рассмотрим поочередно левую и правую части приведенного

неравенства:

 

[a

]× éy(0)

ù £ ν - означает, что любая чистая стратегия игрока Р1 в сочетании с

i

ë

û

 

оптимальной стратегией Р2 не лучше или так же эффективна

как оптимальная

стратегия éx(0)

ù ;

 

 

 

ë

û

 

ν £ éx(0)

ù

× éa j ù

- означает, что любая чистая стратегия игрока Р2 в сочетании с

ë

û

ë û

 

 

оптимальной стратегией Р1 не лучше или так же эффективна

как оптимальная

стратегия éy(0)

ù .

 

 

 

ë

û

 

Утверждение 4. Ограничения условий выбора оптимальных стратегий взаимосвязаны между собой.

Обратимся к раскрытию итоговых неравенств из предыдущего утверждения

[a

i

]× éy(0)

ù

£ ν £

éx(0)

ù

× éa j ù

, "(i=1,...,m; j=1,...,n) .

 

ë

û

 

ë

û

ë û

 

Рассматривая чистые неравенства и соответствующие равенства, можно

обнаружить их взаимно однозначное соответствие

1.

Если [a

i

]× éy(0) ù

< ν , то x(0)

= 0 .

 

 

 

ë

û

 

 

 

i

 

2.

Если x(0)

> 0, то

[a

]× éy(0) ù

= 0.

 

i

 

 

 

 

i

 

ë

û

 

3.

Если ν < éx(0)

ù ×

éaj ù

, то

y(0) = 0 .

 

 

 

 

ë

û

ë û

 

j

 

4.

Если y(0)

> 0, то

ν = éx(0) ù × éa j ù .

 

j

 

 

 

 

 

 

ë

û

ë û

Утверждение 5. Кососимметричная платёжная матрица предопределяет справедливую игру.

Если платёжная матрица [A] квадратная и кососимметричная, т.е.

aij = -aij при i ¹ j и aii = 0, i = 1, 2, ... ,m , j = 1, 2 ,..., m,

то оптимальная стратегия Р1 совпадает с оптимальной стратегией Р2

éx(0) ù = é y(0) ùT .

ë û ë û

48

Т Е О Р И Я И Г Р

В.М.Дуплякин

Как следствие из этого утверждения, цена игры при такой платёжной

матрице равна нулю

é

(0) ù

é

(0) ù

é

(0)

ν = ëx

û

×[A]× ë y

û

= ëx

 

ù

×

[A]

× é

(0) ùT =

0

.

û

 

ëx

û

 

Отсюда следует, что при кососимметричной квадратной платёжной матрице игра всегда СПРАВЕДЛИВАЯ.

Утверждение 6. Скаляризация позволяет снизить трудоёмкость вычислительной процедуры поиска оптимальных стратегий.

Представим платёжную матрицу игры в блочном виде в двух вариантах структурирования: построчено и по-столбцам :

é

[a1

]ù

 

 

 

 

 

 

 

 

ê

[a

 

]ú

или [A]= ééa1

ù

;

éa2

ù

; ...

;

éan ùù .

[A]= ê

 

2

ú

ê ...

ú

ëë

û

 

ë

û

 

 

ë ûû

ëê[am ]ûú

 

 

 

 

 

 

 

 

Выделение строк и столбцов имеет определённый смысл, который заключается в том, что строки представляют собой результат выбора соответствующей стратегии игроком Р1, а столбцы игроком Р2.

Цена матричной игры как следствие из утверждения № 3 может быть

представлена с учётом блочного структурирования платёжной матрицы следующим образом

ν = max min

[x]

× éa j ù

или ν = min max

[a

]×[y].

x j=1,...,n

ë û

y i=1,...,m

i

 

Рассмотрим выражение

max min

[x]× éa j ù.

 

 

 

x

j=1,...,n

ë û

 

 

Допустим, что используется произвольная смешанная стратегия игрока Р1

[x] = [x1, x2 ,..., xm ].

Для этой произвольной смешанной стратегии найдём скалярные произведения

[x]× éa1

ù

,

[x]× éa2

ù

, ...

, [x]× éa j ù

, ...

, [x]× éan ù .

ë

û

 

ë

û

 

ë û

 

ë û

49