Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 26.doc
Скачиваний:
19
Добавлен:
26.05.2015
Размер:
268.29 Кб
Скачать

26.5. Биматричные игры

Рассмотрим теперь игры с ненулевой суммой, в которых интересы игроков, хотя и не совпадают, но уже необязательно являются противоположными.

Пусть, как и прежде, в распоряжении игрока А имеется m стратегий А1, А2, … Аm, а в распоряжении игрока В – n стратегий В1, В2, … Вn. При этом, если игрок А выбрал стратегию Аi, а игрок В – стратегию Вj, то выигрыш игрока А равен некоторому числу aij, а выигрыш игрока В – некоторому другому числу bij. Тогда выигрыши каждого игрока можно свести в отдельные матрицы A = (aij)mn и B = (bij)mn.

Поэтому игры с ненулевой суммой часто называют биматричными играми. При этом рассмотренные ранее матричные игры с нулевой суммой можно считать частным случаем биматричных игр, где матрица выигрышей игрока В противоположна матрице выигрышей игрока А, т.е.

bij = - aij, i = 1,…m; j = 1,…n.

Рассмотрим один из классических примеров биматричной игры.

Пример. «Дилемма узников». Два узника находятся под обвинением в совместном совершении преступления при отсутствии прямых улик. При этом каждый узник, назовем их игроками А и В, имеет две стратегии поведения:

А1, В1 – узник не сознается в совместном совершении преступления;

А2, В2 – узник сознается в совместном совершении преступления.

Если ни тот, ни другой узник не сознаются, то оба получат по 1 году тюрьмы, если оба сознаются – то по 6 лет тюрьмы. Но если сознается только один из них, а другой не сознается, то сознавшийся будет немедленно выпущен на свободу, а несознавшийся получит 9 лет тюрьмы.

Как и в предыдущих матричных играх, в этой задаче нужно найти оптимальные стратегии игроков.

Если считать год тюрьмы за выигрыш равный (- 1), то матрицы А и В такой биматричной игры имеют вид:

; .

Прерывая решение задачи, дадим некоторые пояснения.

В общем случае биматричной игры возникает вопрос, какие стратегии выбирать игрокам для разрешения моделируемой конфликтной ситуации? Другими словами, что понимать под решением биматричной игры?

Предположим сначала, что правилами игры игрокам запрещено консультироваться друг с другом и согласовывать свои действия.

Так как интересы игроков не совпадают, то для решения игры необходимо найти такой компромисс, который был бы приемлемым для обоих игроков. То есть нужно найти такую равновесную ситуацию, отклонение от которой уменьшает выигрыш отклоняющегося игрока при сохранении другим игроком своего выбора.

Поскольку, как было установлено ранее, любая матричная игра в смешанных стратегиях разрешима, разумно и в биматричных играх сразу перейти к смешанным стратегиям игроков SA = (p1, p2, … pm) и SB = (q1, q2, … qn). Тогда средние выигрыши игроков определяются по формулам:

; .

Ограничимся случаем рассмотрения биматричной игры 22, когда у каждого игрока имеется по 2 стратегии. Обозначим вероятности:

p1 = p; p2 = 1 – p; q1 = q; q2 = 1 – q .

Тогда совместная смешанная стратегия обоих игроков может быть представлена следующим образом:

SAB = ( p, q ),

а средние выигрыши игроков определяются по формулам:

cA(p, q) = a11pq + a12p(1 – q) + a21(1 – p)q + a22(1 – p)(1 – q);

cB(p, q) = b11pq + b12p(1 – q) + b21(1 – p)q + b22(1 – p)(1 – q).

Сформулируем основное определение.

Будем считать, что смешанная стратегия S*AB = ( p*, q*) определяет равновесную ситуацию, если для любых p и q, удовлетворяющих условиям 0  p  1; 0  q  1, одновременно выполняются следующие неравенства:

сA(p, q*) сA(p*, q*) и сB(p*, q) сB(p*, q*).

Эти неравенства означают, что ситуация, определяемая смешанной стратегией S*AB = (p*, q*), является равновесной, если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, не приводит к увеличению выигрыша первого. Отсюда следует, что если существует равновесная ситуация (точка равновесия), то отклонение от нее каждому игроку в отдельности невыгодно.

Справедлива теорема Нэша: Всякая биматричная игра имеет хотя бы одну точку равновесия в смешанных стратегиях.

Кроме того, можно доказать, что для того, чтобы в биматричной игре 22, в которой

,

смешанная стратегия S*AB = (p*, q*) определяла точку равновесия, необходимо и достаточно одновременное выполнение следующих неравенств:

(p* – 1)(Cq*)  0;

p*(Cq* – )  0;

(q* – 1)(Dp* – )  0;

q*(Dp* – )  0;

0  p*  1;

0  q*  1,

где С = a11 – a12 – a21 + a22 ;  = a22 – a12 ;

D = b11 b12b21 + b22 ;  = b22b21 .

Пример. Найти точки равновесия для «дилеммы узников».

Решение. В соответствии с матрицами выигрышей А и В, приведенными ранее, вычислим величины C, D, , :

С = -1 – (-9) – 0 + (-6) =2; D = -1 – 0 – (-9) + (-6) = 2;

= -6 – (-9) = 3; = -6 – (-9) = 3.

Система неравенств, определяющая точки равновесия, имеет вид:

(p* – 1)(2q* – 3) 0;

p*(2q* – 3) 0;

(q* – 1)(2p* – 3) 0;

q*(2p* – 3) 0;

0 p* 1;

0 q* 1.

Путем подстановки в систему неравенств р* = 0, q* = 0, нетрудно убедиться, что стратегия S*AB = (0, 0) является решением системы неравенств, а следовательно она является равновесной точкой рассматриваемой биматричной игры.

Других решений этой системы нет, поскольку при

  1. < p* 1 и 0 q* 1

левая часть второго неравенства отрицательна, а при

  1. < q* 1 и 0 p* 1

левая часть четвертого неравенства отрицательна.

Так как

p1* = p* = 0; p2* = 1 – p*=1; q1* = q* = 0; q2* = 1 – q* = 1,

то оптимальными смешанными стратегиями игроков являются

SA* = (0, 1); SB* = (0, 1).

То есть, решением игры является выбор с вероятностью, равной 1 каждым узником второй чистой стратегии (т.е. A2 и B2 ) – сознаться в совместном совершении преступления. При этом выигрыш каждого узника в точке равновесия равен

c*A = c*B = -6.

Очевидно, что если один из узников решит изменить свою стратегию и выберет первую чистую стратегию, то он выиграет –9, т.е. проиграет больше, чем в точке равновесия, если другой узник будет придерживаться равновесной стратегии.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]