Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ТС и СА-2007 30мая.docx
Скачиваний:
7
Добавлен:
19.09.2019
Размер:
1.03 Mб
Скачать

Лекция 6 Ситуация равновесия по Нэшу в информационном расширении игры

В предыдущем разделе было показано на примерах, что дополнительная информация может привести к увеличению выигрыша игрока.

Подчеркнем, что ценность полученной информации определяется не ее объемом, а полезностью. Для одних задач (целей) полезная информация одна, для других – другая. Таким образом, оценка получаемой информации определяется через функцию выигрыша.

Далее будет показано, как формализовать информированность в виде стратегий и что это дает с точки зрения принятия решения и даже для определения самого понятия решения.

Информационное расширение игры

Пусть задана исходная игра Г=<X1, X2, M1, M2>, тогда игра

I=<X1,X2,π,M1(x1,x2),M2(x1,x2)называется информационным расширением игры , если существует проекция π: × X1×X2, обладающая следующими свойствами:

1) Каждой паре стратегий ( , ) × ставит в соответствие пару управлений (исходов) (x1, x2) X1×X2

2) Множество стратегий содержит стратегии , т.е. стратегии – управления, не использующие информации.

3) Функции выигрыша в игре вычисляются по правилу:

i( , ) = Mi(π ( , ))

Не для любых множеств стратегий выполняется свойство (1), а следовательно и свойства (2) и (3).

Например, возьмем пару { }. В этом случае игрок 1 знает о выборе второго, а игрок 2 одновременно знает выбор первого - противоречие. Следовательно, пара { } «физически» не реализуема.

Свойство (2) заключается в следующем:

Игроки могут использовать стратегии, для выбора которых не требуется учета информации, но это, как правило, нецелесообразно (приводит к потере выигрыша).

Выигрыши в игре определяются по свойству (3) равенством:

i( , ) = Mi( π ( , ))

Т.е. сначала стратегии ( , ) проектируются во множество управлений (исходов) - (x1, x2) X1×X2, а затем вычисляются значения i( , ), как и в игре Г.

Примеры проектирования множества стратегий на множество управлений (выборов, исходов)

Пример 1:

Пусть , т.е. ,

, т.е.

Тогда ( , ) .

Фиксируем для примера:

X1=x(x2)=x2^2

X2=x2=1/2.

Тогда эти стратегии проектируются так:

( x 1, x 2 ) ( x 1 (x 2 ) , x 2 ) (x 2/2, ½) =(1/4,1/2)

Пример 2:

Пусть x1: x 2  X 1 т.е. ,

x 2 : x 1X 2, т.е. - игрок 2 принимает решение в зависимости от стратегии первого игрока. Например,

Проектируем:

,

так как

.

Ситуация равновесия по Нэшу в информационном расширении игры

Пусть задана игра:

Г = < , , , >

и ее информационное расширение:

Определение.

( 0, 0)- ситуация равновесия в информационном расширении игры, если M10 =M1(π( 0, 0))= M1(π( , 0))

M20= M2(π( 0, 0))= M2(π( 0, )

Заметим ,что

( 0, 0) π (х10, х20) – равновесный исход, но не ситуация равновесия!

Таким образом, ситуация равновесия может реализоваться на стратегиях

( º, º) є

но ее проекция

( хº1, хº2) є

не обязательно равновесная по Нэшу.

Напомним, что стратегия а = х1а2) называется абсолютно оптимальной стратегией, если справедливо равенство:

M1(x1а(x2), x2)= M1(x1, x2)

Определим x2= х2а - оптимальный ответ второго игрока из условия:

M2(x1а(x2), x2) = M2(x1а(x2а), x2а )

Положительные свойства стратегий:

Свойство 1.

Ситуация равновесия всегда существует на классе стратегий

( , )=(x1(x2), x2)

Доказательство: Достаточно выбрать абсолютно оптимальную стратегию а = хª1(x2), и оптимальный ответ на нее а = х2а

По определению:

M1(x1а(x2), x2) = M1(x1, x2),

M2(x1а(x2а), x2а ) = M2(x1а(x2), x2).

Тогда, если = х2а, то

M1(π( ,x^2а))= M1(x1(xª2), xª2) = M1(x1а(x2а), x2а ).

Если = а ( ), то M2(x1а(x2), x2 )= M2(x1а(x2а), x2а), что соответствует определению ситуации равновесия в информационном расширении игры.

Свойство 2.

Если , то и – увеличение информации приводит к возможности увеличения выигрыша.т

Доказательство:

Первый игрок может не использовать дополнительную информацию и получить . А если повезёт (дополнительная информация оказалась полезной), то получит строго больше.

Свойство 3.

Пусть игрок 1 знает х2 .

Определим взаимовыгодное множество для этого случая:

12={(х1, х2) M1( х1, х2) ≥ M11, х2);

M2( х1, х2) ≥ M21, х2)}.

Любая точка из этого множества может быть сделана ситуацией равновесия на классе стратегий

12), х212)]}

Аналогичное утверждение верно и в симметричном случае, когда игрок 2 знает х1.

Здесь взаимовыгодное множество определяется следующим образом:

21={(х1, х2) M1( х1, х2) ≥ M11, х2);

M2( х1, х2) ≥ M21, х2)}.

А класс использованных стратегий имеет вид:

{ х1 21)], х2 1)}.

Для иллюстрации сделанных выводов рассмотрим следующий

Пример. [1]

Исследуем биматричную игру:

М1= M2=

Сначала найдем равновесные ситуации в исходной игре.

Для этого определим:

x1a(x2) –абсолютно оптимальную стратегию первого игрока и

х2 = x2a – оптимальный ответ второго.

Напомним, что:

x1a(x2): M1(x1a(x2), x2) = M1(x1, x2)x2a:

M2(x1a(x2а), x2a) = M2(x1a(x2а), x2).

Итак:

3, если x2 = 1

x1a(x2) = 2, если x2 = 2

2, если x2 = 3

Аналогично: 3, если x1 = 1

x2a(x1) = 2, если x1 = 2

2, если x1 = 3

Единственная ситуация равновесия в исходной игре определяется из условия пересечения оптимальных стратегий в точке (x1a(x2а) , x2a(x1a)) (2,2).

В этой ситуации выигрыши игроков равны (4,4).

Построим П-множество Парето на классе исходных управлений.

Напомним, что

(x1п, x2п) П

если не существует (x1', x2')єХ12, такой что:

Mi(x1', x2') ≥ Mi(x1п, x2п), i=1, 2 (дизъюнкция)

Mi(x1', x2') > Mi(x1п, x2п), i=1 либо i=2 (конъюнкция)

В пространстве выигрышей множество возможных решений имеет вид:

M2

П

7

6 П

4 (4, 4) с.р.

3

2 П

0 2 3 4 6 7 M1

рис.1

Как видно из рис.1:

П = {( 1,1); (1,3); (3,1)},

С выигрышами игроков соответственно

МП = {(6,6); (2,7); (7,2)}.

Непосредственной проверкой убеждаемся, что ни одна из этих точек не является ситуацией равновесия в исходной игре.

Покажем, что эти ситуации могут быть результатом проекции равновесных стратегий вида:

{ х12), х212)]}, {х121)], х21)}.

Имеем для игрока 1:

M1(x1, x2) = 0

M1(x1, x2) = 3

Определим: х2 = х2H - стратегия наказания первого игрока вторым, из условия

M11, х2) = M11, х2H)

В данном случае имеем х2H= .

Далее для игрока 2 имеем: M2(x1, x2) = 0

M2(x1, x2) = 3

Определим х1H 2) - стратегию наказания второго игрока первым.

2, если х1 = 1

х1H 2)= 1, если х2 = 2

3 (2), если х3 =3

Покажем, что равновесные стратегии можно выбрать на классе стратегий {x1(x2), x2 [x1(x2)]} .Действительно , пусть

x10 (x2) = 1, х2=1 0 = х20 12)] = 1, =

х1н 2), х2 1 , х2н = 3,

Очевидно, эти стратегии проектируются в точку (х1 = 1, х2=1). В этой точке M1 = 6, M2 = 6.

Если от этих стратегий отклонится игрок 1, то есть , то он получит не больше, чем

M1(π( , 0))= M1(π ( , 3) = M1(2, 3) = 3 < 6.

Таким образом, игроку 1 не выгодно отклоняться от точки ( , 0).

Если же при = , игрок 2 выберет , то его выигрыш оценивается величиной

M2[π( 0, )].

Если т.ч. х2 1, при = , то

M2[π( 0, )] = M21H2), х2) = 0 < 6

Итак, игроку 2 также не выгодно отклоняться от точки ( , 0), то есть ( , 0) – ситуация равновесия в игре .

Замечание. Точку из множества Парето можно сделать равновесной, если выигрыши игроков в ней оцениваются величиной не меньшей, чем их максимально гарантированные результаты, соответствующие их информированности. Этому условию удовлетворяют также точка (7,2) на классе стратегий {x1(x2), x2 [x1(x2)]} и точка (2,7) на классе стратегий {x2(x1), x1 [x2(x1)]}.

Упражнение.

Точку (7,2) можно сделать ситуацией равновесия на классе

{x1(x2), x2 [x1(x2)]}

Точку (2,7) можно сделать ситуацией равновесия на классе

{x2(x1), x1 [x2(x1)]}.

Итак, для построения ситуаций равновесия в игре двух лиц на сложных стратегиях необходимо проделать следующее:

  1. Вычислить гарантированные (минимальные или максимальные, в зависимости от информированности ) результаты игроков.

  2. Определить стратегии наказания, применение которых не позволит партнеру получить выигрыш, превышающий его гарантированный результат.

  3. Определяется множество взаимовыгодных исходов, на котором игроки получают выигрыш, не меньший гарантированного результата.

  4. Путем переговоров выбирается точка из этого множества, устраивающая обоих партнеров.

  5. С помощью простой процедуры конструируются равновесные стратегии, включающие в себя обязательства выбора договорного исхода и штрафы на основе стратегий наказания за нарушение договоренностей.

Таким образом, решение сложнейшей по постановке задачи оказывается не сложнее, а. как правило, значительно проще решения традиционной задачи поиска ситуации равновесия. При этом построение взаимовыгодного множества дает полное решение задачи - построить все ситуации равновесия!

Проведем анализ рассмотренных ранее иллюстративных игр, но уже на классе стратегий.

Игра «продавец – покупатель»

В этой игре на классе исходных управлений не существует равновесной ситуации.

Пусть теперь например, покупатель имеет информацию о действиях продавца. Тогда его абсолютно оптимальная стратегия заключается в доверии (без затрат на проверку в случае честного поведения продавца. Если же продавец обманул, то оптимальное поведение покупателя – проверить и наказать продавца. Оптимальный выбор продавца в этой ситуации –честно взвесить товар. Что приводит к исходу – (честно взвеситл, поверил). Подчеркнем, что эта ситуация не является ситуацией равновесия в исходной игре! Ситуация равновесия реализуется только на классе стратегий.

Аналогично, если продавец знает выбор покупателя, то его абсолютно оптимальная стравтегия заключается в честном поведении при угрозе проверки - и обмане – в случае доверчивого покупателя. Оптимальный ответ покупателя на эту стратегию – проверять продавца. В этом случае реализуется исход –(честно взвесил, проверил), котороый опять же не является равновесным в исходной игре.

Заметим, что различные варианты информированности приводят к различным ситуациям равновесия.

Игра «семейный спор»

В этой игре существуют две неравноценные для партнеров ситуации равновесия: идти вместе на футбол или идти вместе на балет. Эта игра на классе стратегий хорошо иллюстрирует тот факт, что иногда более важно владеть инициативой, а не информацией. Кто из партнеров первым ходит, то есть первым делает выбор и сообщает о нем партнеру, тот и добивается для себя более выгодной ситуации равновесия. Если главенствует муж, то жене придется идти с ним на футбол. Если муж находится «под каблуком», то он обречен ходить на балет.

Заметим, что в дружной семье главенствующий всегда идет на компромисс, предлагая поочередно наслаждаться балетом и футболом. Однако в этой ситуации мы выходим за рамки статической модели, определяя интегральный (осредненный по времени) выигрыш в динамической модели повторящейся игры.

Игра «реклама»

В этой игре существует единственная ситуация равновесия – обоим партнерам рекламировать свой товар. Однако существует более эффективный для обоих партнеров вариант, оптимальный по Парето, - не тратиться на рекламу. Но эта ситуация не является равновесной на классе исходных управлений. Однако эта ситуация принадлежит взаимовыгодному множеству, а значит ее можно сделать результатом проекции равновесных стратегий, включающих в себя договорные обязательства со штрафами за отклонение от них.