Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МОЯ Шпора по ИО 2 семестр.docx
Скачиваний:
4
Добавлен:
24.09.2019
Размер:
130.13 Кб
Скачать

53. Равновесие в защитных (максиминных) стратегиях

Реализ-ся, когда игроки либо мало знают о ф-ях выигрышах соперника и ориентируется исключ.по своей ф-и выигрыша, либо стремится к гарантир-ому выигрышу, кот.способны достичь в ¥ случае, при ¥ действиях соперника. Стратегии, приносящие гарантированный результат наз.защитными (максиминными, осторожными) стратегиями.

Стратегия s*i наз.защитной стратегией игрока Gi, если справедливо соотношение:

Hi(s||si*)≥ maxsiSimin(s→\si)Hi(s||si), , где (S\si)=(s1,…,si-1,si+1,…,sN)-это набор всех стратегий игроков за исключением стратегии i-го игрока Gi . Гл. достоинство защитной стратегии - они сущ всегда и приносит гарантировано результат. Но часто такие стратегии излишне осторожны и могут привести к несовсем «логичным» решениям.

52. Равновесие Штакельберга

Описывает поведение типа «лидер-ведомый» в игре 2-х лиц. Обозн ч/з Z1 и Z2 мн-во ситуаций, в кот.стратегии игроков G1 и G2 соотв-но явл-ся наилуч ответами на действия соперника:

Z1={s=(s1,s2):H1(s1, s2)= max y1€s1H1(y1,s2)},

Z2={s=(s1,s2):H2(s1,s2)= max y2€s2H2(s1,y2)}, (1)

Ситуация s→*=(s*1,s*2) наз-ся равновесной по Штакельбергу, опред-ым лидером Gi, если вып-ся соотн-е: Hi(s→*)= si€Zj maxHi(s),j≠i, (2). Соотн-е (2) означ., что игрок Gi (лидер) знает ф-и выигрышей обоих игроков, а тем самым мн-во наилуч ответов соперника (ведомого игрока Gj) на любую стратегию лидера. Тогда он, обладая этой инфо, максимизирует свой выигрыш, выбирая свою стратегию как наилуч ответ на все ответы ведомого.

В игре 2-х лиц имеет место борьба за лидерство, если не сущ такой ситуации s ,для кот.было бы справ-во: H1(s)H1(s→*1),H2(s)H2(s→*2), где s→*1 и s→*2- это равновесия Штакельберга, определяемые лидерами G1 и G2 соответственно.

Т.(о борьбе за Лид-во) : если игра 2-х лиц имеет по крайней мере 2 оптим по Парето и равновесные по Нэшу ситуации одновр-но, т.е.: α=(s11,s21), β=(s12,s22), с различ векторами выигрышей, т.е. (Н1),Н2))≠(Н1),Н2)), то в игре имеет место борьба за Лид-во.

В игре с борьбой за Лид-во преимущ-во получает более расторопный и более решительный игрок. На практике очень важно 1-ым заявить о своём выборе. Если заявление сделано и подкреплено реальными действиями,то 2-му игроку ничего не остается (при усл, что он рационален),как перейти в категорию ведомого и реализ вместе с лидером равновесие Штакельберга.

54. Смешанные стратегии

Иногда игра склад-ся т.о., что не удается выделить ни одной равновесной ситуации ни по одному критерию.

Смешанной стратегией µi игрока Gi наз.распред-е вероятностей на мн-ве его чистых стратегий:

µi= (si1,si2,…,sini ) ,i=1,N¯¯

i1,pi2,...,pini) , где pik- это вер-ть реализации чистой стратегии sik. Вер-ти должны удовл усл-ям: ∑nik=1 pik=1;pik≥0 ¥ i=1,N¯¯(условие нормировки), ¥ чистая стратегия может интерпретироваться как частный случай смеш.стратегии, т.к.: sik= si1,si2,…,sik,..,sini

0, 0,…, 1,…,0

Введение смеш.стратегии вносит коррективы в описание игры. Игра, в кот.допускается применение смеш. страт. часто наз. смешанным расширением игры.

Игроки незав др.от др. выбир одну из мн-ва своих смеш.страт. В результате чего формир-ся ситуация в смеш.страт. µ=(µ12,.,µN), определяющая случайный механизм реализации чистых стратегий игроков. Т.о.в кач-ве выигрыша игрока Gк ситуация см-стратегии µ берутся по определению: Кm)=∑n1i1=1n2i2=1…∑nNi(N-1)=1Hm(s1i1,s2i2,…,sNiN) p1i1,p2i2,…,pNiN ,(1). После получения средних выигрышей (1) игра заканчив-ся. Задача игроков состоит в том, чтобы максимизировать выигрыш Кl) ¥ Gl.