Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр и исследование операций.doc
Скачиваний:
248
Добавлен:
12.03.2015
Размер:
561.66 Кб
Скачать

2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.

Пусть матричная антагонистическая игра двух игроков А и В задана платежной матрицей

Здесь по-прежнему аij=Н(Аi,Вj) – выигрыш игрока А (проигрыш игрока В) в случае выбора игроком А стратегии Аi, а игроком В – стратегии Вj. Предположим также, что игра состоит из большого числа партий. Поэтому, стремясь к максимизации суммарного выигрыша, каждый игрок может свои стратегии «смешивать», чередуя с какой-либо частотой.

Смешанной стратегией игрока А назовем неотрицательный вектор вида SА=(р1,р2,…,рm), где рi – вероятность применения игроком А стратегии Аi (i=1,…,m), причем р1+р2+…+рm=1.

Cмешанной стратегией игрока В назовем неотрицательный вектор SВ=(q1,q2,…,qn ), где qj – вероятность применения игроком В стратегии Вj (j=1,…,n), причем q1+q2+…+qn=1.

В отличие от таким образом определенных смешанных стратегий, исходные стратегии игроков Аi и Вj, где i=1,…,m, j=1,…,n, называют чистыми. Однако заметим, что чистые стратегии можно считать частным случаем смешанных и задавать вектором, в котором 1 стоит на месте, соответствующем данной чистой стратегии, а остальные элементы – нули. Например, А2=(0,1,0,…,0).

В силу того, что в смешанных стратегиях игроки используют свои чистые стратегии случайным образом, мерилом успеха такого применения может служить математическое ожидание выигрыша (или средний выигрыш) игрока в одной партии. Пусть игроки А и В независимо друг от друга выбрали соответственно стратегии SА=(р1,…,рm) и SВ=(q1,…,qn). Тогда вследствие известных утверждений теории вероятности, математическое ожидание выигрыша игрока А в одной партии равно:

(2.3)

Руководствуясь принципом минимакса, каждый игрок стремится в наибольшей степени увеличить свой гарантированный средний выигрыш. Значение гарантированного среднего выигрыша игрока А в одной партии определяется выражением:

(2.4)

(аналог нижней цены игры в случае чистых стратегий ), а значение гарантированного среднего проигрыша игрока В - выражением:

(2.5)

(аналог верхней цены игры ). Здесь максимумы берутся по множеству всевозможных смешанных стратегий игрока А, а минимумы – по множеству смешанных стратегий игрока В. Основной результат теории матричных игр представлен теоремой фон Неймана о минимаксе.

Теорема. Для матричной игры с любой платежной матрицей Н величины S и S существуют и равны между собой. Более того, существует хотя бы одна пара смешанных стратегий SA* и SB*, для которых выполняется:

Н(SA*,SB*)=S =S .

При этом стратегии SA* и SB* называются оптимальными смешанными стратегиями; пара таких стратегий – решением игры в смешанных стратегиях, а общее значение vS для S и S - ценой такой игры. Если vS=0, то игра называется справедливой.

Как и в случае игры с седловой точкой, решение игры в смешанных стратегиях является устойчивым: если один из игроков придерживается своей оптимальной смешанной стратегии, то другому не может быть выгодно отступление от своей оптимальной стратегии. Иначе говоря, для произвольных смешанных стратегий SA и SB выполняется двойное неравенство:

H(SA,SB*)H(SA*,SB*)  H(SA*,SB).

Отметим несколько важных свойств решений матричных игр.

Свойство 1. Игры, заданные платежными матрицами Н(1) и Н(2) одинаковой размерности, элементы которых, аij(1) и аij(2) связаны линейным соотношением: aij(1)=kaij(2)+b, где k, b - некоторые действительные числа, имеют одинаковые решения в смешанных стратегиях. Цены таких игр vS(1) и vS(2) связаны тем же соотношением: vS(1)=kvS(2)+b.

Указанное свойство позволяет упростить и придать наглядность платежной матрице какой-либо игры; в частности, можно избавиться от дробных элементов, сделать любую игру справедливой и т. п.

Свойство 2. Для любой матричной игры справедливо двойное неравенство:

  vS (2.6)

где и - соответственно нижняя и верхняя цены игры, vS – цена игры в смешанных стратегиях.

В частности, для игры с седловой точкой неравенство (2.6) имеет вид двойного равенства.

Прежде чем формулировать третье свойство, введем в рассмотрение новое понятие.

Пусть SA*=(p1*,…,pm*), SB*=(q1*,…,qn*) - пара смешанных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от 0 вероятностью, то она называется активной ( полезной ).

Свойство 3. Пусть один из игроков придерживается своей оптимальной смешанной стратегии. Тогда выигрыш остается неизменным и равным цене игры vS, если другой игрок не выходит за пределы своих активных стратегий, т. е. когда он использует любую из смешанных стратегий ( в том числе, чистых ), в которую с ненулевыми вероятностями входят только его активные стратегии.

Это утверждение имеет большое практическое значение, оно лежит в основе многих конкретных способов решения матричных игр.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]