2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.

Пусть матричная антагонистическая игра двух игроков А и В задана платежной матрицей

Здесь по-прежнему а_ij=Н(А_i,В_j) – выигрыш игрока А (проигрыш игрока В) в случае выбора игроком А стратегии А_i, а игроком В – стратегии В_j. Предположим также, что игра состоит из большого числа партий. Поэтому, стремясь к максимизации суммарного выигрыша, каждый игрок может свои стратегии «смешивать», чередуя с какой-либо частотой.

Смешанной стратегией игрока А назовем неотрицательный вектор вида S_А=(р₁,р₂,…,р_m), где р_i – вероятность применения игроком А стратегии А_i (i=1,…,m), причем р₁+р₂+…+р_m=1.

Cмешанной стратегией игрока В назовем неотрицательный вектор S_В=(q₁,q₂,…,q_n), где q_j – вероятность применения игроком В стратегии В_j(j=1,…,n), причем q₁+q₂+…+q_n=1.

В отличие от таким образом определенных смешанных стратегий, исходные стратегии игроков А_i и В_j, где i=1,…,m, j=1,…,n, называют чистыми. Однако заметим, что чистые стратегии можно считать частным случаем смешанных и задавать вектором, в котором 1 стоит на месте, соответствующем данной чистой стратегии, а остальные элементы – нули. Например, А₂=(0,1,0,…,0).

В силу того, что в смешанных стратегиях игроки используют свои чистые стратегии случайным образом, мерилом успеха такого применения может служить математическое ожидание выигрыша (или средний выигрыш) игрока в одной партии. Пусть игроки А и В независимо друг от друга выбрали соответственно стратегии S_А=(р₁,…,р_m) и S_В=(q₁,…,q_n). Тогда вследствие известных утверждений теории вероятности, математическое ожидание выигрыша игрока А в одной партии равно:

(2.3)

Руководствуясь принципом минимакса, каждый игрок стремится в наибольшей степени увеличить свой гарантированный средний выигрыш. Значение гарантированного среднего выигрыша игрока А в одной партии определяется выражением:

(2.4)

(аналог нижней цены игры  в случае чистых стратегий ), а значение гарантированного среднего проигрыша игрока В - выражением:

(2.5)

(аналог верхней цены игры ). Здесь максимумы берутся по множеству всевозможных смешанных стратегий игрока А, а минимумы – по множеству смешанных стратегий игрока В. Основной результат теории матричных игр представлен теоремой фон Неймана о минимаксе.

Теорема. Для матричной игры с любой платежной матрицей Н величины _S и _S существуют и равны между собой. Более того, существует хотя бы одна пара смешанных стратегий S_A* и S_B*, для которых выполняется:

Н(S_A*,S_B*)=_S=_S .

При этом стратегии S_A* и S_B* называются оптимальными смешанными стратегиями; пара таких стратегий – решением игры в смешанных стратегиях, а общее значение v_S для _S и _S - ценой такой игры. Если v_S=0, то игра называется справедливой.

Как и в случае игры с седловой точкой, решение игры в смешанных стратегиях является устойчивым: если один из игроков придерживается своей оптимальной смешанной стратегии, то другому не может быть выгодно отступление от своей оптимальной стратегии. Иначе говоря, для произвольных смешанных стратегий S_A и S_B выполняется двойное неравенство:

H(S_A,S_B*)H(S_A*,S_B*)  H(S_A*,S_B).

Отметим несколько важных свойств решений матричных игр.

Свойство 1. Игры, заданные платежными матрицами Н⁽¹⁾ и Н⁽²⁾ одинаковой размерности, элементы которых, а_ij⁽¹⁾и а_ij⁽²⁾ связаны линейным соотношением: a_ij⁽¹⁾=ka_ij⁽²⁾+b, где k, b - некоторые действительные числа, имеют одинаковые решения в смешанных стратегиях. Цены таких игр v_S⁽¹⁾ и v_S⁽²⁾ связаны тем же соотношением: v_S⁽¹⁾=kv_S⁽²⁾+b.

Указанное свойство позволяет упростить и придать наглядность платежной матрице какой-либо игры; в частности, можно избавиться от дробных элементов, сделать любую игру справедливой и т. п.

Свойство 2. Для любой матричной игры справедливо двойное неравенство:

  v_S   (2.6)

где  и  - соответственно нижняя и верхняя цены игры, v_S – цена игры в смешанных стратегиях.

В частности, для игры с седловой точкой неравенство (2.6) имеет вид двойного равенства.

Прежде чем формулировать третье свойство, введем в рассмотрение новое понятие.

Пусть S_A*=(p₁*,…,p_m*), S_B*=(q₁*,…,q_n*) - пара смешанных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от 0 вероятностью, то она называется активной ( полезной ).

Свойство 3. Пусть один из игроков придерживается своей оптимальной смешанной стратегии. Тогда выигрыш остается неизменным и равным цене игры v_S, если другой игрок не выходит за пределы своих активных стратегий, т. е. когда он использует любую из смешанных стратегий ( в том числе, чистых ), в которую с ненулевыми вероятностями входят только его активные стратегии.

Это утверждение имеет большое практическое значение, оно лежит в основе многих конкретных способов решения матричных игр.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 159 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.03.2015142.97 Кб21СУХТП 10.docx
#
12.03.2015149.02 Кб22СУХТП 13.docx
#
12.03.201547.1 Кб27Т_1.doc
#
12.03.201540.96 Кб373таблицы СОЦИОЛОГИЯ.doc
#
12.03.2015937.47 Кб97Теория Графов.doc
#
12.03.2015561.66 Кб248Теория игр и исследование операций.doc
#
12.03.2015137.73 Кб53Тест ЗО оптика.doc
#
12.03.201516.29 Кб22ТЕСТ менеджмент.docx
#
12.03.2015119.81 Кб13Тесты ЗО колеб и волны.doc
#
12.03.201564.51 Кб31Тесты ЗО механика.doc
#
12.03.201558.37 Кб30Тесты ЗО мол.ф.doc