- •Лекции по дисциплине
- •Основные этапы операционного исследования
- •Глава 1. Задачи линейного программирования
- •Возможные случаи допустимого множества решений задачи линейного программирования
- •Возможные случаи оптимальных решений (планов) задачи линейного программирования.
- •Графоаналитический способ решения задач линейного программирования
- •Симплекс-метод
- •Алгоритм симплекс-метода
- •1.5. Метод искусственного базиса (м-метод)
- •Алгоритм м-метода:
- •1.6. Элементы теории двойственности
- •Основная теорема двойственности
- •Вторая теорема двойственности
- •Глава 2. Элементы матричных игр
- •2.1. Формальное представление игр. Понятие матричной игры
- •2.2. Принцип миинимакса решения матричных игр.
- •2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.
- •2.4. Методы решения матричных игр.
- •Упрощение игр с помощью отбрасывания доминируемых стратегий.
- •3. Графический метод решения игр 2хn и mх2.
- •Метод сведения матричной игры к задаче линейного программирования.
- •4.5. Итерационный метод Брауна – Робинсон.
- •2.5. Игры с природой.
- •Список рекомендуемой литературы.
2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.
Пусть матричная антагонистическая игра двух игроков А и В задана платежной матрицей
Здесь по-прежнему аij=Н(Аi,Вj) – выигрыш игрока А (проигрыш игрока В) в случае выбора игроком А стратегии Аi, а игроком В – стратегии Вj. Предположим также, что игра состоит из большого числа партий. Поэтому, стремясь к максимизации суммарного выигрыша, каждый игрок может свои стратегии «смешивать», чередуя с какой-либо частотой.
Смешанной стратегией игрока А назовем неотрицательный вектор вида SА=(р1,р2,…,рm), где рi – вероятность применения игроком А стратегии Аi (i=1,…,m), причем р1+р2+…+рm=1.
Cмешанной стратегией игрока В назовем неотрицательный вектор SВ=(q1,q2,…,qn ), где qj – вероятность применения игроком В стратегии Вj (j=1,…,n), причем q1+q2+…+qn=1.
В отличие от таким образом определенных смешанных стратегий, исходные стратегии игроков Аi и Вj, где i=1,…,m, j=1,…,n, называют чистыми. Однако заметим, что чистые стратегии можно считать частным случаем смешанных и задавать вектором, в котором 1 стоит на месте, соответствующем данной чистой стратегии, а остальные элементы – нули. Например, А2=(0,1,0,…,0).
В силу того, что в смешанных стратегиях игроки используют свои чистые стратегии случайным образом, мерилом успеха такого применения может служить математическое ожидание выигрыша (или средний выигрыш) игрока в одной партии. Пусть игроки А и В независимо друг от друга выбрали соответственно стратегии SА=(р1,…,рm) и SВ=(q1,…,qn). Тогда вследствие известных утверждений теории вероятности, математическое ожидание выигрыша игрока А в одной партии равно:
(2.3)
Руководствуясь принципом минимакса, каждый игрок стремится в наибольшей степени увеличить свой гарантированный средний выигрыш. Значение гарантированного среднего выигрыша игрока А в одной партии определяется выражением:
(2.4)
(аналог нижней цены игры в случае чистых стратегий ), а значение гарантированного среднего проигрыша игрока В - выражением:
(2.5)
(аналог верхней цены игры ). Здесь максимумы берутся по множеству всевозможных смешанных стратегий игрока А, а минимумы – по множеству смешанных стратегий игрока В. Основной результат теории матричных игр представлен теоремой фон Неймана о минимаксе.
Теорема. Для матричной игры с любой платежной матрицей Н величины S и S существуют и равны между собой. Более того, существует хотя бы одна пара смешанных стратегий SA* и SB*, для которых выполняется:
Н(SA*,SB*)=S =S .
При этом стратегии SA* и SB* называются оптимальными смешанными стратегиями; пара таких стратегий – решением игры в смешанных стратегиях, а общее значение vS для S и S - ценой такой игры. Если vS=0, то игра называется справедливой.
Как и в случае игры с седловой точкой, решение игры в смешанных стратегиях является устойчивым: если один из игроков придерживается своей оптимальной смешанной стратегии, то другому не может быть выгодно отступление от своей оптимальной стратегии. Иначе говоря, для произвольных смешанных стратегий SA и SB выполняется двойное неравенство:
H(SA,SB*)H(SA*,SB*) H(SA*,SB).
Отметим несколько важных свойств решений матричных игр.
Свойство 1. Игры, заданные платежными матрицами Н(1) и Н(2) одинаковой размерности, элементы которых, аij(1) и аij(2) связаны линейным соотношением: aij(1)=kaij(2)+b, где k, b - некоторые действительные числа, имеют одинаковые решения в смешанных стратегиях. Цены таких игр vS(1) и vS(2) связаны тем же соотношением: vS(1)=kvS(2)+b.
Указанное свойство позволяет упростить и придать наглядность платежной матрице какой-либо игры; в частности, можно избавиться от дробных элементов, сделать любую игру справедливой и т. п.
Свойство 2. Для любой матричной игры справедливо двойное неравенство:
vS (2.6)
где и - соответственно нижняя и верхняя цены игры, vS – цена игры в смешанных стратегиях.
В частности, для игры с седловой точкой неравенство (2.6) имеет вид двойного равенства.
Прежде чем формулировать третье свойство, введем в рассмотрение новое понятие.
Пусть SA*=(p1*,…,pm*), SB*=(q1*,…,qn*) - пара смешанных стратегий. Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от 0 вероятностью, то она называется активной ( полезной ).
Свойство 3. Пусть один из игроков придерживается своей оптимальной смешанной стратегии. Тогда выигрыш остается неизменным и равным цене игры vS, если другой игрок не выходит за пределы своих активных стратегий, т. е. когда он использует любую из смешанных стратегий ( в том числе, чистых ), в которую с ненулевыми вероятностями входят только его активные стратегии.
Это утверждение имеет большое практическое значение, оно лежит в основе многих конкретных способов решения матричных игр.