Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Игры с природой

.pdf
Скачиваний:
140
Добавлен:
01.06.2015
Размер:
440.34 Кб
Скачать

ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР

Игра – математическая модель конфликтной ситуации. В отличие от реальных конфликтных ситуаций, в математической модели игра ведется по заранее зафиксированным правилам и условиям.

Ход в игре – это выбор и осуществление одним игроком одного из предусмотренных правилами игры действий. В игре двух лиц ходы строго чередуются. Результат одного хода, как правило, еще не результат игры, а лишь изменение ситуации.

Стратегия – это последовательность всех ходов до окончания игры. Термин партия связан с частичной возможной реализацией правил.

Пусть в игре участвуют n игроков. В качестве игроков могут рассматриваться конкуренты на рынке, участники переговоров или сделки, коммерческие или иные партнеры и др. Обозначим выигрыш i -го игрока через ai . При этом положительное значение ai означает выигрыш или прибыль, отри-

цательное – проигрыш или убытки, а нулевое значение – ничья или нулевой результат финансовой операции.

Цель игры с точки зрения каждого игрока – максимизация своего выигрыша.

Стратегии бывают оптимальные, которые обеспечивают игроку наилучший результат, и неоптимальные.

Рассмотрим варианты классификации игр.

По механизму выбора ходов: игры бывают с осознанными (личными) или случайными (вероятностными) ходами или стратегиями.

Осознанные ходы характерны для людей и организаций. Таких игроков мы будем называть «осознанными». Они пытаются улучшить свою ситуацию, оптимизировать результат игры.

Вероятностными ходами моделируют варианты развития рыночной ситуации, погодных условий, поведения масс потребителей и сторонних организаций, принятие регламентирующих актов и т.п. Таких игроков будем называть «вероятностными», «случаем», «природой».

Так как игровая модель используется для выбора оптимальных решений, то хотя бы один игрок (с точки зрения которого рассматривается ситуация) предполагается «осознанным».

По количеству игроков: игры бывают парные ( n 2) и множествен-

ные ( n 2).

Замечание 1. Игр с единственным игроком не бывает. Классические примеры игр «с одним участником» (спортивных – теннис об стенку, карточных – раскладывание пасьянсов, логических и т.д.) на самом деле не являются примером игр с одним игроком. В этих играх вторым игроком выступает

1

«случай», без которого игра потеряла бы весь свой смысл или интерес. В случае одного игрока пропадает само понятие конфликтной ситуации.

Замечание 2. В ряде случаев для моделирования ситуации бывает допустимо свести множественную игру к парной. Рассмотрим пример: руководитель фирмы рассматривает варианты поведения на конкурентном рынке. Если конкурентов всего несколько (крупные рыночные игроки – большие компании или малые предприятия в небольшом поселке), то все они явно влияют друг на друга и моделировать их взаимодействие возможно лишь в виде множественной игры. Если же предприятий на рынке очень много, то поведение каждого из них оказывает, как правило, ничтожное влияние на других; в этом случае всех конкурентов можно рассматривать как одного совокупного «противника». Анализ парных игр как правило проще.

Взависимости от числа стратегий: игры делятся на конечные, если у игроков имеется конечное число стратегий, и бесконечные в противном случае.

Здесь важно понимать, что мы моделируем в виде «стратегий». Часто при первом рассмотрении число возможных стратегий поведения представляется неограниченным. Однако во многих случаях все их можно сгруппировать в ограниченное количество качественных групп. Например при рассмотрении варианта развития бизнеса с необходимой начальной инвестицией качественно возможны стратегии: брать или не брать кредит; привлекать или не привлекать партнеров; продавать или не продавать имущество и, возможно, еще несколько других. Размер же кредита, объем участия партнера и сумма продаваемого имущества являются числовыми характеристиками и могут рассматриваться как «доли» использования той или иной стратегии. Анализ игр с ограниченным количеством стратегий как правило проще.

По возможности использования сразу нескольких стратегий игры делят на игры со смешанными (смешиваемыми) стратегиями – когда игрок может выбрать сразу несколько стратегий в определенных пропорциях (долях) или игры с чистыми стратегиями, когда возможно выбрать лишь одну из стратегий. Примером игры со смешанными стратегиями является определение оптимальных пропорций инвестиций в ряд рекламных технологий. Игрой в чистых стратегиях является, например, выбор привлекаемого партнера при конфликтных отношениях между потенциальными кандидатами.

Взависимости от допустимых взаимоотношений игроков: игры делятся на кооперативные (в которых заранее определены коалиции), коалиционные (игроки могут вступать в соглашения) и бескоалиционные (игрокам нельзя вступать в соглашения).

Примером ситуации, моделируемой бескоалиционной игрой, можно считать поведение на рынке крупных операторов сотовой связи. Согласно антимонопольному законодательству, соглашения по многим вопросам меж-

2

ду ними запрещены. (Еще раз подчеркнем, что игра ведется по заранее определенным правилам и не учитывает отклонения от них). Поведение мелких фирм на рынке, очевидно, можно будет моделировать коалиционной игрой.

По источнику выигрыша: игры бывают с нулевой суммой, если одни выигрывают только за счет других.

Здесь опять же следует подчеркнуть важность модельности подхода для описания ситуации. Рассмотрим пример конкурентной борьбы нескольких фирм за возможность выполнения некоторых контрактов. Если суммы контрактов заранее неизвестны и зависят от предложений фирм, то всем конкурентам может достаться заказ при их соответствующих предложениях. В этом случае источником выигрыша (прибыли) можно считать заказчика. Совсем другая ситуация возникает, если сумма контрактов ограничена (и тем более, если она четко определена). В таком случае можно считать, что фирмы ведут борьбу за «общий котел» средств, и выигравшие заказы «отбирают» средства у тех, кому контракты не достанутся. Анализ игр с нулевой суммой как правило проще.

Проводя более частную, комбинированную, классификацию, можно выделить следующие виды игр.

Антагонистические игры – парные игры с нулевой суммой, то есть игры в которых участвуют только два игрока и один выигрывает за счет другого. Очевидно, антагонистические игры являются бескоалиционными, а оба игрока – осознанными. (Подумайте, почему).

Матричные игры – парные игры с ограниченным числом стратегий. В таком случае их результат можно записать в виде матриц (таблиц) результатов, получаемых в зависимости от реализации стратегий каждого игрока. В этой таблице стратегиям игрока, с точки зрения которого рассматривается игра, как правило соответствуют строки, а стратегиям второго игрока – столбцы.

В более узком смысле термин матричная игра закрепился за антагонистической парной игрой с ограниченным числом стратегий. В этом случае результат можно записать в виде одной матрицы, которая отражает не только выигрыш/проигрыш одного игрока, но и соответственный проигрыш/выигрыш его противника (так как один игрок выигрывает у другого).

Случай неантагонистической парной игры с ограниченным числом стратегий и осознанным поведением обоих игроков может быть записан в виде двух матриц, соответствующих выигрышам/проигрышам каждого игрока. Такие игры называются биматричными.

Случай парной игры с ограниченным числом стратегий, в которой второй игрок не заинтересован в результате и выбирает свои стратегии случайным образом называется игрой с природой. Такая игра так же записывается в виде одной матрицы результатов, которая отражает лишь выигрыши/проигрыши единственного осознанного игрока.

3

ИГРЫ С ПРИРОДОЙ

Игра с природой моделирует ситуацию, в которой два участника. Один из участников – человек или группа лиц с общей осознанной целью. Этот игрок называется статистик, его стратегиям мы будем сопоставлять строки матрицы результатов и обозначать их, как правило Ci или аббревиатурой,

соответствующей смыслу задачи. Второй участник – комплекс внешних условий, при которых статистику приходится принимать решение. Этого «игрока» называют природа. Состояния-стратегии природы будем обозначать как правило П j или осмысленной аббревиатурой. Природа безразлична

к выигрышу и не стремится обратить ситуацию в свою пользу.

Пусть у статистика имеется m возможных стратегий C1,C2 ,...,Cm ; природа может реализовать n различных состояний П1, П2 ,..., Пn .

Какое состояние природы будет реализовано в конкретном случае заранее неизвестно. Однако в некоторых случаях могут быть известны вероятности реализаций этих состояний.

Возможны три варианта постановки игры с природой.

1. Вероятности состояний природы известны и они зависят от того, какую стратегию выберет статистик. В этом случае для каждой ячейки таблицы кроме результата для статистика aij мы знаем параметр pij – вероятность то-

го, что реализуется состояние природы П j при условии, что статистик выберет стратегию Ci . Эти вероятности записывают в ту же ячейку таблицы как правило по диагонали от результата. Сумма вероятностей состояний природы в каждой строке равна единице:

pi1 pi2 pin 1.

Пример. Правительство рассматривает варианты вложения средств резервного фонда. Возможные варианты: краткосрочные облигации иностранного государства, валюта, инвестиции в промышленность. Результат операции зависит от экономической ситуации: курс валюты может расти или падать, может быть разный уровень инфляции и т.д. Очевидно, что вероятность той или иной ситуации зависит от выбора варианта вклада. Отметим, зависят именно вероятности развития той или иной ситуации, сама же экономическая ситуация остается неопределенной (так как на нее влияют многие другие причины).

В этом случае игру задают в виде таблицы с двумя значениями в каждой внутренней ячейке. Одно значение соответствует выигрышу статистика при выбранной им стратегии и сложившемся состоянии природы, а второе – вероятности данного состояния природы при выбранной им стратегии. Веро-

4

ятности записывают обычно меньшим шрифтом сверху или снизу ячейки

(см. Табл.1).

Таблица 1.

Игра с природой при известных вероятностях состояний природы, зависящих от выбора статистика

 

П1

 

П2

 

 

П j

 

 

Пn

 

C1

a11

p11

a12

p12

 

a1 j

p1 j

 

a1n

p1n

C2

a21

p21

a22

p22

 

a2 j

p2 j

 

a2n

p2 n

 

 

 

 

 

 

 

 

 

 

 

Ci

ai1

pi1

ai 2

pi 2

 

aij

pij

 

ain

pin

 

 

 

 

 

 

 

 

 

 

 

Cm

am1

pm1

am2

pm 2

 

amj

pmj

 

amn

pmn

2. Вероятности состояний природы известны и они не зависят от того, какую стратегию выберет статистик. В этом случае мы знаем параметры p j

вероятности того, что реализуется состояние природы П j и они не зависят от того, какая стратегия Ci выбрана. Эти вероятности записывают в таблицу в отдельную строку сверху или снизу строк результатов. Сумма вероятностей всех состояний природы равна единице:

p1 p2

pn 1.

Очевидно, что этот вариант является частным случаем первого вариан-

та, при котором все значения вероятностей в одном столбце равны:

p1 j p2 j

pmj p j .

Примером такой ситуации является выбор варианта вложения избыточных средств предпринимателем. Возможные варианты: валюта, ГКО, развитие производства. Несмотря на схожесть ситуации с прошлым примером, очевидно, что относительно небольшой вклад предпринимателя не повлияет на экономическую ситуацию в целом. В этом случае вероятности развития той или иной ситуации на рынке не зависят от выбора статистика.

В этом случае игру задают в виде таблицы только со значениями выигрыша статистика при выбранной им стратегии и сложившемся состоянии природы. Вероятности состояний природы (которые в этом случае едины для всего столбца) записывают отдельной строкой внизу или вверху таблицы. Эту строку обозначают, как правило Pj (см. Табл.2)

5

Таблица 2.

Игра с природой при известных вероятностях состояний природы, не зависящих от выбора статистика

 

П1

П2

 

П j

 

Пn

C1

a11

a12

 

a1 j

 

a1n

C2

a21

a22

 

a2 j

 

a2n

 

 

 

 

 

 

 

Ci

ai1

ai 2

 

aij

 

ain

 

 

 

 

 

 

 

Cm

am1

am2

 

amj

 

amn

Pj

p1

p2

 

p j

 

pn

3. Вероятности состояний природы неизвестны.

В этом случае игру задают в виде таблицы только со значениями выигрыша статистика при выбранной им стратегии и сложившемся состоянии природы. Вероятности состояний природы нигде не указывают:

Таблица 3.

Игра с природой при неизвестных вероятностях состояний природы

 

П1

П2

 

П j

 

Пn

C1

a11

a12

 

a1 j

 

a1n

C2

a21

a22

 

a2 j

 

a2n

 

 

 

 

 

 

 

Ci

ai1

ai 2

 

aij

 

ain

 

 

 

 

 

 

 

Cm

am1

am2

 

amj

 

amn

В качестве примера приведем такую ситуацию. Предприниматель планирует участвовать в обеспечении народных гуляний, которые намечены на 30 августа, питанием. Он должен заблаговременно закупить оборудование: холодильники для мороженого или бойлеры для горячего чая, заказать или не заказывать тенты для своих кафе и т.п. Очевидно, что оптимальный выбор оборудования зависит от погоды (жарко или холодно, солнечно или дождливо) в день гуляний. Заранее оценить вероятность погоды в конкретный день в конце лета представляется крайне проблематичным. Общая статистика предыдущих лет, дающая неплохие результаты для больших временных промежутков очень плохо «срабатывает» для одного конкретного дня.

6

Для выбора оптимальной стратегии в игре с природой мы будем использовать несколько критериев. Знание вероятностей необходимо лишь в одном из них. Для его использования в третьем варианте применяется правило неопределенности (принцип недостаточного основания) Лапласа, когда все состояния считаются равновероятными:

p1 p2

pn 1 n .

В таком случае эта постановка также является частным случаем 1 варианта. Игру с природой как и матричную игру можно упростить учитывая до-

минирование стратегий. Однако есть принципиальное отличие. В игре с природой можно отбрасывать только заведомо невыгодные (относительно других) стратегии статистика. При упрощении платежной матрицы нельзя отбрасывать никакие состояния природы, т.к. природа может реализовать любое из своих состояний независимо от того, выгодно это статистику или нет.

Рассмотрим несколько критериев выбора оптимальных стратегий при игре с природой. Каждый критерий наилучшим образом соответствует своей ситуации принятия решения и индивидуальным особенностям лица, принимающего решения. Вместе с тем возможно и использование совокупности нескольких критериев.

Важно отметить, что выбор оптимальных стратегий исключительно математическими методами, как правило, не производится. Тем не менее, эти методы дают возможность выделить из большого числа возможных вариантов наиболее предпочтительные, которые в дальнейшем необходимо анализировать с привлечением более сложных (например, экспертных или экспериментальных) методик. При смешиваемости стратегий Статистика результаты анализа позволяют наметить оптимальные пропорции долей использования лучших стратегий.

Вданном пособии будут рассматриваться задачи с небольшим количеством возможных стратегий статистика. Для целей освоения методов оценивания в качестве ответа к играм с природой договоримся записывать ту стратегию, которая чаще всего будет определяться как лучшая в отдельных критериях.

Вданном пособии буквенные обозначения параметров в критериях будут соответствовать латинским буквам их названий.

Критерии выбора стратегий при игре с природой

Все критерии продемонстрируем на игре с природой, соответствующей первому варианту постановки, как более общему.

Применение критериев рассмотрим на следующем примере. Фирма Исполнитель выполняет и сдает проект. На этапе выполнения возможны следующие стратегии: C1 – выполнение собственными силами; C2 – привлече-

7

ние только научных консультантов; C3 – привлечение только финансовых консультантов; C4 – привлечение научных и финансовых консультантов. Ре-

зультат сдачи проекта зависит от требовательности Заказчика, который может: П1 – не проводить экспертиз; П2 – провести только научную эксперти-

зу; П3 – провести научную и экономическую экспертизу; экономическая экспертиза без научной не проводится. Чем больше проверок проекта, тем меньший финансовый результат можно ожидать, особенно, если не были привлечены соответствующие эксперты (из-за устранения несоответствий, переносов сроков сдачи и т.п.). Однако и привлечение консультантов влечет дополнительные затраты. Известно, что Заказчик имеет некоторую степень доверия к консультантам и при их привлечении вероятность соответствующей проверки снижается. Заметим, что Заказчик в этой ситуации не имеет заинтересованности в финансовом результате работы Исполнителя и может рассматриваться как Природа. Несмотря на свою осознанность, он имеет свои собственные интересы – качественный результат выполнения заказа, сроки выполнения и т.п. Эти интересы слабо коррелируют с доходом Исполнителя, т.к. общая стоимость работ обычно оговаривается заранее.

Пусть финансовый результат для Исполнителя (в млн. руб.) и вероятности проверок Заказчика могут быть оценены заранее и сведены в таблицу игры с природой Таб. 4.

Таблица 4.

Игра с природой для примера Исполнитель – Заказчик

 

 

П1

 

П2

 

П3

C1

10

0,3

5

0,3

2

0,4

C2

7

0,6

6

0,1

4

0,3

C3

9

0,5

4

0,4

3

0,1

C4

6

0,8

6

0,1

5

0,1

Рассмотрим несколько значений в ячейках таблицы.

Значения 10 и 0,3 в ячейке C1 П1 показывают, что если Исполнитель выполнит проект самостоятельно, а Заказчик не будет организовывать проверок, то Исполнитель получит 10 млн. руб. Вероятность того, что Заказчик не будет организовывать проверку, если Исполнитель выполнил работу самостоятельно, равна 0,3 или 30%.

Если же в этом случае Заказчик организует обе проверки (ячейка C1 П3 ), то финансовый результат фирмы-исполнителя падает до 2 млн. руб.

из-за необходимости значительной доработки проекта. Вероятность такого события при самостоятельном выполнении работ равна 0,4 или 40%.

8

Значения 5 и 0,1 в ячейке C4 П3 показывают, что если Исполнитель привлечет к проекту научных и финансовых консультантов, то при организации обеих проверок Исполнитель получит уже 5 млн. руб., так как проект будет выполнен с учетом многих требований. Вероятность того, что Заказчик будет организовывать обе проверки в этом случае равна 0,1 или 10%. Если же в этом случае Заказчик не будет организовывать экспертной проверки вовсе (вероятность чего очень велика и равна 0,8 или 80%), то выигрыш фир- мы-исполнителя составит только 6 млн. руб., а не 10, так как велики будут расходы на привлечение консультантов.

Критерий Байеса (Bayes) (статистический, наибольшего среднего результата, максимального математического ожидания)

В этом критерии для каждой стратегии (строки) определяется средний ожидаемый результат как сумма произведений вдоль строки результатов на их вероятности:

Bi pi1 ai1 pi2 ai2

pin ain

Лучшей по критерию Байеса считается та стратегия, для которой этот результат наибольший:

BI max Bi

 

CI The best (Bayes)

i

 

 

Место критерия Байеса. Как следует из сути и альтернативных названий этого критерия, он наилучшим образом соответствует ситуации многократной повторяемости, когда лучший средний результат приведет к лучшему общему итогу. Если рассматриваемая ситуация выбора решения будет часто повторяться при неизменных условиях, то выбор наилучшей стратегии по критерию Байеса представляется наилучшим. В остальных случаях этот критерий разумно использовать лишь как ориентировочный.

Отметим, что только в этом критерии используются значения вероятностей состояний. В остальных критериях используются только значения выигрышей.

Применим критерий Байеса к нашему примеру.

B1 0,3 10 0,3 5 0,4 2 5,3

B2 0,6 7 0,1 6 0,3 4 6,0

B3 0,5 9 0,4 4 0,1 3 6,4

B4 0,8 6 0,1 6 0,1 5 5,9

BI max(5,3; 6,0; 6,4; 5,9) 6,4 B3

C3 The best (Bayes)

Таким образом, по критерию Байеса наилучшей является стратегия C3 , то есть средний лучший результат приносит стратегия привлечения только финансовых консультантов.

9

Если фирма-исполнитель постоянно выполняет аналогичные проекты для схожих заказчиков, то общий результат деятельности будет наилучшим при выборе именно третьей стратегии. Если такой заказ имеет разовый характер, то критерий Байеса является менее предпочтительным.

Критерий Вальда (Wald) (пессимизма, наибольшего худшего результата, максимина)

В этом критерии для каждой стратегии (строки) определяется

наименьший достижимый результат как минимальный элемент в строке:

Wi min

aij min aij

 

j

строка

Лучшей по критерию Вальда считается та стратегия, для которой этот

результат наибольший:

 

 

WI maxWi

 

CI The best (Wald)

i

 

 

Место критерия Вальда. Как следует из сути и альтернативных названий этого критерия, он наилучшим образом подходит для ситуации, в которой необходимо получить наименее «плачевный» результат в самом худшем случае, максимум минимального дохода или минимум максимальных потерь. Критерий соответствует пессимистично настроенному лицу, принимающему решения, когда для него страх проигрыша значительно важнее выигрыша. Выбирая стратегию по критерию Вальда мы можем твердо рассчитывать на полученный при ее определении результат даже при самом плохом стечении обстоятельств.

Применим критерий Вальда к нашему примеру.

W1 min 10; 5; 2 2 W2 min 7; 6; 4 4 W3 min 9; 4; 3 3 W4 min 6; 6; 5 5

WI max(2; 4; 3; 5) 5 W4

C4 The best (Wald)

Таким образом, по критерию Вальда наилучшей является стратегия C4 , то есть при привлечении научных и финансовых консультантов мы в самом худшем случае получим наибольший выигрыш.

Критерий оптимизма (максимакса, крайнего оптимизма)

В этом критерии для каждой стратегии (строки) определяется

наибольший достижимый результат как максимальный элемент в строке:

Oi max aij max

aij

j

строка

 

 

10