- •Московский Государственный открытый университет
- •Понятие хозяйственного механизма
- •Базовая модель
- •Общая схема формализации процессов моделирования хозяйственного механизма
- •Лекция 2 Базовая модель в контексте формализованной схемы моделирования хозяйственного механизма
- •Производственные функции. Агрегирование и дезагрегирование
- •Лекция 3 Синергетический эффект
- •Эффективность создания совместного производства (системы)
- •Механизм инноваций
- •Лекция 4 Многокритериальные задачи
- •Поиск эффективных точек
- •Лекция 5
- •Формализация основных понятий Теории Игр.
- •Принцип Оптимальности
- •Принятие решений
- •Принцип Оптимальности
- •2 Фирма
- •1 Фирма
- •Роль информированности. Формализация информированности в виде стратегии
- •Лекция 6 Ситуация равновесия по Нэшу в информационном расширении игры
- •Формальное определение
- •Информационное расширение игры
- •Примеры проектирования множества стратегий на множество управлений (выборов, исходов)
- •Ситуация равновесия по Нэшу в информационном расширении игры
- •2 Фирма
- •1 Фирма
- •Лекция 7 Иерархические системы управления
- •Обобщенный принцип максимального гарантированного результата (оп мгр)
- •Иерархическая игра (игра Гермейера)
- •Экономическая интерпретация иерархических игр г1, г2и г3
- •Лекция 8 Теоретико-игровой анализ двухуровневой иерархической системы управления (ису)
- •2.Аналог игры
- •Лекция 9 Динамические модели принятия решений
- •Слабоустойчивые совместные решения по ю. Б. Гермейеру
- •Динамическая модель принятия решений с непрерывным временем
- •Оптимизация процесса контроля (наблюдения)
- •Литература
- •Лекция 10 Управление ису при неточном знании параметров подсистем
Иерархическая игра (игра Гермейера)
Иерархическая игра определяется следующими правилами (предполагается, что игрок 1 – начальник, игрок 2 – подчиненный):
Игрок 1 знает все параметры модели игрока 2, то есть множество и функцию выигрыша.
Игрок 1 делает свой ход первым, то есть выбирает стратегию и сообщает информацию о ней игроку 2.
Игрок 2 при известной ему стратегии выбирает, то есть максимизирует свой критерий.
При наличии неопределенных факторов (в данном случае – неоднозначного выбора 2-го игрока из множества ) игрок 1 действует исходя из ОП МГР (4), а в случае доброжелательности игрока 2 в соответствии с (6).
На основании этих предположений в зависимости от информации о выборах 2-го игрока, которую игрок 1 имеет или ожидает иметь, формулируются разные игры. Рассмотрим их.
Игра . В этой игре: , то есть ни один из игроков заранее не знает о выборе другого. Здесь игрок 1 выбираети сообщает об этом игроку 2, а он в свою очередь выбирает(множество точек, которое доставляет максимум функции)
Тогда в этой игре МГР 1-го игрока:
- оптимальное управление (стратегия), определяемая условием:
В случае доброжелательности игрока 2 МГР игрока 1 равен
,
а оптимальная стратегия определяется из условия
Можно «стимулировать» доброжелательность, используя побочный платеж . В этом случае, функция выигрыша игрока 2 примет вид:
Аналогичный прием можно использовать в играх и (смотри далее).
Игра . В этой игре , то есть игрок 1 перед выбором своей стратегии будет знать выбор игрока 2. Таким образом, стратегия 1-го игрока выглядитследующим образом:
Игра . В этой игре , то есть игрок 2 перед выборомзнает. Стратегия 2-го игрока:
Однако первый игрок знает правило поведения 2-го () и поэтому его стратегия будет такой:
Замечание 5.
В играх и оптимальный выигрыш 1-го игрока определяется формулой (4). Таким образом, решение игр и сводится к вариационным и более сложным задачам. Однако далее мы конструктивно определим решение этих игр на исходном множестве управлений.
Замечание 6.
Можно рассматривать игры ,,.... Но оказывается, что ситуация 4 сводится к ситуации 2, ситуация 5 сводится к ситуации 3, а ситуация 6 сводится к ситуации 4 и т.д., то есть;
Из этого следует, что просчет вариантов действий в глубину не следует делать больше трех, дальше все повторяется.
Экономическая интерпретация иерархических игр г1, г2и г3
Игра . Эта игра моделирует процесс управления ценами на произведенную продукцию и затрачиваемые ресурсы:
где x – ресурс,
p(x) – продукция,
- цена на продукцию,
- цена на ресурс.
Пусть фиксирована.
Найти такую, чтобыло выгодно игроку 2.Из необходимого условия экстремума имеем:
Если , то
,
Игра . Эта игра моделирует процесс управления штрафами, поощрениями.
Опять пусть
«+» - премия, «-» - штраф, налог.
Тогда стимулирование выбора можно, например, произвести следующим образом (для определенности- штраф)
Игра . Эта игра моделирует процесс выдачи ресурсов, кредитования под обоснованную программу их использования
Пусть игрок 1 стимулирует реализацию ситуации . Тогда он должен стимулировать игрока 2 выбрать программуиспользования выделяемого ресурса:
где - произвольная функция.
Игроку 1 важно только, что выделяемый ресурс используется игроком 2 следующим образом. Поэтому оптимальная стратегия игрока 1 имеет вид
Как уже
Решение игр и сводится к вариационным и более сложным задачам. Однако далее мы конструктивно определим решение этих игр на исходном множестве управлений.
Игра Г2.
В этой игре , т.е. игрок 1 до выбора
имеет информацию о .
Поэтому стратегии игрока 1 – функции
Для игрока 2 имеем
Вспомогательные конструкции.
Стратегия наказания:
определяется из условия:
Максимально гарантированный результат (МГР) подчиненного равен
Множество исходов выгодное подчиненному
Исходы (x1, x2 ) вне этого множества не устраивают игрока 2 и он всегда может добиться выигрыша не меньше, чем L2 , выбирая x2 = xˆ2 из условия
Определим из равенства
Наконец определим
=
Отметим, что
Теорема 1.
При условии доброжелательности , оптимальный выигрыш игрока 1 в игре Г2,равен К2, а (- его оптимальная стратегия.
Доказательство:
При известной стратегии (игрок 2 получит:
- если , то и .
- если же игрок 2 выберет , то его выигрыш не превысит
.
Если , то множество R2 () состоит из единственной точки .
В случае множество R2 () содержит выборыx2 , в том числе , эквивалентные для игрока 2 . В силу доброжелательности игрока 2 , он выберет точку - выгодную для игрока 1.
Итак, в условиях теоремы игроку1 гарантируется исход , приводящий к выигрышу =
Покажем, что К2 - максимальный гарантированный выигрыш.
Действительно, если исход () приводит к() >,
то он лежит вне множества D2 по определению
Но вне множества D2 выигрыш игрока 2 оценивается величиной
() .
Это не выгодно игроку 2 и он всегда может выбором получить .
Теорема доказана.
Замечание 2.
Условие доброжелательности может быть опущено, если множество является замыканием не пустого множества
= {( )× | () >}
Действительно, в этом случае даже, если () = L2, можно «скорректировать» оптимальную стратегию, заменив ее стратегией
Где точка (,) удовлетворяет условиям:
(,
(,
,
величина определяет затраты игрок 1 на стимуляцию игрока 2.
Механизмом такой стимуляции может служить «побочный платеж».
() обещанный начальником подчиненному.
Игра
В этой игре игрок 2 знает выбор игрока 1 до своего выбора , т.е.:,=(). В свою очередь игрок 1 знает такое правило поведения игрока 2, т.е.
Вспомогательные конструкции.
Определим МГР игрока 2:
Далее определим стратегию наказания (стратегию наихудшую для игрока 2)
из условия
В игре взаимовыгодное множествоопределяется равенством
= {( )× ≥ }
Напомним, что всегда ≥ , поэтому . Определим исход () из условия
К3 =
Построим стратегию игрока 2:
где произвольная функция.
Оптимальная стратегия игрока 1имеет вид:
Содержательно игрок 1 выберет (выдает кредит), если игрок 2 использует этот кредит выбором=,при этом игрок 2 получает(,) ≥
В противном случае игрок 1 выбирает и игрок 2 не получит больше .
Теорема 2.
При условии доброжелательности игрок 2 оптимальный выигрыш игрока 1 в игре равен, а – его оптимальная стратегия.
Доказательство.
Аналогично доказательству теоремы 1.
Замечание 1 и 2 к теореме 1 справедливы и для теоремы 2.
Кроме того, в силу ≤ имеем ≥, то есть выигрыш игрока 1 в игребольше или равен его выигрышу в игре.
Упражнение.
Докажите, что если в антагонистической игре ,
существует седловая точка, то
Пример.
Ранее на этом примере, мы строили ситуации равновесия на сложных стратегиях. Теперь проиллюстрируем решение иерархических игр.
Игра
Определим множества рациональных ответов игрока 2.
(1) = 3, (1,3) = 7,(1,3) = 2
(2) = 2, (2,2) = 4,(2,2) = 4
(3) = 2, (3,2) = 3,(3,2) = 0
Тогда
max min () = max [2,4,0]=4
={1,2,3} ()={1,2,3} ,
при =2,=2
Замечание.
Решение игры совпало с ситуацией равновесия по Нэшу на управлениях. В общем случае в этой игре можно получить выигрыш, равный выигрышу в наилучшей для игрока ситуации равновесия и даже больше.
Игра
В этом случае = max min () = 0,
φ1н(х2) =
К2 = () =(3,1) = 7, что соответствует глобальному максимуму М1.
Оптимальная стратегия игрока 1:
φ10(х2) =
Выигрыш игрока 2 равен () =(3,1) = 2>0 =
Игра Г3.
В этой игре = min max () = 3
Стратегия наказания
Оптимальный выигрыш игрока 1 определяется следующим образом:
Построим стратегию игрока 2:
где произвольная функция.
Оптимальная стратегия игрока 1имеет вид:
При этом игрок 2 получит (1,1) = 6 > 3=.
Заметим, что в этом примере = 6 < 7 =
Пример:
У 1 игрока - 3 стратегии
2 игрока - 3 стратегии
1игрок выбирает строки
2 игрок выбирает столбцы
Слева - выигрыш 1
Справа – выигрыш 2
max гарантированный результат:
При условии, что 1 игрок выбирает строку
Отметим по строкам, где выигрыш 2 игрока max
Отметим по столбцам, где выигрыш 1 игрока max
Ст1 = 4
Пример:
Ст1 = 3
max 1игрока из отмеченных
Пример:
отрезки
Решение:
Найдем
Y
X
1
Пример:
Предприятие производит некую продукцию, для этого необходимо что-нибудь затратить
Пример:
1 |
2 |
3 |
1 |
2 |
3
| |
|
1 |
1 |
1 |
(6,6) |
(0,0) |
(2,7) |
1 |
1 |
2 |
(6,6) |
(0,0) |
(3,0) | |
1 |
1 |
3 |
(6,6) |
(0,0) |
(0,0) | |
1 |
2 |
1 |
(6,6) |
(4,4) |
(2,7) | |
1 |
2 |
2 |
(6,6) |
(4,4) |
(3,0) | |
1 |
2 |
3 |
(6,6) |
(4,4) |
(0,0) | |
1 |
3 |
1 |
(6,6) |
(0,3) |
(2,7) | |
1 |
3 |
2 |
(6,6) |
(0,3) |
(3,0) | |
1 |
3 |
3 |
(6,6) |
(0,3) |
(0,0) | |
2 |
1 |
1 |
(0,0) |
(0,0) |
(2,7) | |
2 |
1 |
2 |
(0,0) |
(0,0) |
(3,0) | |
2 |
1 |
3 |
(0,0) |
(0,0) |
(0,0) | |
2 |
2 |
1 |
(0,0) |
(4,4) |
(2,7) | |
2 |
2 |
2 |
(0,0) |
(4,4) |
(3,0) | |
2 |
2 |
3 |
(0,0) |
(4,4) |
(0,0) | |
2 |
3 |
1 |
(0,0) |
(0,3) |
(2,7) | |
2 |
3 |
2 |
(0,0) |
(0,3) |
(3,0) | |
2 |
3 |
3 |
(0,0) |
(0,3) |
(0,0) | |
3 |
1 |
1 |
(7,2) |
(0,0) |
(2,7) | |
3 |
1 |
2 |
(7,2) |
(0,0) |
(3,0) | |
3 |
1 |
3 |
(7,2) |
(0,0) |
(0,0) | |
3 |
2 |
1 |
(7,2) |
(4,4) |
(2,7) | |
3 |
2 |
2 |
(7,2) |
(4,4) |
(3,0) | |
3 |
2 |
3 |
(7,2) |
(4,4) |
(0,0) | |
3 |
3 |
1 |
(7,2) |
(0,3) |
(2,7) | |
3 |
3 |
2 |
(7,2) |
(0,3) |
(3,0) | |
3 |
3 |
3 |
(7,2) |
(0,3) |
(0,0) |
Ответ:
Пример:
Пример:
Определим
Ответ: (1,1)
Пример: