- •Лекция 1 Основные принципы излагаемого подхода к теории систем
- •Понятие хозяйственного механизма
- •Базовая модель
- •Общая схема формализации процессов моделирования хозяйственного механизма
- •Лекция 2 Базовая модель в контексте формализованной схемы моделирования хозяйственного механизма
- •Производственные функции. Агрегирование и дезагрегирование
- •Лекция 3 Синергетический эффект
- •Эффективность создания совместного производства (системы)
- •Механизм инноваций
- •Лекция 4 Многокритериальные задачи
- •Логическое объединение качественных целей.
- •Поиск эффективных точек
- •Принцип Оптимальности
- •Формальное определение
- •2 Фирма
- •1 Фирма
- •Роль информированности. Формализация информированности в виде стратегии
- •Лекция 6 Ситуация равновесия по Нэшу в информационном расширении игры
- •Информационное расширение игры
- •Примеры проектирования множества стратегий на множество управлений (выборов, исходов)
- •Ситуация равновесия по Нэшу в информационном расширении игры
- •Лекция 7 Иерархические системы управления
- •Обобщенный принцип максимального гарантированного результата (оп мгр)
- •Иерархическая игра (игра Гермейера)
- •Экономическая интерпретация иерархических игр г1, г2 и г3
- •Лекция 8 Теоретико-игровой анализ двухуровневой иерархической системы управления (ису)
- •Аналог игры
- •2.Аналог игры
- •Лекция 9 Динамические модели принятия решений
- •Слабоустойчивые совместные решения по ю. Б. Гермейеру
- •Динамическая модель принятия решений с непрерывным временем
- •Оптимизация процесса контроля (наблюдения)
- •Литература
- •Лекция 10 Управление ису при неточном знании параметров подсистем
Литература
Ю.Б. Гермейер «Игры с непротивоположными интересами». Изд-во «Наука». Москва. 1976.
Кононенко А.Ф. Постановка задачи. Модель с непрерывным временем. //Соврем. состояние теории исследования операций: М.: Наука, 1979.с.173-179.
Кононенко А.Ф. О задаче наблюдения в повторяющихся операциях // Соврем. состояние теории исследования операций: М.: Наука, 1979.с.179-182.
Лекция 10 Управление ису при неточном знании параметров подсистем
Как уже было отмечено для решения вопроса о целесообразности построения иерархической системы управления(ИСУ) необходимо сравнить максимальный гарантированный результат(МГР) центра при централизованном и (частично) децентрализованном способах управления. При этом учитывается влияние неопределённых факторов. Для этого будем считать, что выигрыш центра определяется функцией ,где –управляющие параметры центра; удовлетворяющие ограничениям ,i=1,2, а α-неопределённый параметр, про который центру известно только, что α∊А.
Тогда, следуя принципу МГР, центр оценивает свой выигрыш величиной
При децентрализованном способе управления центр передаёт нижнему уровню право выбора параметра .Пусть обмен информацией (в том числе и о величине α) между уровнями приводит к усложнению класса стратегий ,i=1,2.
Основываясь на предположении о рациональном поведении элементов нижнего уровня центр может построить множество откликов на свою стратегию. В этом случае принцип МГР позволяет оценить выигрыш центра величиной:
В случае полной информированности А= всегда имеет место неравенство .
Однако в более реальном случае наличия неопределённости возможны любые из трёх соотношений: , , .
Выполнение какого-либо одного из них определяется ,во-первых, самой моделируемой ситуацией (функцией , множествами и, во-вторых, тем насколько удачен выбор процедур обмена информацией (множествами ).
В отличие от традиционных постановок задач принятия решений в условиях неопределённости будем изучать вопросы выбора рациональных решений в условиях наличия неопределённости, которую назовём субъективной.
Субъективная неопределённость характеризуется тем, что во-первых подсистемы имеют различную информированность о неопределённых факторах: о параметрах системы и её элементов, о влиянии на систему внешней среды, и во-вторых учитывается возможность и целесообразность обмена информацией о действиях элементов(т.е. о выборе ими управлений),о параметрах, описывающих влияние внешней среды.
Обмен информацией производится только в своих интересах, следовательно, не исключается возможность отказа от сообщения какой-либо информации или сообщения ложной информации.
Замечание 1. Обмен информацией о неточно известных параметрах формализуется, как дополнительный элемент стратегии, то есть приводит к расширению самого понятия стратегии. Целесообразность такого расширения проиллюстрируем на следующем простом примере иерархической игры.
Пример.
Пусть выигрыш игрока 1(центра) описывается функцией , множества выборов игроков имеют вид
Функция выигрыша игрока 2(подчиненного) неизвестно игроку 1, который только знает, что она равна одной из двух функций
Таким образом с точки зрения игрока 1:
, ,
Истинное значение или не известно игроку 1, но известно игроку 2.
В описанных условиях на классе стратегий игрок 1 не может получить гарантированно глобальный максимум
при , .
Действительно, при , игроку 1 одинаково выгодно выбирать или . Однако игрок 2 при одном из этих выборов может получить глобальный минимум. Следовательно, выбору он предпочтёт выбор . Поэтому в данном случае обоим игрокам выгоден обмен информацией, о том какую именно функцию максимизирует игрок 2. Рассчитывая на получение такой информации(обозначим её через τ) игрок 1 выберет и сообщит игроку 2 стратегию
Которая вместе с выбором игрока 2 и сообщении им истинной информации о своей функции выигрыша игроку 1 гарантирует обоим игрокам получение глобального максимума.
Далее предполагается, что игрок 2 может сообщить игроку 1 любое значение (не обязательно ) Если он не сообщает такой информации, то игрок 1 формально, по своему усмотрению присваивает этой величине какое-то значение из множества А.
Итак, будем считать что = , = ,то есть игрок 1 до выбора будет знать точную информацию о и какую-то информацию о .
Итак, рассмотрим игру , где как и ранее проекция: 𝜋: ,
Введём некоторые обозначения
,α)≥
Стратегия наказания:
( ,α)=
Далее будем считать, что выполняются следующие условия:
Знание игроком 1 множества А не противоречит объективному описанию модели, т.е. истинное значение неопределённого параметра принадлежит этому множеству
Подчинённый (игрок 2) доброжелателен к начальнику - центру (игроку 1).Это условие как и ранее можно заменить условиями, справедливыми при всех α∊А
-множества
-замыкание –множество = .
Стратегия наказания не зависит от параметра α
.
Построим стратегию
(
В этой стратегии наказание реализуется, если игрок 2 не сообщил информацию о неопределённом параметре, т.е. или сообщив информацию 𝜏∊А выбрал ≠ (𝜏).
Замечание 2. Независимость стратегии наказания от неопределённого параметра не является жёстким ограничением для экономических моделей. Наказание-это выбор минимального значения цены и поощрения, либо максимального штрафа и т.д.
Замечание 3. Как и ранее предполагаем, что максимумы и минимумы в соответствующих выражениях достигаются.
Теорема. В сформулированных условиях МГР игрока 1 равен
и достигается путём выбора игроком 1 оптимальной стратегии
Доказательство. Игрок 2 может выбрать лучшую для себя пару , т.е. его выигрыш оценивается величиной
Если же игрок 2 ослушается начальника-игрока 1,то при любом
В силу доброжелательности или как часто бывает в силу строгого неравенства
игрок 2 с гарантией для игрока 1 выберет наилучшую для себя пару что в свою очередь гарантирует игроку 1 выигрыш
Итак, результат гарантируется игроку 1. На больший результат он рассчитывать не может, так как при известном может получить не больше и рассчитывая на худшее для себя он не может ожидать выйгрыша более чем
Теорема доказана.
Экономные процедуры обмена информацией
Пусть , где размерность вектора . Если велико, то передача и анализ информации о вызывает большие технические трудности и экономические затраты.
Поэтому целесообразно исследовать вопрос об эффективности принятия решений по агрегированной информации, например, вида , где y – агрегированная информация о выборе игрока 2,
- линейный невырожденный оператор:
, ,
Например:
Здесь ,
Обозначим
образ множества в пространстве .
Таким образом стратегия игрока 2 по прежнему определяется выбором , то есть
Множество стратегий игрока 1 состоит из выбора целого числа , ,
выбора оператора и выбора функции .
Кроме того, зададим монотонно неубывающую функцию, например, вида , которая имеет смысл платы за пользование каналами связи, где
c – стоимость инфраструктуры, обеспечивающей передачу информации,
d – оплата одного канала связи,
- число каналов связи(по размерности вектора ).
Целью игрока 1 является максимизация значения функции
Поясним постановку и решение задачи на примере.
Пример:
Пусть функции выигрыша игроков линейны по их управлениям:
,
,
где управления игрока 1:
, ,
а игрока 2:
, .
Наложим на параметры задачи ограничения:
,
Последнее ограничение обеспечивает выигрыш игроку 2 (в оптимальной точке), превышающий величину
В нашей линейной модели
а стратегия наказания имеет вид:
Обозначим оптимальный выигрыш игрока 1 при соответственно .
При получаем игру , решение которой имеет вид
Оптимальный (рациональный) выбор игрока 2 определяется равенствами
или покоординатно
При имеет игру , в которой оптимальная стратегия игрока 1 имеет вид
=
Оптимальный выигрыш игрока 1 равен
а выигрыш игрока 2
превышает величину в силу наложенного условия
Наконец, при и выборе оператора
игрок 1 обеспечивает себе выигрыш
выбором оптимальной стратегии
=
При этом игрок 2 опять получит строго больше своего МГР.
Заметим, что всегда
Более того в линейной модели при любой размерности вектора игроку 1 достаточно иметь всего лишь один канал связи и ничего не потерять в выигрыше!
Определим условия на параметры модели, при которых
Используя выражения для оптимального выигрыша игрока 1 во всех этих случаях, имеем:
Из первого неравенства получим:
А из второго
Окончательно имеем:
В этом случае суммарный выигрыш игрока 1 от действий игрока 2 больше половины стоимости обслуживания одного канала, но меньше его полной стоимости.
Задача. Подобрать численные значения параметров модели, при которых:
Пусть в пространстве критериев множество выигрышей задается ломаной OABCDO.
Тогда отрезок BC – определяет множество эффективных точек, отрезок AB – слабоэффективных точек.
Заметим, что для эффективной точки а строго положительный ортант не содержит других точек.
1
2