Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие-20007.docx
Скачиваний:
49
Добавлен:
19.03.2015
Размер:
1.04 Mб
Скачать

Литература

1. Ю.Б. Гермейер «Игры с непротивоположными интересами». Изд-во «Наука». Москва. 1976.

Лекция 10 Управление ису при неточном знании параметров подсистем

Как уже было отмечено для решения вопроса о целесообразности построения иерархической системы управления(ИСУ) необходимо сравнить максимальный гарантированный результат(МГР) центра при централизованном и (частично) децентрализованном способах управления. При этом учитывается влияние неопределённых факторов. Для этого будем считать, что выигрыш центра определяется функцией ,где–управляющие параметры центра; удовлетворяющие ограничениям,i=1,2, а α-неопределённый параметр, про который центру известно только, что α∊А.

Тогда, следуя принципу МГР, центр оценивает свой выигрыш величиной

При децентрализованном способе управления центр передаёт нижнему уровню право выбора параметра .Пусть обмен информацией (в том числе и о величине α) между уровнями приводит к усложнению класса стратегий,i=1,2.

Основываясь на предположении о рациональном поведении элементов нижнего уровня центр может построить множество откликов на свою стратегию. В этом случае принцип МГР позволяет оценить выигрыш центра величиной:

В случае полной информированности А=всегда имеет место неравенство.

Однако в более реальном случае наличия неопределённости возможны любые из трёх соотношений: ,,.

Выполнение какого-либо одного из них определяется ,во-первых, самой моделируемой ситуацией (функцией , множествамии, во-вторых, тем насколько удачен выбор процедур обмена информацией (множествами).

В отличие от традиционных постановок задач принятия решений в условиях неопределённости будем изучать вопросы выбора рациональных решений в условиях наличия неопределённости, которую назовём субъективной.

Субъективная неопределённость характеризуется тем, что во-первых подсистемы имеют различную информированность о неопределённых факторах: о параметрах системы и её элементов, о влиянии на систему внешней среды, и во-вторых учитывается возможность и целесообразность обмена информацией о действиях элементов(т.е. о выборе ими управлений),о параметрах, описывающих влияние внешней среды.

Обмен информацией производится только в своих интересах, следовательно, не исключается

Далее предполагается, что игрок 2 может сообщить игроку 1 любое значение .Если он не сообщает такой информации, то игрок 1 формально, по своему усмотрению присваивает этой величине какое-то значениеиз множества А.

Итак, будем считать что =,=,то есть игрок 1 до выборабудет знать точную информацию ои какую-то информацию о.

Итак, рассмотрим игру , где как и ранее проекция:

𝜋:,

Введём некоторые обозначения

,α)≥

Стратегия наказания:

(,α)=

Далее будем считать, что выполняются следующие условия:

Знание игроком 1 множества А не противоречит объективному описанию модели, т.е. истинное значениенеопределённого параметра принадлежит этому множеству

Подчинённый (игрок 2) доброжелателен к начальнику - центру (игроку 1).Это условие как и ранее можно заменить условиями, справедливыми при всех α∊А

-множества

-замыкание –множество=.

Стратегия наказания не зависит от параметра α

.

Построим стратегию

(

В этой стратегии наказание реализуется, если игрок 2 не сообщил информацию о неопределённом параметре, т.е. или сообщив информацию𝜏∊А выбрал(𝜏).

Замечание 2.Независимость стратегии наказания от неопределённого параметра не является жёстким ограничением для экономических моделей. Наказание-это выбор минимального значения цены и поощрения, либо максимального штрафа и т.д.

Замечание 3.Как и ранее предполагаем, что максимумы и минимумы в соответствующих выражениях достигаются.

Теорема. В сформулированных условияхМГР игрока 1 равени достигается путём выбора игроком 1 оптимальной стратегии

Доказательство. Игрок 2 может выбрать лучшую для себя пару , т.е. его выигрыш оценивается величиной

Если же игрок 2 ослушается начальника-игрока 1,то при любом

В силу доброжелательности или как часто бывает в силу неравенства

Игрок 2 с гарантией для игрока 1 выберет наилучшую для себя пару что в свою очередь гарантирует игроку 1 выигрыш

Итак, результат гарантируется игроку 1. На больший результат он рассчитывать не может, так как при известномможет получить не большеи рассчитывая на худшее для себяон не может ожидать выйгрыша более чем

Теорема доказана.

Экономные процедуры обмена информацией.

Пусть , гдеразмерность вектора. Есливелико, то передача и анализ информации овызывает большие технические трудности и экономические затраты.

Поэтому целесообразно исследовать вопрос об эффективности принятия решений по агрегированной информации, например, вида , гдеy– агрегированная информация о выборе игрока 2,

- линейный невырожденный оператор:

,,

Например:

Здесь ,

Обозначим

образ множества в пространстве.

Таким образом стратегия игрока 2 по прежнему определяется выбором , то есть

Множество стратегий игрока 1 состоит из выбора целого числа ,;

Выбора оператора и выбора функции.

Кроме того, зададим монотонно неубывающую функцию, например, вида , которая имеет смысл платы за пользование каналами связи, где

c– стоимость инфраструктуры, обеспечивающей передачу информации,

d– оплата одного канала связи,

- число каналов связи(по размерности вектора).

Целью игрока 1 является максимизация значения функции

Поясним постановку и решение задачи на примере.

Пример:

Пусть функции выигрыша игроков линейны по их управлениям:

,

,

Где уравнения игрока 1:

,,

А игрока 2:

,.

Наложим на параметры задачи ограничения:

,

Последнее ограничение обеспечивает выигрыш игроку (в оптимальной точке), превышающий величину

В нашей линейной модели

А стратегия наказания имеет вид:

Обозначим оптимальный выигрыш игрока 1 при соответственно.

При получаем игру, решение которой имеет вид

Оптимальный (рациональный) выбор игрока 2 определяется равенствами

При имеет игру, в которой оптимальная стратегия игрока 1 имеет вид

=

Оптимальный выигрыш игрока 1 равен

А выигрыш игрока 2

Превышает величину в силу наложенного условия

Наконец, при и выборе оператора

Игрок 1 обеспечивает себе выигрыш

Выбором оптимальной стратегии

=

При этом игрок 2 опять получит строго больше своего МГР.

Заметим, что всегда

Более того в линейной модели при любой размерности вектораигроку 1 достаточно иметь всего лишь один канал связи и ничего не потерять в выигрыше!

Определим условия на параметры модели, при которых

Используя выражения для оптимального выигрыша игрока 1 во всех этих случаях, имеем:

Из первого неравенства получим:

А из второго

Окончательно имеем:

Задача. Подобрать численные значения параметров модели, при которых:

1

2

100