Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие-20007.docx
Скачиваний:
49
Добавлен:
19.03.2015
Размер:
1.04 Mб
Скачать

Лекция 8 Теоретико-игровой анализ двухуровневой иерархической системы управления (ису)

Итак мы провели анализ элементарной ячейки иерархической системы управления (ИСУ). Сначала был рассмотрен вариант взаимодействия элементов, находящихся на одном уровне иерархии, затем – на разных уровнях.

В достаточно общей постановке анализ двухуровневой статической модели ИСУ сводится к решению игры n+1 лица, определяемой следующими параметрами:

1⁰ Задано множество игроков .

Подмножества определяют верхний и нижний уровни иерархии. Центр (Игрок) обладаем правом первого хода, т.е. первым выбирает и сообщает своюстратегию элементу нижнего уровня .

2⁰ Вектора определяют управляющие параметры.набор управлений всех элементов нижнегоуровня, .

3⁰ На множестве заданы целевые функции:

Интересы описываются стремлением к максимизации этих функций.

4⁰ Взаимная информированность соответствует порядку ходов и определяет их стратегии.

5Для,определены правила поведения (принципы оптимальности), которые позволяют центруоценить множество возможных ответов элементов нижнего уровня:.

Сформулированная игра многих лиц является обобщением игр двух лиц, рассмотренных ранее. Исследование значительно упрощается, если модель ИСУ имеет веерную структуру.

ИСУ называетсявеерной, если.Функции выигрыша элементов нижнегоуровня таких ИСУ зависятот управления центра и своего управления и не зависят от управлений своих соседей.

Задача рассматривается в интересах центра. Рассмотрим данный тип игр на примере игр, аналогичных .

  1. Аналог игры

Правило 1.1 В этом случае, т.е. центр не имеет информации о действиях подчиненного до своего выбора.

Правило 1.2 Для любоговыбирает

Правило 1.3 выбираетиз условия МГР.

Правила 1.1-1.3 получены путем конкретизации параметров 1⁰-5⁰ игры общего вида.

Теорема 1.

Решение сформулированной игры (типа ) эквивалентно для центра решению игрыдля двух лиц, где один игрок, а второй игрок – игрок с функцией

выигрыша

Доказательство.

Определим множество Тогда МГР игрокав игреравен :.

С другой стороны для исходной игры с nподчиненными имеем

Утверждение Теоремы 1 (равенство ) следует из соотношениясправедливогов силу очевидного равенства

Теорема доказана.

2.Аналог игры

Правило 2.1 В этомслучае ,т.е. центр имеет информацию о выборе подчиненных и использует в качестве стратегии функции. Здесь, т.е. управление центра разбивается наnуправлений, а функция выигрышаимеет вид.

Правило 2.2 Игрокходит первым, т.е. выбирает и сообщаеткаждому стратегию.

Правило 2.3 Игрокивыбирают в силу своего правила поведения

Правило 2.4 Оптимальную стратегиювыбирает из ОПМГР.

Определим некоторые вспомогательные конструкции.

Введем параметры )

Аналогично играм двух лиц определим взаимовыгодные множества исходов:

Обозначим через - стратегиинаказания:

Определим исход :

Теорема 2.

Пусть элементы нижнего уровня доброжелательны к центру, тогда МГР равен, и достигается на стратегии:

Доказательство (аналогично доказательству теоремы для игрыв случае игры двух лиц).

  1. Докажем, что результат гарантирован.

Пусть использует стратегию. Если, то рациональный ответ- выбрать, так как в противном случае игрокбудет наказан и не получит больше. Если, то в силу доброжелательности игрокопять же выберет.

  1. Покажем, что больше центр получить не сможет.

По определению , поэтому большецентр сможет получить только внеD. Но внеDхотя бы один подчиненный получит меньше, что он не допустит. Следовательно, центр получить большене сможет.

Определение: ИСУ идеально согласованна, если

В идеально согласованной ИСУ центр на оптимальной стратегии получает глобальный максимум.

Пример ИСУ

Пусть у нас функции выигрышей игроков и управления имеют следующую зависимость:

,) ,где. Будем считать, что -выплаты центраэлементуза произведенную продукцию.

Пусть выполнены условия монотонности.

Функция строго монотонно растет по, а по- строго монотонно убывает. Аналогичноот любого поощрениястрого монотонно растет, а от затрат убывает.

Очевидно – стратегия наказания центра.

Максимальные гарантированные результаты подчиненных равны

Заметим, что ситуация (0,0) является ситуацией равновесия по Нэшу на классе управлений. Пусть точка ,где взаимовыгодное множествоDопределяется ограничением. Тогда оптимальная стратегия будет выглядеть следующим образом:

Замечание 1

Если , то гарантия полученияочевидна.

Если же существует i такое, что ,

то всегда можно найти , такое что,

(Либо как и ранее можно предположить доброжелательность Пi ).

Замечание 2

На практике используется стратегия неполного наказания.

То есть степень наказания непрерывно зависит от величины отклонения от « плана».

Замечание 3

Центр использует класс стратегий , которые сообщает нижнему уровню, аиспользуют стратегии вида.

Именно на этом классе стратегий реализуем ситуацию равновесия, которая приводит к хорошему исходу . Отметим, что классическая ситуация равновесия по Нэшу существует и единственна:Её экономический смысл- полное закрытие производства.

Замечание 4

Весь математический аппарат обобщается на иерархические системы управления с m уровнями.

Каким же образом они обобщаются? Рассмотрим ИСУ вида:(

П0

П1

П2

Вычислим гарантированный результат нижнего уровня.

Единственная тонкость- это как вычисляется гарантированный результат в промежуточных звеньях.

Здесь отслеживаются интересы нижнего уровня.

Тогда оптимальный результат верхнего уровня вычисляется с учетом интересов элементов нижнего уровня.

Замечание 5

Если мы имеем дело с ИСУ не веерного типа.

Либо, если ИСУ изначально веерного типа, но стратегии П0, сообщаемые Пi, зависят еще и от выборов других подчиненных, например .

Тогда выигрыш П1 зависит не только от x1, но и от выбора x2:

Для таких задач помимо правила 2.50добавляется (2.5”), которое формулируется следующим образом.

Правило 2.5”Центр в соответствии со своими интересами может устанавливать порядок ходов и процедуры обменаинформацией в том числе, передавать необходимую информацию каждому о действиях его партнеров.

То есть если вместо передает, то он должен обеспечить информацией П1о выборе П2

Пример. Пусть

Управления П0:,где -1-штраф, +1-поощрения

Управления Пi:,i=1,2

МГР для первого игрока П1 равен:

Аналогично для П2 имеем:

Следовательно, в этой задаче получает глобальный максимум в точке

При этом

Для гарантии выбора ,должен заблаговременно сообщить информацию оигроку.

Замечание 6

Вместо того чтобы использовать сложный класс стратегий и использовать соответствующий обмен информацией, в некоторых моделях центр сообщает простые стратегии и рассчитывает, что элементы нижнего уровня придерживаются ситуации равновесия по Нэшу (классической ситуации равновесия по Нэшу).