Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Курс теории активных систем - Новиков Д.А., Петраков С.Н

..pdf
Скачиваний:
54
Добавлен:
24.05.2014
Размер:
690.47 Кб
Скачать

Механизмы стимулирования в активных системах с нечеткой неопределенностью

Определим нечеткое отношение строгого предпочтения (НОСП)

~

~

 

P , соответствующее НОП R , следующим образом:

μP (x, y) = max {μR (x, y) - μR ( y, x), 0}, x, y A .

~

~

~

Определим нечеткое

множество

недоминируемых альтернатив

(действий):

 

 

μНД

~

R

(x) = 1- sup μP ( y, x) , x A .

~

y A

НД

(x) можно интерпретировать как

степень

Величину μ ~

 

R

действия x A , поэтому рациональным

 

недоминируемости

будем

считать выбор активным элементом действий, имеющих по

возможности большую степень принадлежности четкому множеству недоминируемых альтернатив. Множество

A

НД

~

НД

 

НД

(z)}

 

(R) = {x Î A

μ ~

(x) = sup μ ~

 

 

 

R

z A

R

 

 

 

 

 

 

 

называется множеством максимально недоминируемых действий.

Будем считать, что индивидуально рациональный выбор АЭ при

~

 

 

 

 

 

 

 

 

НОП R на множестве допустимых действий определяется следующим

правилом рационального выбора:

 

~

 

 

 

 

 

~

 

 

 

 

 

 

 

P(R, A) = AНД (R) .

 

 

Четкое множество

 

 

 

 

 

A

НД

~

 

НД

 

 

 

 

 

 

 

 

 

 

(R) = {x Î A

 

μ ~ (x) ³ α} , α Î (0, 1] ,

 

 

 

α

 

 

 

R

 

 

 

будем называть множеством α - недоминируемых действий.

 

Перейдем

 

к

рассмотрению

активной

системы

с

неопределенностью, в которой результат деятельности АЭ может отличаться от его действия.

Рассмотрим АС, состоящую из центра и одного АЭ. Стратегией АЭ является выбор действия y A . Действие y A под влиянием внешних

факторов приводит к результату деятельности z Î A0 .

В общем случае предпочтения АЭ над множеством A0 задаются

~

НОП R . В частности будем считать, что функция полезности АЭ задается четкой функцией u : A0 R1 и представляется в виде доход

минус штрафы”, причем доход и штрафы зависят от результата деятельности.

71

ГЛАВА 4

Предположим, что центру и АЭ известно нечеткое множество

~

´ A ® [0, 1] , где

~

(нечеткая информационная функция) P : A0

P(z, y)

определяет функцию принадлежности результата деятельности z Î A0 в

зависимости

от

действия

y A . Правило

рационального выбора

~

 

 

 

 

 

P(R, A) можно задать следующим образом.

 

Определим нечеткое подмножество множества результатов

деятельности

A0 :

~

~

 

 

 

γ

, y), μR (z1, z) } .

 

(P, z) = sup

min { P(z1

 

 

z1 A0

 

 

~

 

 

 

~

 

Пример 4.9. Нечеткое множество γ

можно интерпретировать

(P, z)

как нечеткое множество наилучших результатов деятельности, то есть результатов, реализуемых в силу нечеткой информации и наиболее

~

предпочтительных с точки зрения НОП R . Если перейти к четкой

~

´ A ® [0, 1]

можно

исходной информации, то нечеткое множество P : A0

интерпретировать как множество действий АЭ,

R - как

четкое

отношение предпочтения, порожденное, например, функцией полезности u(z) . Получаем, что в случае четких множеств γ является

множеством реализуемых и наиболее предпочтительных действий, то

есть γ

~ ~

{y Î A

 

u( y) ³ u(t), "t Î A}. ·

R (P) = P I

 

Пример 4.10. Эскиз функций принадлежности нечетких множеств

~

´ A ® [0, 1]

~

P : A0

и предпочтения R для некоторых фиксированных

z Î A0

и y A приведен на рис. 4.7 тонкими линиями, эскиз значения

величины γ

~

~

, y), μR

(z1, z) } для заданных z

(P(×, y), z) =

sup min { P(z1

 

 

z1 A0

~

 

 

 

 

 

и y изображен на рис. 4.7 жирной линией. Поскольку нам необходимо

сравнить два действия у1

и у2 Î А , а НОП

~

задано на множестве

R

результатов

деятельности,

то

следует взять

пересечение

множеств

μR (z1, z2 ) ,

~

и

~

 

позволит

устранить

γ (P (×, у1), z)

P (z, у2 ), что

~

 

 

 

 

 

 

неопределенность относительно результата деятельности, то есть - получить НОП над множеством возможных действий A: "у1, у2 Î A

β ( у1, у2 ) =

~

, y1 ), μR

~

, y2 )} .

sup min {P(z1

(z1, z2 ), P(z2

 

z1, z2 A0

~

 

 

 

 

 

 

72

Механизмы стимулирования в активных системах с нечеткой неопределенностью

Множество

"y Î A

~

P называется α -нормальным, если:

~

и "z Î A0

~

sup P (z, y) = α

$ y Î A : P(z, y) = α .

zÎA0

 

 

Далее в настоящей главе будем предполагать, что выполнено следующее предположение.

~

А.11. Множество P 1-нормально.

Частным случаем рассматриваемой модели АС является четкое

отношение

предпочтения,

порожденное

функцией

 

полезности

~

~

~

над множеством

A0 , тогда НОП над множеством

f (z) = h (z) − χ (z)

возможных действий определяется следующим образом:

 

 

 

 

 

~

 

 

 

 

 

~

 

 

 

~

 

 

 

 

 

 

 

, y2 ) =

sup

min {P(z1, y1 ), P(z2 , y2 )} .

 

 

 

μRA ( y1

 

 

 

 

 

 

z1, z2ÎA0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f (z1)³ f (z2 )

 

 

 

 

 

 

 

 

 

 

 

 

Определим, как и ранее, нечеткое множество недоминируемых

действий:

НД

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(y) = 1- sup [μ ~

(y , y) - μ ~

(y, y )] ,

 

 

 

 

 

μ ~

 

 

 

 

 

RA

 

 

y1ÎA

RA

1

 

 

RA

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

~

 

~

 

 

 

 

 

 

 

 

 

 

НД

( y) = 1

- sup [ sup

 

 

 

, y), μ

~

(z , z

 

)} -

 

 

μ ~

min{P(z

y ), P(z

2

2

 

 

RA

 

y1ÎA z1,z2ÎA0

 

 

1,

1

 

 

R

1

 

 

 

 

 

 

 

 

 

 

~

 

 

~

 

 

 

 

 

 

 

 

 

 

sup

 

 

 

 

 

 

 

 

~

, z1 )} .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

min{ P ( z1 , y1 ), P ( z2 , y ), μ R ( z2

 

 

 

z1, z 2 Î A0

 

 

 

 

 

 

 

 

 

 

 

 

 

Множеством

рационального

выбора

будем

 

считать

либо

~

 

 

НД

( y) ,

 

 

~

 

, A)

= {y Î A

 

НД

(y) ³ α}, то

 

 

 

 

 

 

P(RA , A) = Arg max μ ~

 

либо P(RA

 

μR

 

 

0

yÎA

RA

 

 

 

 

0

 

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

есть либо максимально недоминируемые действия, либо α - недоминируемые действия. Множество действий, степень недоминируемости которых равна единице, называется множеством четко недоминируемых действий или множеством Орловского [21].

Таким образом, мы построили на множестве возможных действий АЭ нечеткое отношение предпочтения, индуцированное функцией полезности АЭ и нечеткой информационной функцией. Имея определение рационального выбора, можно приступать к решению задач стимулирования в АС с нечеткой внешней неопределенностью.

73

z1, z2ÎA0
~ ~
f (z1)³ f (z2 )

ГЛАВА 4

4.3.Задача синтеза оптимального механизма стимулирования в активной системе с внешней нечеткой неопределенностью

Пусть

 

 

~

 

задана на

множестве

функция полезности центра Φ(z)

возможных результатов деятельности

A0 . Тогда она индуцирует четкое

отношение

предпочтения над

A0 .

Над

множеством

возможных

действий

можно определить

НОП

центра

и

нечеткое

множество

максимально недоминируемых

альтернатив

 

НД

 

F( y) = μ ~ ( y) , которое

 

 

 

 

 

F

 

можно считать целевой функцией центра над множеством возможных действий АЭ.

Если

функция

полезности

АЭ задана

в виде доход минус

штрафы”,

то

есть

~

~

~

НОП над множеством

f (z) = h(z) − χ(z) , то

возможных действий определяется как (см. раздел 4.2):

 

~

 

 

 

~

~

 

( y1, y2 ) =

sup

min {P(z1, y1 ), P(z2 , y2 )} .

 

μRA

Множество недоминируемых альтернатив принимает вид:

μНД

~

RA

 

é

 

 

~

~

 

( y) = 1 - sup

ê

 

 

, y )} -

ê

~

sup min {P(z1

, y1 ), P(z2

y ÎA

ê

 

~

 

 

 

z , z

ÎA

 

 

1

 

1

2

 

 

 

 

ë f (z1 )³ f (z2 )

 

 

 

 

~

~

ù

 

-

sup

ú

 

min {P(z1, y1 ), P(z2

, y)}ú .

 

~

~

 

 

ú

 

z1

, z2ÎA

 

 

û

 

f (z1)³ f (z2 )

 

 

 

При наличии управления (стимулирования) предпочтения

множеством A0 зависят

от этого

 

~

~

управления: R

= RA

 

 

 

 

 

0

АЭ над

(χ ) . В

предположении благожелательного отношения АЭ к центру, определим эффективность механизма стимулирования как:

K(χ) =

max

F( y) .

 

~

(χ ), A)

 

 

yÎP(RA0

 

Итак, мы ввели НОП, индуцированное на множестве A функцией полезности АЭ и нечеткой информационной функцией. Это НОП зависит от системы стимулирования, используемой центром.

74

Механизмы стимулирования в активных системах с нечеткой неопределенностью

Непосредственный анализ зависимости множества максимально недоминируемых действий от стимулирования чрезвычайно трудоемок. Для упрощения этого анализа используется следующий прием [21] – решение задачи принятия решений (в нашем случае - задачи синтеза оптимальной функции стимулирования [16,19]) связывается с решением задачи четкого математического программирования, рассматриваемой

ниже.

 

 

 

 

 

 

 

Введем задачу четкого математического программирования:

 

 

 

~

 

 

 

 

 

 

 

ì f (z) ® max;

 

 

 

 

 

ï ~

 

 

 

 

(4.1)

 

íP(z, y) ³ α;

 

 

 

ïy Î A, z Î A ;

 

 

 

 

 

ï

 

0

 

 

 

 

 

î

 

 

 

 

 

 

Приведем без доказательства два следующих технических

результата [16,19,21].

 

 

 

 

 

 

 

Лемма 4.1. Пусть выполнено

 

 

 

 

"y Î A

 

~

 

 

(4.2)

sup P(z, y) ³ α

 

 

 

 

z A0

~

 

~

 

 

 

 

 

 

и

и НОП μR ( y) индуцировано функцией полезности u(z) = h (z) − χ (z)

~

 

 

 

 

 

 

 

 

 

 

~

, y0 )

- решение

нечеткой информационной функцией P(z, y) . Если (z0

задачи (4.1), то

 

 

 

 

 

 

 

 

μ ~НД ( y 0 ) ³ α .

 

 

 

 

 

 

R A

 

 

 

 

Лемма 4.2. Если выполнено одно из следующих условий:

 

 

 

- (4.2), множества A и A0

конечны;

 

~

 

~

- (4.2), множества

A ,

 

A0 - компактны, а функции

и

 

f

P

непрерывны;

 

 

~

 

 

 

- множества A и

A0

-

 

 

 

компактны, функция f

- непрерывна

~

сверху, а P - α -нормально;

то задача (4.1) имеет решение.

Следствие 4.1. а) Если выполнены условия леммы 4.2, то

множество

α

-

недоминируемых

действий

не

пусто:

{y Î A

 

НД

( y) ³ α} ¹ Æ ;

 

 

 

 

 

 

 

 

μ ~

 

 

 

 

 

RA

 

 

 

 

 

 

б) Если выполнено условие (4.2) с

α = 1 , множества

A и A0

компактны,

~

и

~

 

множество

а f

P полунепрерывны сверху, то

75

ГЛАВА 4

Орловского {y Î A

НД

( y) = 1} не пусто, и любое решение задачи (4.1)

μ ~

 

RA

 

принадлежит этому множеству.

Лемма 4.3. Любое четко недоминируемое действие принадлежит множеству решений задачи (4.1) с α = 1.

Доказательство. Предположим противное. Пусть y - 1 - недоминируемое действие, не принадлежащее множеству решений

задачи (4.1).

 

 

Q( y ) = {z Î A

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначим

 

 

 

 

³ 1} . Пусть

не

существует

 

 

 

P(z, y )

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

результата деятельности z A

 

такого,

что пара

(z , y )

-

решение

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

задачи (4.1), то есть Q( y ) I Argmax

f (z) = Æ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z A0

 

 

 

~

 

 

 

 

 

 

 

 

 

Пусть

z0 Î Argmax f (z) .

 

При

этом

, y ) < 1

и

в

силу

 

 

P(z0

 

 

~

z A0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y0 Î A

такое, что (z0 , y0 ) -

нормальности P(z, y) найдется действие

решение задачи (4.1)

и y0

- 1

 

недоминируемое действие, которое

доминирует

y

со степенью строго большей нуля. Значит

y не 1 –

недоминируемое действие. Противоречие. ·

 

 

 

 

 

 

 

 

 

 

Пусть

функция

полезности

 

активного

элемента

представлена в

виде

доход

 

минус

 

штрафы”:

 

~

 

~

~

 

Из

 

 

 

f (z)

= h (z) − χ(z) .

детерминированной

теории

(см.

теорему

2.1)

следует,

что,

если

множества A, A0 и функции

 

 

 

 

~

 

 

 

 

 

 

 

~

 

дохода h (z) и штрафов χ (z)

удовлетворяют

условиям

А.1-А.3,

то множество

 

 

точек

максимума

функции полезности

~

при

~

 

 

представляет собой отрезок

f (z)

χ (z) Î M

P = [z, z+ ] , где

~

~

 

 

 

 

 

 

 

 

 

 

 

~

 

~

 

 

z= min {z Î A

 

 

 

 

 

z+

= max {z Î A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h (z) ³ h (r) - C} ,

 

 

h (z) ³ h (r) - C} .

 

 

0

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

При этом любое действие из множества

P в детерминированной

АС реализуемо скачкообразными функциями стимулирования. В АС с нечеткой неопределенностью, если ~z Î P , то найдется скачкообразная функция стимулирования χc (x, z) Î M , где x = ~z , такая, что

~z Î Argmax {h(z) - χc (x, z)}.

z A0

76

Механизмы стимулирования в активных системах с нечеткой неопределенностью

Обозначим Q(z,α) = {y Î A

 

~

 

 

 

 

 

 

 

 

P(z, y) ³ α} , z Î A0 .

Лемма 4.4. Для любых x P

и для любых

y ÎQ(x, α) найдется

система

~

 

 

а

именно -

~

стимулирования χ Î M ,

χc (x, z) , такая, что

действие

y будет принадлежать

множеству

α -недоминируемых

действий.

 

и y ÎQ(x, α) . В

Доказательство. Рассмотрим произвольные x P

 

~

~

 

силу того, что x P , выполнено: x Î Argmax {h (z) - χc (x, z)} . Тогда

пара (x, y) является решением

z A0

 

что y

задачи (4.1), откуда

следует,

принадлежит множеству α - недоминируемых действий. ·

χ M

Множеством реализуемых

системой стимулирования

действий в АС с нечеткой неопределенностью будем считать множество

P(χ, α) = {y Î A

НД

НД

( y) - функция принадлежности

μ ~

( y) ³ α}, где μ ~

 

f

f

 

множеству альтернатив, недоминируемых по НОП, индуцированному

функцией полезности ~ ~ ~ и нечеткой информационной f (z) = h (z) − χ(z)

~

 

 

 

 

 

 

 

 

 

функцией P(z, y) . Максимальное множество реализуемых действий в

случае, когда элемент производит свой выбор из множества

α -

недоминируемых

действий, обозначим

через

S(α) =

UP(χ, α)

(см.

рисунок 4.8).

 

 

 

 

 

 

 

χM

 

 

 

 

 

 

 

 

 

 

Напомним,

что

в предположении

А.11

мы

потребовали, чтобы

 

 

 

 

~

 

 

 

 

 

нечеткая информационная функция P(z, y) была 1-нормальна.

 

Лемма 4.5. Максимальное множество реализуемых действий

определяется следующим выражением:

 

 

 

 

 

 

 

 

S(1) = UQ(x, 1) .

 

 

 

 

 

 

 

 

x P

 

 

 

 

 

Доказательство.

В

силу

леммы

4.3

и

А.11

любое

четко

недоминируемое действие

~

 

 

 

 

 

 

y принадлежит одному из множеств Q(x, 1)

для некоторого x Î A0 , то есть S(1) Í UQ(x, 1) .

 

 

 

 

 

 

 

x A0

 

 

 

 

 

В силу А.11 и того,

что

y - четко недоминируемое действие,

~

 

 

 

~ ~

 

 

 

 

 

найдется z Î A0 такое, что пара ( y, z ) является решением задачи (4.1),

77

ГЛАВА 4

то есть

~

~

~

 

~

 

 

 

 

z

Argmax {h (z) − χ (z)} , откуда

z P . При этом из того, что

~ ~

 

z A

 

 

 

~

 

~

 

- решение задачи (4.1),

следует,

что

 

 

( y, z )

y

Q(z , 1) . Для любого

x A0

 

найдется

~

такое,

что

 

~

~

откуда

 

z P

 

y

Q(z , 1) ,

UQ(x, 1) = UQ(x, 1) . Таким образом, S(1)

UQ(x, 1) .

 

x A0

 

x P

 

 

 

x P

 

 

 

~

f (z)

~

P(z, y)

α

 

 

 

 

 

 

x

 

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

Q(x,α)

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 4.8. Функция полезности АЭ в задаче стимулирования

 

 

с нечеткой неопределенностью.

 

С другой стороны, из леммы 4.4 следует, что для любого

x P и

y Q(x, 1) найдется система

стимулирования

~

 

 

χ M такая, что

~

UQ(x, 1)

 

~

 

 

 

y P(χ , 1) , то есть

U P(χ , 1) = S(1) .

 

 

 

x P

 

χM

 

 

 

 

 

 

Теорема 4.1.

В

активной

системе

с

нечеткой

внешней

неопределенностью

для

любой

системы

стимулирования

~

χ M

существует система стимулирования Стипа не меньшей эффективности.

Доказательство. Из леммы 4.5 следует, что UQ(x, 1)

U P(χ, 1) .

 

x P

χM C

В то же время UP(χ, 1) = S(1)

UQ(x, 1) , значит S(1) =

U P(χ, 1) . ∙

χM

x P

χMC

78

Механизмы стимулирования в активных системах с нечеткой неопределенностью

Исследуем влияние неопределенности на эффективность стимулирования. Рассмотрим две нечеткие активные системы, отличающиеся лишь тем, что центр и активный элемент обладают

~

 

~

 

- во второй.

нечеткой информацией P1(z, y)

- в первой АС и P2 (z, y)

В первой АС участники

обладают большей

информацией

(неопределенность меньше),

если

y A, z A0

~

~

P1

(z, y) ≤ P2 (z, y)

(см. рисунок 4.9). Обозначим K1 и K2

-

эффективности

стимулирования в первой и второй АС, соответственно.

 

 

 

~

 

 

 

 

P2 (z, y)

 

 

~

P1(z, y)

z

Рис. 4.9. Различие в информированности участников АС

Теорема 4.2. K1 £ K2 .

 

 

 

 

 

Доказательство. Для любого x Î A0

выполнено

 

Q1(x,α) = {y Î A

 

~

(x,α) = {y Î A

 

~

(x, y) ³ α},

 

 

 

P1(x, y) ³ α} Í Q2

 

P2

откуда следует, что S1(α) Í S2 (α) . ·

Таким образом, в активных системах с нечеткой внешней

неопределенностью в рамках гипотезы благожелательности с ростом неопределенности эффективность стимулирования не убывает. Этот, казалось бы, парадоксальный факт обусловлен введенными предположениями о рациональном поведении участников АС [16,19].

Если отказаться от гипотезы благожелательности и определить гарантированную эффективность стимулирования как:

K g

(χ ) =

min

F( y) ,

 

~

(χ ), A)

 

 

 

y P(RA0

 

то, повторяя приведенные выше рассуждения, можно показать, что с

ростом неопределенности гарантированная эффективность стимулирования не возрастает.

79

ГЛАВА 5

Глава 5. МЕХАНИЗМЫ ФУНКЦИОНИРОВАНИЯ АКТИВНЫХ СИСТЕМ

ССООБЩЕНИЕМ ИНФОРМАЦИИ

5.1.Постановка задачи планирования

вактивных системах

Рассмотрим активную систему с асимметричной информированностью, то есть такую, что некоторые ее участники лучше информированы о каких-либо существенных внешних или внутренних параметрах, чем другие. В таких системах разумным

представляется использование механизмов передачи информации от более информированных участников АС менее информированным.

Поскольку в большинстве исследуемых АС центру необходимо иметь информацию о предпочтениях АЭ (например, типах АЭ, параметризующих их функции полезности), то он выступает в роли

менее информированного участника АС и целесообразна передача информации от АЭ к центру (см. рисунок 5.1).

Сообщение s S

Центр

АЭ

Рис. 5.1. Функционирование АС

План x = π(s) X

ссообщением информации

Вкачестве действия АЭ (одной из компонент выбираемой им стратегии) в механизмах функционирования АС с сообщением информации выступает сообщение s S , S - множество возможных

сообщений АЭ. Стратегию центра x будем называть планом (напомним, что план желательное с точки зрения центра состояние АЭ), X - множество допустимых для данного АЭ планов.

80