аспределенные системы принятия решений в управлении региональным развитием - Гилев С.Е., Леонтьев С.В., Новиков Д.А
.pdfl-го центра, неизвестного |
метацентру. Обозначим |
|
r = (r1, r2, …, rk) – вектор типов центров, r Î W = ÕΩl . |
||
|
|
l K |
Получаем, что в рассматриваемой модели все величины |
||
зависят от типов центров: |
|
|
(36) x*(r) = arg max [ åH l (x, rl ) |
- c(x)], |
|
x A' |
l K |
|
|
|
(37) Wl(rl) = max Hl(x, rl) – c(x), l Î K,
x A'
(38)ml(r) = Hl(x*(r)) – Wl(rl), l Î K,
(39)L*’(r) = {ll ³ 0, l Î K | Hl(x*(r), rl) - ll ³ Wl(rl), l Î K,
åll = c(x*(r))},
l K
(40) R(r) = W(r) - åW l (rl ) .
l K
Интересно отметить, что в рассматриваемом механизме распределения ресурсов, в отличие от всех известных меха- низмов [4, 5, 9, 23, 25, 32], количество распределяемого ресурса в явном виде зависит от типов центров.
Обозначим W* = {r Î W | L*’(r) ¹ Æ} Í W - множество таких векторов типов центров, при которых между ними возможен режим сотрудничества.
Так как точные значения типов центров могут быть не- известны метацентру, то рассмотрим механизм с сообщени- ем информации [7], в котором центры сообщают метацентру оценки своих типов, а последний использует эти оценки для
определения количества выделяемого тому или иному АЭ ресурса (обычно правило, ставящее в соответствие вектору сообщений планы, называется процедурой планирования
[24]).
Для механизмов планирования (точнее - механизмов с сообщением информации) характерна проблема манипули- руемости – если сообщаемая метацентру информация не может быть им верифицирована, то центры в общем случае
41
будут сообщать информацию, которая приведет к наиболее выгодным для них решениям центра (например, если мно- жество L пусто, то для центров выгодно, чтобы метацентр
из своих средств компенсировал агенту как можно большую часть затрат). Поэтому одной из задач является задача ис- следования манипулируемости механизмов и, в частности,
определения множества неманипулируемых механизмов распределения ресурса, то есть таких механизмов, в кото- рых сообщение достоверной информации выгодно для АЭ. Формализуем последнее утверждение.
Введем в рассмотрение функцию предпочтения l-го центра, отражающую зависимость его прибыли от вектора сообщений s = (s1, s2, …, sk) Î S всех центров (в том числе и
от его сообщения sl Î Sl, l Î K, S = ∏ S l ):
lÎK
(41) jl(s, rl) = Hl(x*(s), rl) - ml(s) + gl(s), l Î K,
где {gl(×)}l K – процедура распределения ресурса.
В рамках теоретико-игровых моделей считается [15],
что в условиях игровой неопределенности рациональное поведение субъектов моделируется предположением о том, что они окажутся в том или ином равновесии. Следователь- но, выгодность сообщения достоверной информации озна- чает, что достоверные сообщения являются равновесными [15]. Определим равновесие в доминантных стратегиях (РДС) sd Î S следующим образом. Стратегия sld Î Sl являет-
ся доминантной для l-го центра, если
(42) jl(sld, s-l, rl) ³ jl(sl, s-l, rl) " sl Î Sl, " s-l Î S-l,
где s-l = (s1, …, sl-1, sl+1, …, sk) S-l = ∏ S j - обстановка
j¹l
игры для l-го центра. Если у каждого центра существует доминантная стратегия, то соответствующий вектор называ- ется РДС.
Равновесием Нэша называется вектор sN Î S, такой, что
(43) jl(slN, s-lN, rl) ³ jl(sl, s-lN, rl) " sl Î Sl, " l Î K.
42
Множество РДС обозначим Ed(r), множество равнове- сий Нэша обозначим EN(r). Неманипулируемым будем на-
зывать механизм, в котором r Î Ed(r) или r Î ЕN(r) (очевид-
но, что Ed(r) Í ЕN(r)).
Рассмотрим следующую модель. Обозначим xi* Î A’ –
вектор действий АЭ, который наиболее выгодно реализо- вать коллективу K \ {i} центров:
(44) |
xi* |
= arg max [ |
åH l (x) - c(x)], i Î K, |
|
|
x A' |
l K \{i} |
|
|
|
|
(45) |
Λ*'i |
= {ll ³ 0, l Î K \ {i} | Hl( xi* ) - ll ³ Wl, l Î K \ {i}, |
åll = c( xi* )}, i Î K,
l K \{i}
- множество согласованных платежей центров из множества K \ {i} по реализации вектора xi* действий АЭ. Суммарная полезность этих центров (в отсутствии i-го центра) равна åH l (xi* ) - c( xi* ). В присутствии i-го центра суммарная
l K \{i}
полезность этого множества центров не превышает (макси- мум достигается, когда для i-го центра условие индивиду-
альной рациональности |
существенно) |
åH l (x* ) - |
c(x*) + Hi(x*) – Wi = W – Wi, i Î K. |
l K \{i} |
|
|
||
Величина di = W – Wi - |
åH l (xi* ) - c( xi* ), которая мо- |
|
|
l K \{i} |
|
жет интерпретироваться как эксцесс [15], характеризует изменение полезности всех центров, кроме фиксированного, при его добавлении в АС. Следовательно, платежи со сто- роны метацентра могут основываться на величинах {dl}l K (см. также механизм ключевых агентов, в котором каждый участник облагается налогом, равным тем потерям, которые несут из-за его присутствия другие участники АС [23, 33, 34]). Платежи метацентра могут также основываться
43
(и именно на этом варианте мы остановимся) на разности W – Wl, характеризующей максимальную полезность, кото- рую могут получить остальные центры из-за присутствия l- го центра. Если ресурс, получаемый каждым из центров пропорционален этому вкладу, то соответствующий прин- цип распределения ресурса можно записать в виде:
(46) gi(s) = (W(s) - åW l (sl ) ) |
W − W i |
, i K. |
|
kW − åW l |
|||
l K |
|
||
|
l K |
|
Очевидно, что механизм (46) является анонимным и сбалансированным, но в общем случае он манипулируем.
Рассмотрим другой механизм распределения ресурса: (47) gi(s) = W(s) / k - Wi(si), i K.
Он также является анонимным и сбалансированным, и, опять же, в общем случае – манипулируемым.
Анализ искажения центрами информации в механизме
(47)подсказывает, что избежать манипулирования можно за счет полного перераспределения полезности между центра- ми, что возможно в рамках следующей процедуры: меха- низм должен быть таков, чтобы имело место
(48)ϕi(s) = [ åH l (x* (s), rl ) - c(x*(s))] / k, i K.
l K
Содержательно в рамках механизма (48) метацентр ис- пользует институциональное управление и говорит центрам: сообщайте мне оценки ваших функций дохода, на их осно-
вании я вычислю наиболее выгодное для вас действие АЭ и уровняю фактически полученные вами полезности (для
этого метацентр должен в итоге достоверно наблюдать эти полезности – в выражении (48) в функциях дохода стоят истинные значения типов центров).
Предположим, что функции Hl(y, rl) непрерывны и мо- нотонны по параметрам rl, а множества Ωl компактны, l K. Тогда справедлив следующий результат.
44
Теорема 5. Механизм (48) является анонимным, эффек- тивным и неманипулируемым, но в общем случае он не
удовлетворяет условиям индивидуальной рациональности центров.
Доказательство теоремы 5. Анонимность механизма (48) очевидна, так как он симметричен относительно пере- становок агентов.
Пусть все центры, кроме i-го, сообщили достоверную
информацию, |
то есть sl = rl, l Î K \ {i}. Полезность i-го |
||
центра равна: |
|
||
|
1 |
|
[ åH l (x* (si , r −i ), rl ) - c(x*(si, r-i))]. |
|
k |
||
|
l K |
В силу (36) в рамках введенных предположений макси- мум этого выражения достигается при si = ri. Из (43) следу- ет, что сообщение центрами достоверной информации явля- ется равновесием Нэша, то есть механизм неманипулируем. Кроме того, очевидно, что рассматриваемый механизм при- водит каждого центра к одному и тому же уровню полезно- сти W(r) / k. И, наконец, эффективность по Парето механиз- ма (48) следует из того, что он максимизирует суммарную полезность центров при сообщении ими достоверных оце- нок. ∙
Несбалансированность механизма (48) и возможность нарушения условий индивидуальной рациональности явля- ется характерным свойством неманипулируемых механиз- мов с трансферабельной полезностью (см. обзор в [23]).
Пример 1. Пусть |
Hl(y, rl) = 2 rl |
y |
, l = 1, |
2, |
c(y) = y, |
|
A = 1+ . Вычислим в соответствии с (36)-(40) |
следующие |
|||||
величины: Wl (rl) = (rl)2, x*(r) = (r1 + r2)2, |
W(r) = (r1 + r2)2, |
|||||
ml(r) = rl (rl + 2 r-l). |
Если W = [0; +¥)2, |
то |
" r Î W |
W1 (r1) + W2 (r2) £ W(r), следовательно, W* ¹ Æ.
Метацентр имеет возможность распределить между центрами
45
R(r) = μ1(r) + μ2(r) – c(x*(r)) = W(r) – W1(r) – W2(r) = 2 r1 r2
единиц ресурса.
Рассмотрим отклонение от равновесия Нэша первого центра. В рамках механизма (48) вычисляем: x*(s1, r2) = (s1 + r2)2, ϕ1(s1, r2) = (r1 + r2) (s1 + r2) - (s1 + r2)2/ 2.
Максимум последнего выражения по s1 достигается при s1 = r1. ∙
Таким образом, рассмотренные механизмы распределе- ния ресурса позволяют решать задачу согласования интере- сов центров в смысле выбора из множества Парето- оптимальных вариантов конкретного варианта. Преимуще- ство предложенного подхода заключается в том, что исход- ная задача – определения равновесных платежей центров, то есть - конкретной точки множества Λ (если оно не пусто) – представляется более сложной для анализа, так как это
множество может задаваться сложным образом и иметь сложную конфигурацию. Использование механизма (27)- (30) позволяет эту задачу свести к задаче распределения известного количества ресурса. Применение механизма (48)
всилу теоремы 5 делает выгодным для каждого центра сообщение достоверной информации, что позволяет достичь
вусловиях неполной информированности метацентра эф- фективного распределения ресурса между центрами.
До сих пор мы рассматривали задачи координации и за- дачи согласования, соответствующие случаю отсутствию собственных интересов у метацентра (см. таблицу 1). Пе- рейдем к анализу случая, в котором метацентр имеет собст- венные интересы, то есть – к исследованию задачи управле- ния.
9. ЗАДАЧА УПРАВЛЕНИЯ
Предположим, что метацентр обладает собственными интересами, быть может, отличными от интересов центров. Интересы метацентра на множестве A’ векторов действий
46
агентов будем описывать функцией дохода H0(y): A’ → 1, которую будем считать непрерывной. Частные случаи зада- чи управления, в которых метацентр облагает центры нало- гом с дохода или прибыли, рассмотрены в [14].
Возможным вариантом интерпретации роли метацентра является добавление его ко множеству центров. При этом изменится множество компромисса (априори неизвестно расширится оно или сузится), равновесные платежи центров и т.д. Однако этот случай скорее соответствует количест- венному расширению состава центров, а не введению ново- го уровня управления. Как отмечалось в [12, 29], наличие метацентра означает присутствие игрока, обладающего правом устанавливать правила игры для других игроков, в том числе – выбирать свои стратегии как функции от выбо- ра других игроков. Поэтому рассмотрим случай, когда ме-
тацентр обладает правом первого хода и устанавливает управления для центров, а затем последние выбирают свои платежи активным элементам.
Результаты предшествующего изложения подготовили все необходимое для постановки и решения задачи управле- ния. Выражение (33) определяет баланс бюджета метацен- тра в зависимости от реализуемого действия. Следовательно целевая функция метацентра Φ(x) может быть определена как разность между его доходом и затратами (33):
(49) Φ(x) = H(x) – c(x) + å(χ l (x) − σ l (x)) , x A’.
l K
Приведем содержательные интерпретации. В моногра- фии [27] исследовались механизмы функционирования многоуровневых иерархических организационных систем. В частности, изучались факторы, влияющие на эффективность управления в такого рода системах. Одним из выявленных факторов был так называемый «экономический» фактор, заключающийся в изменении финансовых, материальных и др. ресурсов системы при изменении состава участников
47
системы (управляемых субъектов, промежуточных управ- ляющих органов и т.д.), обладающих собственными интере- сами.
Изменение эффективности управления за счет привне- сения или потребления ресурсов при изменении элементно- го состава организационной системы имеет место и в двух- уровневых системах. Например, добавление нового
управляемого субъекта может расширить возможности системы и, наряду с этим, увеличить затраты на поддержа- ние ее деятельности. Другими словами, в общем случае экономический фактор отражает баланс ресурсов (условно - доходов и затрат) в задачах формирования состава системы. Так, например, введение в организации нового промежуточ-
ного уровня иерархии с одной стороны может улучшить координацию деятельности подчиненных, а с другой сторо- ны - может потребовать дополнительных затрат на содер- жание нового административно-управленческого персонала. Наряду с этим, иногда введение дополнительных уровней управления может только ухудшить координацию деятель- ности подчиненных, например, за счет увеличения задержки принятия решений. В рассматриваемой модели РСПР эко- номический фактор проявляется в том, что центры, получая собственный доход от деятельности АЭ, берут на себя часть расходов, связанных со стимулированием АЭ.
Теорема 6. Оптимальным является механизм (31)-(33), в
рамках которого реализуется действие
(50) x0 = arg max F(y).
y A'
Доказательство теоремы 6. Предположим, что сущест- вует другое управление, отличное от {cl(x), sl(x)}, реали-
зующее действие x’ ¹ x0, такое, что
(51) H0(x’) - u(x’) > F(x0),
где u(×) – минимальные затраты метацентра на реализацию соответствующего действия. В силу лемм 5-7 условия реа-
48
лизуемости включают в себя непустоту множества (26),
которое, в свою очередь, задается системой неравенств
Hl(x’) - ll ³ Wl, l Î K.
(52)Fl(yl) = Hl(y) - ul(y) - cl(y) + sl(y), l Î K.
Всилу теоремы 3 стимулирование центров по реализа- ции заданного действия минимально. Из (52) и того, что в
(50)вычисляется максимум по всем действиям АЭ, получа-
ем противоречие с (51). ∙ Качественное обоснование результата теоремы 6 заклю-
чается в следующем: так как при использовании управлений (31)-(33) полезности всех участников АС, кроме метацентра, равны резервным полезностям, а в (50) определяется опти- мальное действие, реализуемое с минимальными затратами метацентра на стимулирование, то F(x0) – абсолютный оптимум критерия эффективности.
Отметим, что, комбинируя результаты настоящего и предыдущего разделов, можно заложить в механизм управ- ления требования обеспечения всех участников АС некото- рыми гарантированными уровнями полезности (резервной полезности). Резервная полезность будет аддитивно входит в условия индивидуальной рациональности, поэтому с рос-
том резервных полезностей множество компромисса будет сужаться.
Результат теоремы 6 может быть непосредственно обобщен на случай четырех и более уровневых РСПР, а
также систем с распределенным контролем на всех уровнях управления.
10.ЗАКЛЮЧЕНИЕ
Внастоящей работе рассмотрены теоретико-игровые и
оптимизационные модели распределенных систем принятия решений, для которых исследованы равновесные стратегии управляющих органов и управляемых субъектов, решены
49
задачи согласования интересов участников РСПР и управ- ления их взаимодействием.
Перспективным направлением будущих исследований представляется изучение РСПР, функционирующих в усло- виях неопределенности, а также кооперативных эффектов взаимодействия центров в многоуровневых системах.
ЛИТЕРАТУРА
1.Айзерман М.А., Алескеров Ф.Т. Выбор вариантов: основы теории. М.: Наука, 1990.
2.Арсланов М.З. Скаляризация задачи построения множества оптимальных по Слейтеру решений // Автоматика и Телемехани-
ка. 1997. № 8.
3.Березовский Б.А., Барышников Р.М., Борзенко В.И., Кемпнер Л.М. Многокритериальная оптимизация: математические аспек- ты. М.: Наука.
4.Бурков В.Н., Горгидзе И.И., Новиков Д.А., Юсупов Б.С. Мо-
дели и механизмы распределения затрат и доходов в рыночной экономике. М.: ИПУ РАН, 1997.
5.Бурков В.Н., Данев Б., Еналеев А.К. и др. Большие системы: моделирование организационных механизмов. М.: Наука, 1989.
6.Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. М.: Синтег, 2001.
7.Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы функ- ционирования социально-экономических систем с сообщением информации // Автоматика и Телемеханика. 1996. № 3. С. 3 - 25.
8.Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. М.: Наука, 1981.
9.Бурков В.Н., Новиков Д.А. Как управлять проектами. М.: Синтег, 1997.
10.Бурков В.Н., Новиков Д.А. Теория активных систем: состоя- ние и перспективы. М.: Синтег, 1999.
11.Гермейер Ю.Б., Ерешко Ф.И. Побочные платежи в играх с фиксированной последовательностью ходов // ЖВМ и МФ. 1974.
№ 14. С. 1437 - 1450.
12.Гермейер Ю.Б. Игры с непротивоположными интересами. М.:
Наука, 1976.
50