книги / Математические методы в системах поддержки принятия решений
..pdfстранстве л-мерных функций полезности, обеспечивает приближение свернутого критерия с любой точностью и выбор альтернативы из множества Парето, однозначно соответствующий введенным ЛПР от ношениям предпочтения на значениях частных критериев. При этом принципиальную возможность существования на классах функций полезности частных критериев произвольной свертки в виде их супер позиции в классе базовых непрерывных функций утверждает теорема Колмогорова. В нашем случае базовое семейство непрерывных функ ций может представляться как непосредственно исходной совокупно стью частных критериев {//(х)}, / = Т|я, так и соответствующими им функциями полезности.
Конкретизируем класс функций полезности U, содержащий функ ции и,(Дх)). В основу определения положим эмпирические данные об
отношении ЛПР к риску и требования полноты класса, его минималь ности и простоты вычисления значений функции и, е U.
Класс U полон, если имеется возможность отыскания в нем функ ции и как приближения к истинной с точностью, определяемой исход
ными данными ЛПР в виде Ии.
Класс U минимален, если любое его сужение нарушает его полноту, или, что то же, исключает возможность восстановления функции и] со
гласно информации о предпочтениях ЛПР.
Под простотой вычисления понимается наличие возможности вы числения значений функции и] с низкой временной и емкостной слож
ностями.
Понятие «отношение ЛПР к риску» определяется на основе взаимно
го расположения математического ожидания Щ Ь\ лотереи L: |
и |
|
ее детерминированного эквивалента / на отрезке |
значений нор |
мализованного критерия, а также на основе зависимости такого располо жения от параметров лотереи:
Щ Ц = pfmia + (1 -рУ м *.
Определения. Лотереей L называется вероятностное событие, имею
щее два исхода f \ f " e [/mm>/maxL вероятности осуществления которых равны р и I — р соответственно.
Величину, которую ЛПР принимает равноценной лотерее, называют детерминированным эквивалентом.
ЛПР не склонно к риску, если оно предпочитает получить наверняка ожидаемый выигрыш в любой лотерее вместо участия в ней.
ЛПР склонно к риску, если оно предпочитает участие в любой лотерее вместо получения наверняка ожидаемого выигрыша этой лотереи.
ЛПР безразлично к риску, если ему безразлично, получит ли он исход лотереи или наверняка ожидаемый выигрыш.
З а м е ч а н и е . В теории принятия решений рассматривают также и другие меры от ношения ЛПР к риску: убывающую несклонность, возрастающую несклонность, убываю щую склонность, возрастающую склонность и др.
251
Возможные типы отношения ЛПР к риску в задачах принятия ре шений, соответствующие им условия для случаев положительной ори ентированности критерия и параметрические семейства функций пред ставлены в таблице
Отношение Л П Р к риску |
Определяющие условия |
|||||
безразличие |
|
|
М{Ц - |
/ |
|
|
|
|
|
|
|||
U2: постоянная несклон |
|
|
м щ > / |
|
||
ность |
|
|
|
|
|
|
убывающая несклон |
|
|
|
|
|
|
ность |
|
L = t f - A ,p ,f + A ) y |
||||
|
Г = |
|||||
|
Г - А |
, Л |
/ ' |
+ А), |
Д > 0 |
|
|
|
|
/ ' > |
/ |
|
|
|
/ ± |
А, / ' |
± А е |
l / min>/imx |
||
U4: невозрастающая не |
М Щ - |
/ < M(L') - |
Г |
|||
склонность |
|
|
|
|
|
|
U5: постоянная склонность |
|
|
Щ Ц < / |
|
||
U6: убывающая склонность |
|
|
|
|
|
|
возрастающая склон ность
Параметрические семейства функций
а+ bf\ b > 0
а- be~cf; b, с > 0
a f - b e ^ + d ; at b,c> 0
—a f - be~&+ d \ a, b9c> 0; f < - I n (afb)/c
a + be^y by c > 0;
—a f + bd*+ d ; a, b,c> 0, /, > ln(a/cb)/c
a f + b e& + d \ a y b y C > 0
Отметим условия, при которых, например для класса U2, справед ли
во представление экспоненциальным параметрическим семейством функций. Известно, что при несклонности ЛПР к риску функция по лезности вогнута, т. е. имеет место неравенство вида
«(/) > 0,5«(/•+ Af)+ 0,5utf-ДО,
где А/- — случайная величина, характеризующая «честную» лотерею с
P(f+ 4 0 = p ( f ~ АО = 0,5,
имеющая нулевое математическое ожидание и дисперсию Щ А / 2],
/ — текущее значение частного критерия. Очевидно, что существует ве личина f>fe (0, АО. при которой неравенство преобразуется в равенство
u { f - §0 = 0,5u(f+ АО + 0,5u i f - АО,
которому соответствует равенство в форме математических ожиданий
M [ u ( f - §/)] = M[u(f + АО], или u (f-b f) = M [u(f + АО]-
Теперь предположим, что функция полезности дифференцируема, и воспользуемся отрезками разложения в ряд Тейлора левой и правой частей последнего равенства. В результате получим соотношение вида
252
«(/) - 8/. «'(/) = M[u(f) + Af- «'(/) + 0,5A / 2 • «"(/)],
или
«(/) - 8/- «'(/) = «(/) + 0,5«"(/) • МА/Ч
или однородное дифференциальное уравнение относительно неизвест ной функции полезности
Л/[А/2 ]«"(/)
2 «'СО
при известных «(/Lx), «(/min) И 0 < «'(/Lx) < Ь > 0.
Пусть bf не зависит о т / это означает, что ЛПР свою несклонность к риску не связывает с текущим значением критерия Дх). Тогда получим
однородное линейное уравнение второго порядка с постоянными коэф
фициентами |
~ = к. Решение этого уравнения составляет искомый |
|
и '(f) |
класс — параметрическое семейство экспоненциальных функций U2.
Изложим постановку и принципы решения задачи свертывания ча стных критериев путем восстановления функций полезности по данным предпочтений ЛПР на парах физически возможных значений векторно го критерия (подробное изложение в [13] ).
Функция свертки может быть записана в виде
/(Л *)) = arg opt 0 ( q ( и, ( / (*)),...,«» (Л (*)))|И), |
(1) |
q*Q |
|
где и ^ х ) ) известны, i = 1, 2,..., п\
И — информация о СП для ЛПР; Фч — функционал, характеризующий степень соответствия функций
и, и q информации И.
Решение (1) требует определения класса функций Q, информации И, конкретизации функционала Фя и метода его оптимизации.
Схему определения класса Q в (1) введем, исходя из условий пред ставимости непрерывных функций многих переменных суперпозицией
непрерывных (базовых) функций меньшего числа переменных |
|
||
Q = {ЯФ ’ ЧФ = ЧКф.^1) , .... Ф,(/*)), J « |
1,.... т}, |
(2) |
|
где f J = (/^ , ...,/') — подвектор вектора исходных критериев; |
|
||
s |
|
|
|
1 Г |
— непрерывная функция tj< |
п числа переменных |
|
У=1 |
|
|
|
(ФП значений подвектора / ) ; |
|
|
|
ф,(/^)н «,(/•') |
при tj= 1, / у= /,; <р — суперпозиция ФП |
фy(/V), |
У=1,
253
Суперпозиции могут быть заданы следующим образом:
Я(Дх))= (рСф^'М)), ф2№ ) ) , .... фs(f*(x)); а„ а2, .... а,) =
s s
= Х а /Ф//'(х), |
«/ > 0, / = |
£ а , |
=1 |
|
|
/=1 |
|
|
/=1 |
|
|
ИЛИ |
|
|
|
|
|
?(/(*)) = фСф^Чх))), ф2(Л х)),.... фХ/Ч*)); Oto |
а„ |
а,) = |
|||
= Х«.Ф( ( / ' (х ))+а 0 Х а . а ^ ф , ( /' (х))ф;( / у(х))+... |
|||||
/=1 |
|
/=1 |
|
|
|
...+ а Г ‘а 1а 2...а,ф 1( / ‘(х))ф2( / 2(х))...ф1 ( J s (х)), |
|||||
(Хо > -1 , <Х| > 0, / = 1 |
, s, 1 + а 0 s J ^ O + a j a ,), |
а,, — шкалирующая кон- |
|||
станта. |
|
/=1 |
|
|
|
|
|
|
|
|
|
Отметим частные случаи этих суперпозиций: |
|
|
|||
S |
S |
|
|
|
|
1) ?(а,/(х)) = ^ a , , f t (х), |
=1, а, > 0, когда любая пара частных |
||||
/=1 |
<=1 |
|
|
|
критериев не зависит от всех остальных и все критерии нормированы;
2) ?(a,/(x)) = ^ aS '‘IS[a ,/#(x), l+ a0 =р](1+а0а,), Х а / =1>а<>0>
*=1 /=1 /=I /-1
когда любой частный критерий не зависит по предпочтению от всех
других и все критерии нормированы;
s
3) <7(/(х)) = Ш (х), когда реализуется принцип справедливого ком- /=1
промисса; такой вид агрегированного критерия имеет место при выпол нении аксиом Нэша (см. п. 7.7).
Очевидно, что компоненты вектора а подлежат определению (оце ниванию). Самая простая структура алгоритма их определения включа ет следующие операции
Ал г о р и т м
1.Предъявить эксперту совокупность пар
|
(х],,х?)е |
Xv czM0 <zRPt v, = 1, 2, |
|
|
при условии, что все другие xJtj - |
1, 2, |
у * v зафиксированы. |
||
2. Вычислить значения всех частных критериев в точках (ху-,х{,) и (xy-,xj), т.е. значе- |
||||
ния/,(Х|, х2......х'у....... |
хр), /,( * ,,х2, ....x f ....... |
хр), i = 1, 2....... |
s. |
254
3. Предъявить эксперту вычисленные пары значений критерия f t{x) с целью получе
ния от него информации в виде |
|
|
|
либо |
х2, .... *1......хр) ~ /,(х 1, х2...... х ? ,.... хр), |
||
либоу5(дс,,х2, ...,x j,....хр) > fi(xu х2......х*, -<хр), |
|||
Либо f i (ДГ|, Х2, |
Ху, ..., Х^) |
(Jf|t Х2, ...(Ху , Хр)* |
4. Составить систему неравенств и равенств вида
q(a,f(xx, х2, .... х'у......х,)) > <7(а,/(х,, х2, .... х*.......хр)),
q(a,f(xh х2......х'у.......хр)) < q(a,f(xu х2.......х ] ...... хр)),
q(&>f(x\, х2, |
•••» Ху,...» хр)) |
q(a, f (хх, х2, ..., x v, |
х^)), |
^ а |
, = 1, л/ > 0, |
v 6 [1,р], v = l , |
|
/»1 |
|
|
|
5. Найти решение системы п. 4 в виде, в общем случае, области приемлемых значе ний компонент вектора а = (а), а 2>—. **,)•
6. Предъявить область вычисленных значений вектора а эксперту с целью выбора им приемлемого значения а°.
В более общем случае для восстановления агрегированного крите рия q(f) применяется метод, данный в [13]. В (2) для ФП ф//5) при / > 2
(ФП второго уровня) ставится задача их восстановления, которая реша ется с помощью рекурсивного применения излагаемого в [13] метода. Согласно (2), класс Q полностью определяется заданием операции де композиции d(n, s), осуществляющей разбиение исходных критериев на s подвекторов, s = 1,2,..., п, и операции суперпозиции ФП второго уровня для любого фиксированного значения операции d(n, s). При
мером разбиения исходных критериев может быть выделение из них подвектора экономических критериев, подвектора критериев эксплуата ционной надежности и восстанавливаемости, подвектора критериев жи вучести и безопасности, подвектора эргономических критериев, подвек тора критериев пропускной способности и др.
Операция d(n, s) реализуется либо алгоритмически, либо последова
тельным экспертным заданием ее значения с учетом смыслового содер жания критериев. Операции суперпозиции (свертки) ФП второго уров ня (и более низких) конкретизируются на основе физического содержания задачи. Заметим, что определение класса Q конкретизацией операций d(n, s) и ф(фу, фу ) значительно проще, чем указание вида ФП
или проверка совокупности свойств исходных критериев и СП ЛПР. Фиксированное значение операции декомпозиции и конкретная супер позиция определяют однопараметрическое семейство функций.
255
Класс Q задается конечным набором семейств Qy, v = 1 , N, кото
рые упорядочиваются по сложности. Информация И формируется на основе определения областей Q f|,2 различимости по предпочтению
ЛПР фиксированных векторов /* с векторами / * e£2/j<2,
отличающимися от вектора f |
{K) лишь значениями двух критериев Д , Д , |
принадлежащих подвекторам |
* j 2. При этом И задается обучаю |
щей И0 и проверочной И„ выборками приближенных отношений экви валентности
где Г '" ' = ( - ,Д ’<‘>= (/,,н + Д в ) / 2 , - ,Д = (Дн + Дв ) / 2 , - ) ,
Дн> Дв> Дн> Дв — нижние и верхние границы области Q, ,2 со
ответственно. Погрешность соотношений (3) задается оценками1 |
|
89 = I /; - / Л < |Дв + ДнI /2 , j = 1, 2, |
(4) |
А *
где Д — неизвестное значение критерия Д, при котором (3) в точности
соответствует системе предпочтений ЛПР.
Функционал Фд = {Ф\ ,Ф *} является составным и конкретизируется
на основе соответствующего определению ФП условия: если х ' пред почтительнее х " (эквивалентно: fix') предпочтительнее fkx")), то
?(/(*')) ^ 0(Л*"))> и наоборот. Согласно этому условию, выборка И0 вида (3) и объема f0 определяет приближенную систему уравнений
Чуi f ' ) ~ Чуi f ‘ ), к = 1, f0 относительно параметров функции из се
мейства Qy, qy€ Qy. Решение этой системы эквивалентно минимизации
функционала, задаваемого метрикой р(чУ>Чу) в 4гмеРном пространстве выборок И0, где
Чу = ( 4 y ( f ' ° ' ) , - , 4 y ( f ' W )), Чу =(4yif ), -,4yif )).
Таким образом, Ф\ = piqv,qv) и его минимизация приводит к иско
мым параметрам a,, ctj,..., as функции qv.
Аналогично конкретизируется и функционал Ф2, но на выборке И„.
Решение задачи (1) строится итерационно. Номер итерации соот ветствует номеру семейства Qv (если v' > v", то Qv. сложнее Qv~). На ка
ждой итерации определяется приближение q'v для q путем минимиза
ции функционала Ф'я на Q и проверяется согласованность функции q с
СП ЛПР. В силу некорректности задачи (1) в рассматриваемой поста новке решение q ищется путем регуляризации метода минимизации
256
функционала Ф ', основанного на использовании оценок (4) и требова
ния устойчивости решения.
Выбор конкретной функции q'H также согласуется с оценками (4)
для Ип и определяется соотношением
v0 =aigm in{v:0*(^|H n)£e(8)} v = 1 , N, |
(5) |
где e(8) — согласованная с (4) точность определения ФП.
Если (5) не реализуется на Q, то выбирается q 'o, минимизирующая
фц на функциях q'v, v = 1 , N.
Приведем укрупненную блок-схему реализации изложенного здесь принципа формального представления критериев эффективности для проектируемых сложных систем.
Восстановление функций полезности значе ний частных критериев */(/•(*,)), / = 1, л? в классе функций, характеризующих различ ное отношение ЛПР к риску.
Генерация подклассов функций 0 V, v = 1, N, определяющих разбиение класса Q
Восстановление функций полезности подвекторов частных критериев <р(/-), / = 1, п
Восстановление агрегированного критерия q*(f(x)) в подклассе Qv, v= 1, N на основе обучающей выборки И0
Определение агрегированного критерия q*(f(x)) в классе Q на основе проверочной выборки Ип класса Q_____________________
Информация о результатах сравне ния оценок (f-n p J l ) и f*
Информация о подвекторах част ных критериев и видах суперпози ций
Информация о результатах сравне ния пар значений частных крите риев
Информация о результатах сравне ния пар значений подвекторов
Проверочная выборка Ип
Вариант программной реализации вычисления свертки частных критериев на ПЭВМ нами изложен в [74].
7.9.Сущность адаптивных процедур
Вадаптивных многокритериальных процедурах используются прав доподобные предположения о свойствах принципа оптимальности, о свойствах системы предпочтений и частичная информация о предпоч тениях на оценках частных критериев непосредственно при поиске луч-
И — 5396 |
257 |
шей альтернативы, т. е. в адаптивных процедурах решается задача опти мизации по частным критериям при неявно заданном принципе оптимальности в интерактивном режиме человека с ЭВМ. Для более полного представления сущности обратимся к одной из таких проце дур — алгоритму.
Пусть существует функция полезности u(F{(x) , ..., F„(x)) на множест ве оценок частных критериев, х е М0, М0 — выпуклое множество, F,(x), / = 1,/и — вогнутые функции; полагаем также, что u(Ft(x) , ..., F„(x)) во
гнута и дифференцируема.
Ал г о р и т м Ф р е н к а — В у л ф а
1.Выбрать начальную точку — альтернативу х1е М0.
2.Определить оптимальную величину наиболее сильного возрастания и() как реше ние задачи
|
max(V,w(),у), х е М„. |
|
(1) |
Положить |
= у* - х*, jA — решение задачи (1); алгоритм решения см. в п. 6.1. |
|
|
3. |
Определить оптимальную величину шага t k по этому направлению (dk) как реше |
||
ние задачи |
|
|
|
|
maxj/(/'i(x* + dkt).....F„(xk + tdk)), 0 <. |
1. |
(2) |
|
X |
|
|
Положить x*+1 = JC* + **//*, k = k + \ и возвратиться к on. 2.
Так как функция и не задана в явном виде, то оп. 2 и 3 не могут быть непосредствен но реализованы; нужна дополнительная информация от ЛПР.
4. Получить информацию по оп. 2. Продифференцировать и( ) по х, получить
(3)
где неизвестные величины | - ^ - | считать положительными; тогда в (1) и (3) целевую
\ZFiJ
функцию можно поделить на [ |
1 , и задача примет вид |
к\
max |
■УхЪ(*к),У , уе |
М0. |
у |
/ |
|
|
|
|
Теперь необходимо определить W k = [ I |
1 , что на практике сводится к определе- |
|
{ d u / d F J |
|
|
нию изменений Aj первого и А/ /-го критериев, и тогда W к = |
/ = 1,я; величины А* оп- |
ределяет ЛПР после того, как выбрано малое значение Д|.
4а. Информация по оп. 3: оптимизация вдоль направления d k для (2) осуществляется
также с помощью ЛПР. |
__ |
В связи с этим строят кривые /}(** + tdk), /= |
1 ,w, на одном графике при |
Затем ЛПР по этому графику выбирает значение г. Видно, что эта задача сложная. К на стоящему времени предложены и более эффективные адаптивные процедуры, например
в [39].
Г л а в а в о с ь м а я
Методы выбора решений при риске
К настоящему времени исследовано чрезвычайно большое количе ство разнообразных практических ситуаций и соответствующих им ме тодов принятия статистических решений — решений при риске. Поэто му в настоящей главе излагаются только отдельно взятые из них базовые, широко известные байесовы, последовательные и небайесовы методы или, иначе, методы принятия решений при полной и неполной статистической априорной информации.
Одни из них, как, например, рассмотренные в гл. 4, построены с использованием статистики в виде отношения функций правдоподо бия проверяемых альтернативных простых или сложных гипотез, дру гие — свободны от вида распределения, они построены с использова нием специальных статистик — статистик в виде мер различия между распределениями проверяемых альтернативных гипотез, либо в виде полярностей — знаков независимых наблюдений (измерений), значе ний рангов соответствующих отсчетов измерений, либо в виде числа кластеров, на которые разбивается исследуемая выборка наблюдений, и др.
8.1. Методы выбора решений, основанные на использовании отношения функций правдоподобия
Согласно необходимым и достаточным условиям оптимальности выбора решений при риске (они изложены в четвертой главе), имеет место важный вывод: структура правил (алгоритмов) решения сводится к сравнению статистики в виде отношения функций правдоподобия с пороговым уровнем. При этом значение порога однозначно устанавли вается для каждого конкретного метода, а статистика вычисляется по наблюденной выборке и заданным в пространстве выборок функциям правдоподобия — условным распределениям вероятности проверяемых гипотез. Конкретные примеры вида статистик и порогов для различных методов и функций правдоподобия применительно к двуальтернатив ным ситуациям приведем в таблице, в которой введены обозначения:
М — метод,
А— Байесовский метод минимизации среднего риска, Б — минимаксный, В — максимума апостериорной вероятности,
17* |
259 |
Г— максимума правдоподобия,
Д— Неймана — Пирсона — метод минимизации вероятности про пуска при фиксированной вероятности ложной тревоги,
Е — идеального наблюдателя (Зигерта — Котельникова) — метод минимизации средней вероятности ошибок,
Ж — энтропийный — метод минимизации остаточной неопреденно сти,
3 — последовательный — метод минимизации средней стоимосп наблюдений (среднего значения объема выборки),
И— локально равномерно наиболее мощный.
В приведенных в таблице примерах предполагалась известной точ ность измерений, принимающая одно и то же значение для всех компо нент выборки. Однако в реальных ситуациях это предположение не все гда может выполняться: точность измерений будет известна лишь ] среднем. В этом случае точностную характеристику целесообразно опи сывать распределением вероятности. Последнее может быть установлю но, например, согласно концепции о максимальной энтропии. Соответ ствующий вариант решения содержится в [80]. Очевидно, что правил: принятия решений при этом должны быть уточнены.
Теперь рассмотрим задачу, для решения которой применяется метод отношения максимальных значений функций правдоподобия для слож ных гипотез и вербальный подход.
Задача. Пусть имеется выборка векторов отсчетов (измерений) X = {х,}, / = 1, N , где1
каждый вектор л:, = (xh х2,..., х„) определяется л компонентами |
и может быть порожден, |
|
каким-то одним объектом Xq = (Xj, Х2,..., ХЛ)9 из |
совокупности |
А = {Х^}, q — \,Q, где С |
подлежит вычислению (оцениванию). Параметры |
(Xh Х2,..., ^n)q |
неизвестны, они принад |
лежат области Q. Требуется определить гарантированные оценки количества объектов и значений их параметров, а также установить возникновение факта небезопасного состоя-, ния контролируемой ситуации.
Р е ш е н и е . Одним |
из возможных путей решения задачи является разбиение- |
кластеризация выборки X на подмножества-кластеры, однозначно соответствующие поро |
|
ждающим их объектам. |
___ |
Разбиение осуществим по результатам отождествления каждой пары {х„ х7), i j е 1, Л векторов отсчетов при условии, что имеет место гипотеза: векторы {х„ Xj} порождены од ним и тем же объектом с параметром X, либо — альтернативная гипотеза: векторы {x/,x7) порождены разными объектами с параметрами \ q и Хц, (Х^ * Хц). При этом полагаем, что функции правдоподобий
/>(*,, Xj/ X) = p{x-J X) р(х/ X), X » X^ » \ ,
P(xh Xj/ Х^, Хц) p (x j Хц) p(Xj/ Х^)
и описываются нормальными плотностями вероятности.
Отождествление векторов {х„ х7) выполним на основе сравнения отношения макси мальных значений функций правдоподобия для рассматриваемых гипотезы и альтернати вы с пороговым значением п(а). Последнее задается согласно допустимой вероятности с неотождествления векторов {*,, х7}, когда в действительности они порождены одним и тем же объектом.
При превышении вычисленным значением отношения правдоподобий пороговой уровня я(а) принимается решение об отождествлении векторов {х,, х7) в противном слу чае — решение, что эти векторы порождены разными объектами, т.е. х, = Xj.
260