Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Турунтаев Л.П. Теория принятия решений

.pdf
Скачиваний:
358
Добавлен:
11.05.2015
Размер:
1.65 Mб
Скачать

91

Найти оптимальную стратегию, обеспечивающую максимальный средний доход.

Воспользуемся критерием Байеса:

B( p, x1) =100 0,4 + 25 0,3 +80 0,1+ 64 0,2 = 68,3;

B( p, x2 ) = 78; B( p, x3 ) = 62.

Лучший результат дает альтернатива x2 .

Рассмотрим измерение предпочтения альтернатив в порядковой шкале, осуществляемое методами ранжирования или парного сравнения. Пусть результаты измерения предпочтений будут представлены в виде матриц парных сравнений альтернатив

в каждой ситуации с элементами xijk , где i, j =1, m — сравни-

ваемые альтернативы xi X

и x j X ; k =

1,n

— оцениваемые

ситуации ek

 

 

 

 

 

k

 

k

k

1,

åñëè xi

f x j ;

xij

=

åñëè xk

f xk .

 

0,

 

 

j

i

Совокупность матриц парных сравнений (равно числу ситуаций) можно рассматривать как точки в пространстве упорядочения решений. В этом пространстве можно ввести понятие «средней точки» (средней матрицы парных сравнений) с коор-

динатами yij .

Для построения средней матрицы парных сравнений воспользуемся условием минимума суммарного расстояния этой матрицы от матриц парных сравнений для всех ситуаций [6].

n m m

 

∑∑∑pk (xijk yij )2 min,

k =1 i=1 j=1

yij

где pk — вероятность ситуации k .

Раскроем скобки и упростим выражение, минимизируемое по yij

92

n

m

 

)2 2xijk yij

+( yij )2

 

n

m

∑ ∑ pk (xijk

=∑ ∑ pk (xijk 2xijk yij + yij )=

k =1 i, j=1

 

 

 

 

k =1 i, j=1

n

m

 

n

m

 

 

1

 

 

 

 

 

 

 

= ∑ ∑ pk xijk

2∑ ∑ pk yij xijk

 

.

2

k =1 i, j=1

 

k =1

i, j=1

 

 

 

 

 

 

 

 

При заданных матрицах парных сравнений xijk первый член

в этом выражении является постоянным. Поэтому необходимо максимизировать L

m

n

 

 

1

 

 

 

 

 

 

L = yij pk xijk

 

 

max.

2

i, j

k =1

 

 

 

yij

Максимальное значение L достигается при

 

n

 

1

 

 

1, åñëè

pk xijk

;

2

 

k =1

 

 

 

yij =

n

 

1

 

 

 

 

pk xijk

 

 

0, åñëè

<

 

 

 

.

2

 

k =1

 

 

Средний выигрыш альтернативы определяется по формуле

 

m

 

 

 

 

 

yij

 

 

 

 

β =

j=1

, i =1,

m

.

 

m m

 

i

 

 

 

 

 

∑∑yij

 

 

 

 

 

i=1 j=1

 

 

 

 

Наилучшей альтернативой считается x j

= arg maxβi .

 

 

 

 

 

i

Пример

Пусть результаты предпочтений альтернатив в каждом состоянии внешней среды представлены (по данным табл. 5.1) в виде матриц парных сравнений

 

 

 

 

 

 

93

 

 

 

 

e1 : p1 = 0,4

 

 

 

 

e2 : p2 = 0,3

 

 

x1

 

x2

 

x3

 

 

x1

x2

x3

x1

1

1

1

 

x1

1

0

0

x2

0

1

1

 

x2

1

1

0

x3

 

 

 

 

 

 

x3

 

 

 

0

0

1

 

1

1

1

 

e3 : p3 = 0,1

 

 

 

 

e4 : p4 = 0,2

 

 

x1

 

x2

 

x3

 

 

x1

x2

x3

x1

1

 

1

 

1

 

x1

1

0

1

x2

0

 

1

 

0

 

x2

1

1

1

x3

 

 

 

 

 

 

x3

 

 

 

0

 

1

 

1

 

0

0

1

Определяем элементы средней матрицы предпочтений альтернатив. В ней yii =1, i =1,3,

y12 ={1 0,4 + 0 0,3 +1 0,1+ 0 0,2 = 0,4 + 0,1 = 0,5} =1.

Результаты расчетов будут следующими

 

 

 

 

 

x1

x2

x3

 

 

 

 

 

x1

1

1

1

β = 3/ 7

 

 

 

 

= x2

 

 

 

1

yij

 

 

 

1

1

1

β2 = 3/ 7

 

 

 

 

 

x3

0

0

1

 

 

 

 

β3 =1/ 7

 

 

 

 

 

 

 

 

Наилучшими альтернативами следует считать x1 и x2 .

5.2.3 Критерий минимума дисперсии оценочного функционала

m

Пусть δ i2 ( p, xi ) = pij [ yij Bi ( p, xi )]2 .

j=1

Оптимальная стратегия xk выбирается исходя из условия

94

x = arg

min δ 2

( p, x ) .

k

i

i

i

 

 

 

Решение характеризуется минимальным разбросом «полезности» относительно ее математического ожидания.

Пример

Исходные данные приведены выше в табл. 5.1.

δ i2 ( p, x1) = 0,4(100 68,3)2 + 0,3(25 68,3)2 + 0,1(80 68,3)2 + +0,2(64 68,3)2 = 981,81;

δi2 ( p, x2 ) = 714;

δi2 ( p, x3 ) = 456.

Лучший результат дает альтернатива x3 .

Данный критерий используется дополнительно при одинаковых средних доходах, найденных по критерию Байеса. Если решение реализуется однократно, то понятие среднего дохода теряет смысл. В этом случае для ЛПР более привлекательной может оказаться альтернатива, обеспечивающая максимальную вероятность того, что доход будет не менее некоторого, допустимого минимума.

5.2.4 Критерий максимума уверенности в получении заданного дохода

Зафиксируем величину α , удовлетворяющую неравенствам

α 1 <α<α 2 , где α 1

= min min yij ;

α 2

= max max yij .

 

i

j

 

i

j

Будем рассматривать α как некоторый порог, ниже которого уменьшать полезность нецелесообразно. Обозначим Eα,i

множество состояний внешней среды, при которых обеспечива-

ется выполнение неравенства yij ≥ α. Eα,i = Uej ( yij ≥ α xi ) .

j

Вероятность выполнения этого неравенства при условии использования стратегии xi :

Pα,i = P( yij ≥ α xi ) = P(ej Eα,i ) = p j ,

e j Eα,i

95

где p j — вероятность наступления события ej . Оптимальная стратегия определяется условием

x = arg

max P( y ≥ α

 

x ) .

 

k

i

ij

 

i

 

 

 

 

Пример

Исходные данные приведены в табл. 5.1. Оценим влияние величины порога на оптимальность стратегии.

Возьмем порог α > 80 . Вероятность выполнения этого неравенства:

а) для стратегии x1 Pα,1( yij >80 x1) = p1 = 0,4 ; б) для стратегии x2 Pα,2 = p4 = 0,2 ;

в) для стратегии x3 Pα,3 = p2 = 0,3 .

Оптимальной стратегией для α >80 будет x1 . Пусть α > 30 , тогда

x1 pα,1 = P( yij > 30 x1) = p1 + p3 + p4 = 0,7;

x2 Pα,2 = P( yij > 30 x1) = p1 + p2 + p4 = 0,9;

x3 Pα,3 = P( yij > 30 x1) = p1 + p2 + p3 = 0,8.

Оптимальной будет x2 и так далее.

Если исследовать диапазоны порогов, то получим оптимальные стратегии со следующими диапазонами:

x

при 80 < α ≤100

(P

= 0, 4;

P

 

= 0, 2;

 

P

 

= 0,3 èëè 0) ;

1

 

 

α,1

 

 

α,2

 

 

α,3

 

x

30 < α ≤ 70

(P

= 0,9;

P

= 0,7;

P

= 0,8),

при

 

α,2

 

 

α,1

 

= P

 

α,3

 

 

2

100 < α ≤120 (P

 

= 0,2; P

 

 

= 0);

 

 

 

α,2

 

α,1 α,3

 

 

 

 

 

 

 

 

 

 

x

при α ≤ 30 P

=1.

 

 

 

 

 

 

 

 

 

3

α,3

 

 

 

 

 

 

 

 

 

 

 

5.2.5 Модальный критерий выбора альтернатив

Сущность модального критерия выбора альтернатив состоит в том, что ЛПР при выборе альтернативы ориентируется на наиболее вероятное состояние среды.

96

Пусть максимум распределения вероятности приходится на

состояние среды el , т.е.

pl = max p j

. Тогда оптимальное реше-

 

j

 

 

ние x находится из условия F(x ,e ) = max y .

k

k l

i

il

 

 

 

Если имеется несколько состояний среды, которым соответствуют одинаковые максимальные вероятности { l j 1, l j 2 , ..., l jr },

то альтернатива выбирается таким образом, чтобы обеспечить максимум среднего значения оценочного функционала по всему множеству наиболее вероятных состояний:

1

r

 

1

r

F(xk , ejl ) = max

yijl .

r

r

l=1

i

l=1

Достоинство модального критерия состоит в значительном сокращении объема расчетов.

5.3Принятие решений в условиях неопределенности

5.3.1 Принятие решений при линейной упорядоченности состояний внешней среды

ЛПР не знает закона распределения вероятностей состояний внешней среды, но располагает информацией, позволяющей упорядочить эти состояния по вероятности их появления.

Последовательность принятия решения в рассматриваемой ситуации описывается следующим алгоритмом.

Шаг 1. Установить отношение порядка E1 на множестве Е состояний внешней среды.

Шаг 2. Найти точечную оценку распределения вероятностей состояния внешней среды, т.е. некоторое конкретное рас-

пределение p0 = ( p1, ..., pn ) , удовлетворяющее введенному на

первом шаге отношению порядка E1 .

Шаг 3. Для найденной точечной оценки найти оптимальную альтернативу по одному из критериев (или их группе), используемых для ПР в условиях риска.

97

Шаг 4. Проверить, является ли найденное решение оптимальным для всех других распределений p p0 , но удовлетво-

ряющих данной системе отношений порядка E1 . Если «да», то решение принимается, иначе — перейти к следующему шагу.

Шаг 5. Наложить на распределение p0 дополнительные ус-

ловия (их характер рассмотрен ниже) и проверить их выполнение. Если эти условия выполнены, то решение принимается,

иначе — ввести дополнительные отношения порядка в E1 и вернуться к шагу 2.

Рассмотрим алгоритм более подробно.

На шаге 1 ЛПР устанавливает отношение порядка на множестве Е. Простейший способ упорядочения — введение на множестве Е отношения предпочтения следующим образом:

ej f ek p j pk ; ej ,ek E; p j ,

где pk p — вектор распределения вероятностей внешней среды; p j — вероятность появления состояния ej . Если такое упорядочение выполнено для всех пар ( ej ,ek ) , то получаем линей-

ное отношение частичного порядка и будем считать, что состояния внешней среды перенумерованы таким образом, что p1 p2 ... pn .

Шаг 2. Вычисление точечных оценок распределений вероятностей, удовлетворяющих введенным отношениям порядка, может быть выполнено различными способами. Один из них предложен П. Фишберном. Оценки Фишберна p j образуют

убывающую арифметическую прогрессию вида

= 2(n j +1) =

p j n(n +1) , j 1,n.

Другие способы можно найти в работе [30].

98

Шаг 3. Находим оптимальную альтернативу, например, по

 

 

n

 

 

критерию Байеса: max B( p, xi ) = p j yij . Пусть это критерий

 

i

j=1

 

 

 

 

 

 

x = xk

 

 

n

 

при альтернативе k. B( p, xk ) = max p j

yij .

 

 

i

j=1

 

 

 

 

 

Шаг 4. Необходимо проверить, будет ли xk

оптимальным

решением не только для найденного распределения p j , но и для любого другого распределения, удовлетворяющего введенному

на шаге 1 отношению порядка E1 .

При использовании критерия Байеса xk f xi , i можно гарантировать тогда и только тогда, когда

n

(B( p, xk ) B( p, xi ) 0 или p j ( ykj yij ) 0 для всех i, p P,

j=1

(5.1)

где Р — множество распределений, удовлетворяющих заданно-

му отношению порядка E1 .

Очевидно, что для выполнения (5.1) необходимо и достаточно, чтобы

n

min p j ( ykj yij ) 0, i =1,m . (5.2)

p Ρ j=1

Поскольку выражение p P представляет собой в рассмат-

риваемом случае не что иное, как систему линейных ограничений, накладываемых на компоненты вектора Р, то выражение (5.2) определяет множество задач, состоящее из (m 1) задач

линейного программирования (при i = k условие 5.2 выполняется).

Шаг 5. Этот шаг и последующие удобнее рассмотреть на примере.

99

Пример

Пусть таблица значений оценочного функционала задана (табл. 5.2). Предположим, что на первом шаге алгоритма на множестве состояний среды E ={e1,e2 ,e3} введено отношение

частичного порядка с помощью неравенств p1 p2 p3, p1 + p2 + p3 =1.

Таблица 5.2 — Исходные данные

Стратегии

Состояния среды

 

e1

e2

e3

x1

8

2

4

x2

6

7

4

x3

4

7

5

x4

3

4

6

Вычислим по формуле Фишберна точечные оценки: p1 = 12 ; p2 = 13; p3 = 16 .

Для выбора оптимальной стратегии воспользуемся критерием Байеса. Математическое ожидание полезностей

B( p, x ) =8

 

1

+ 2

1

+ 4

1

= 5

1

;

B( p, x ) = 6;

B( p, x

) = 5

1

;

 

 

 

 

 

1

2

3

6

3

2

3

6

 

 

 

 

 

 

B( p, x4 ) = 3 54 .

Наилучшей стратегией по Байесу является стратегия x2 .

Проверим, для любого ли распределения вероятностей, удовлетворяющего заданному отношению порядка, эта стратегия оптимальна.

x2 f xi для всех альтернатив i, кроме второй, на любых допустимых распределениях вероятностей, если

Li = min[ p1( y21 yi1) + p2 ( y22

yi2 ) +

(5.3)

+( y23 yi3 )] 0, i {1,3,4};

 

 

 

100

p1 p2 p3;

p1 + p2 + p3 =1.

Таким образом, мы имеем 3 задачи линейного программирования (табл.5.3).

Таблица 5.3 — Задачи линейного программирования

Условие задачи

Решение

L1 = −2 p1 +5 p2 + 0 p3 min

L1min = −2

p1 p2 0

p1 =1

p2 p3 0

p2 = p3 = 0

p1 + p2 + p3 =1

 

p1, p2 , p3 0

 

L3 = 2 p1 p3 min

L3 min =

1

 

 

 

 

 

ограничения те же

 

3

 

 

 

 

 

 

 

 

 

 

 

= 1

 

 

 

 

 

 

p

= p

2

 

= p

3

 

 

 

 

 

 

1

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L4 = 3p1 +3p2 2 p3 min

L4 min =

 

4

 

 

 

 

 

ограничения те же

 

3

 

 

= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

= p

2

 

= p

3

 

 

 

 

 

 

1

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Как видно из табл. 5.3,

условие 5.3 Li

0

выполняется

только для стратегий

x3

и x4 , но не для x1 . Следовательно, ре-

шение

x2 , полученное на основе точечных оценок Фишберна,

лучше,

чем

x3

и

x4 ,

(x2 f x3, x2 f x4 ï ðè p Ρ) , но

x2 f x1

, åñëè

2 p1 +5 p2 0

— это дополнительное ограниче-

ние. Оно не противоречит ранее введенной системе ограничений (есть общая область допустимых решений и при этом условии). Если ЛПР считает, что последнее ограничение выполняется (а это так), то x2 оптимальна для любого распределения вероят-

ностей, которое может иметь место. Если бы ограничение не выполнялось (т.е. не было общей области допустимых реше-