Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

матричные игры

.pdf
Скачиваний:
58
Добавлен:
10.05.2015
Размер:
265.04 Кб
Скачать

10

Работа 2. Статистические решения

2.1. Основные понятия теории статистических решений

Выбор наилучших решений в условиях полной и неполной информации – одно из основных занятий людей. Принятие управленческих решений в условиях неполной или неточной информации сопряжено с неизбежным риском понести немалые убытки, причинить вред здоровью или вместо Сочи оказаться в šсолнечномŸ Магадане в случае принятия ошибочного решения.

Когда мы знакомились с азбучными истинами теории игр, то предполагали, что участниками игры являются люди, способные принимать разумные решения. Другая ситуация возникает в т.н. играх против природы, где человек, разумный по предположению, противостоит непознанному им явлению. Девушка раскладывает пасьянс в надежде выяснить šлюбит - не любитŸ и расстраивается, если пасьянс не сходится. Собираясь в туристический поход, юноша укладывает вещи в рюкзак с учетом непредсказуемой погоды, надеясь получить максимум удовольствий, не превращаясь в рекордсмена по переноске тяжестей. Колумб плывет на запад, чтобы достичь Индии, и к неудовольствию королевы возвращается без золота и пряностей, Фермер сеет ячмень в надежде на прибыль, но урожай гибнет на корню; в последующие годы он повторяет эксперимент в надежде, что ему повезет.

Человек обычно сетует на судьбу и не благодарит ее, когда šповезлоŸ. Едва ли стоит вкладывать в природу (судьбу, высшие силы…) априорную злонамеренность или предрасположенность по отношению к человеку, хотя человек подчас делает многое, чтобы вывести окружающую среду из состояния равновесия.

Теория статистических решений может быть истолкована как теория поиска оптимального поведения в условиях неопределенности (неполноты информации). Как и в случае игры между людьми, поведение может быть детерминированным или недерминированным (предлагающим использовать те или иные возможные выборы с некоторыми вероятностями).

11

Как мы уже говорили, следствием неопределённости является

риск. Современная концепция статистического решения считает поведение оптимальным, если оно минимизирует риск в последовательных экспериментах, т.е. ожидаемые убытки статистического эксперимента.

Если быть более точным в терминологии, то следует различать

ситуацию риска и ситуацию неопределённости.

Мы говорим о риске, когда имеется статистическая информация о подобных решениях и существует возможность оценить вероятности, связанные с последствиями принятия решения.

Неопределённость существует тогда, когда нет соответствующей статистики, нет возможности объективно оценить указанные вероятности (иногда здесь говорят о дурной случайности).

Математизированная постановка задачи выбора решения в условиях неопределённости (риска) сводится к следующему.

Пусть задан некоторый вектор S = (S1,S2,..,Sn), описывающий n

состояний внешней среды, и вектор X = (X1,X2,..,Xm), описывающий m допустимых решений. Требуется найти вектор X*=(0,..,0, Xi, 0,..,0),

который бы обеспечивал оптимум (наибольшее или наименьшее значении) некоторой функции полезности W(X,S) по некоторому

критерию K.

Если трактовать термин šполезностьŸ достаточно широко, то значение оптимума функции W(X,S) раскрывается из постановки конкретной задачи (если обсуждается получение прибыли, то значение функции стремятся максимизировать, если речь идет о затратах – минимизировать).

Информацию oб указанной функции полезности часто представляют матрицей размерности m n c элементами Wij = F(Xi,S j),

где F решающее правило (определяемое из постановки конкретной задачи).

Формирование решающего правила во многом предопределяет конечный результат расчетов (в случае его ошибочности едва ли принимаемое решение окажется наилучшим) и возможно лишь при достаточно четкой экономической постановке задачи.

12

Разные представления о šхарактереŸ внешней среды определяют и разные критерии (разные подходы) к выбору наилучшего решения

Так в ситуации риска имеющиеся статистические данные позволяют оценить вероятность того или иного состояния внешней среды, и этот опыт может быть использован для оценки будущего.

Соответственно, при известных вероятностях Pj возникновения состояния Sj можно найти математическое ожидание функции полез-

n

ности Wi j Pj и сделать выбор Xi, обеспечивающий его максимум:

j 1

n

 

W = max Wi j Pj .

(1)

i 1..m j 1

 

В ситуации неопределённости многообразие критериев несколько больще.

Критерий Лапласа. Когда невозможно выяснить вероятности возникновения того или иного состояния внешней среды, по принципу недостаточного основания (нет оснований полагать, что то или иное состояние возникает чаще других), им сопоставляют равные значения pi=1/n и находят средний эффект для каждого из рассматриваемых вариантов решения, выбирая тот из них, для которого средний эффект максимален:

 

1

n

 

W = max

Wi j .

(2)

n

i 1..m

 

j 1

 

 

 

 

Критерий Вальда (критерий наибольшей осторожности, или пессимистический критерий). Для каждого из рассматриваемых вариантов решения Xi выбирается самый худший отклик среды (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект:

W = max min Wi j .

(3)

i 1..m j 1..n

 

Критерий Гурвица. Ориентация на самый худший исход является своеобразной перестраховкой, однако опрометчиво выбирать и

13

излишне оптимистичную политику. Критерий Гурвица предлагает

некоторый компромисс:

 

 

W = ma x [ max Wi j

+( 1 - ) min Wi j ] ,

(4)

i 1..m

j 1..n

j 1..n

 

где параметр 0 1 выступает как коэффициент оптимизма.

К примеру, при =0 (полный пессимизм) критерий Гурвица превращается в критерий Вальда, при =0,5 мы расцениваем равновероятно шансы на успех и неудачу, при =0,8 мы более восторженно воспринимаем свои шансы на успех. Выбор =1 вызывает определенные сомнения в трезвом подходе к решаемой задаче. В некоторых сферах человеческой деятельности, например, при оценке сроков выполнения работ предпочитают выбор =0,4 (выводы делайте сами).

Особое место занимает критерий Сэвиджа. При выборе решения по этому критерию:

1) матрице полезности сопоставляется новая матрица – матри-

ца сожалений с элементами Dij = Wij - max (Wij), которые отражают

i

убытки от ошибочного действия, т. е. выгоду, упущенную в результате принятия i-го решения в j-м состоянии;

2) по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления

W =

max min Di j .

(5)

 

i 1..m j 1..n

 

(минимум упущенной выгоды при принятии данного решения) . Вполне логично, что различные критерии приводят к различ-

ным выводам относительно наилучшего решения. Каждый вывод звучит не категорически и сопровождается комментарием šесли…Ÿ

Вместе с тем, возможность выбора критерия дает свободу лицам, принимающим экономические решения (если они, конечно, располагают достаточной информацией для постановки подобной задачи). Любой критерий должен согласовываться с намерениями решающего задачу и соответствовать его характеру, знаниям и убеждениям.

14

2.2. Пример постановки и решения задачи

Некая фирма, идя навстречу пожеланиям сельхозпроизводителей, которые нуждаются в хранении зерна, решила построить элеватор и эксплуатировать его в течение 5 лет (за эти годы хотелось бы рассчитаться за беспроцентные кредиты на строительство и получить заслуживающую внимания выгоду). Имеются типовые проекты элеватора мощностью на 20, 30, 40, 50 и 60 тыс. центнеров зерна.

Посевные площади сельхозрайона составляют 1430 га. Строительство элеватора мощностью 20 тыс. ц обойдется в 300 тыс. денежных единиц и эти затраты возрастают на 10% с ростом мощности элеватора на 10 тыс. ц. Согласование проекта с районными властями, реклама будущего элеватора, строительство подъездных путей и вспомогательных сооружений обойдется в 185 тыс. денежных единиц. Затраты на эксплуатацию элеватора мощностью 20 тыс. ц. составляют 10 тыс. д.е. и убывают на 10% при увеличении мощности на 10 тыс. ц. За хранение зерна на счет элеватора вносится плата в размере 10 д.е. за 1 ц. Урожайность в данном районе колеблется от 14 до 20 ц с 1 га. Практика показывает, что зерновой запас элеватора расходуется за год и возобновляется при новом урожае. Какой элеватор выгоднее построить?

Если бы мы точно знали, каким будет урожай в каждом из пяти лет, то решение задачи можно было бы поручить добросовестному пятикласснику. Но в реальности …

Построив большой хороший элеватор, оснащенный автоматикой и затратив значительную сумму, мы можем столкнуться с малым урожаем и, соответственно, с малым доходом от хранения. С другой стороны, построенный малый элеватор может не вместить большой урожай и будет упущена возможная выгода.

Примем типовые проекты элеваторов за вектор допустимых решений:

х = xi = ( 20, 30, 40, 50, 60 ) ( i = 1 5);

оценки урожайности в данном районе (здесь можно взять и другую сетку значений) примем за вектор состояний внешней среды:

15

 

S = Sj =( 14, 15, 16, 17, 18, 19, 20 )

( j = 1 7)

и попытаемся построить матрицу полезности, элементы которой показывали бы эффективность принятия i -го решения в случае j –ой урожайности.

Затраты на сооружение элеватора и инфраструктуру составляют

300000 + 30000 (xi –20)+185000. Эти деньги по соглашению с кредитором придется возвратить равными долями в течение пяти лет.

Ежегодные затраты на эксплуатацию элеватора составляют

10000 – 1000(xi –20).

Что касается доходной части, то здесь приходится учесть, что деньги мы получаем от реального урожая, который оказалось возможным поместить в элеваторе, Реальный урожай определяется величиной 1430 sj центнеров. Возможности элеватора - xi 1000 центнеров. Следовательно, сохраняемый объем зерна не превысит этих значений

и будет равным min (1430 sj , xi 1000) и плата за хранение составит 10 min (1430 sj , xi 1000).

Если просуммировать доходы-затраты за пять лет и разделить на

5, то мы получаем

средний доход в год (принимаем его за функцию

полезности) в виде матрицы с элементами

 

 

 

 

 

Wij = 10 min (1430 sj , xi 1000)

 

 

 

 

 

 

–[ 60000 + 600 (xi –20)+37000 ]

– [10000 - 100 (xi –20) ] .

 

Выполнив несложные расчеты, заполним матрицу Wij :

 

 

 

 

 

 

 

 

 

 

 

 

s1=14

s2=15

s3=16

s4=17

s5=18

s6=19

s7=20

 

 

x1=20

93000

93000

93000

93000

93000

93000

93000

 

 

x2=30

88200

102500

116800

131100

145400

159700

174000

 

 

x3=40

83200

97500

111800

126100

140400

154700

169000

 

 

x4=50

78200

92500

106800

121100

135400

149700

164000

 

 

x5=60

73200

87500

101800

116100

130400

144700

159000

 

Если есть статистические данные, позволяющие оценить вероятность той или иной урожайности в рассматриваемом районе:

Р = ( 0,01; 0,09; 0,1; 0,25; 0,3; 0,2; 0,05 ),

то можно найти математическое ожидание величины прибыли Wi для

16

каждого из вариантов решения (типовых проектов элеваторов)

n

Wi j Pj и определить оптимальный выбор проекта, обеспечивающий

j 1

получение максимальной прибыли. Например,

W2= 88200 0,01+102500 0,09+116800 0,1+131100 0,25 + +145400 0,3+159700 0,2+174000 0,05 = 138822.

Xi

20

30

40

50

60

Wi

93000

138822

133822

128822

123822

Напрашивается вывод: в рассматриваемых условиях самым целесообразным будет выбор проекта на 30 или 40 тыс. ц, что дает надежду на максимум прибыли 138822 д.е.

Если никакой статистики об урожайности не обнаружено, то приходится прибегнуть к многообразию критериев (многообразию начальных посылок к размышлению).

Если считать шансы на ту или иную урожайность равновероят-

n

ными, то находим средние значения полезности Wi(L)= 1n Wi j для

j 1

каждого из вариантов решения, например,

W2 = (88200+102500+116800+131100+145400+ +159700+174000) / 7 = 131100

и по критерию Лапласа (2) устанавливаем оптимальность выбора проекта элеватора мощностью 30 тыс. ц с ожидаемой прибылью 131,1 тыс. д.е.

Если выбирать самый худший вариант по величине прибыли для каждой альтернативы (наименьшие значения wi(B) полезности в строках матрицы W), можно из таких самых плохих оценок эффекта наших возможных выборов выбрать наилучший. Таким образом, по критерию Вальда обнаруживаем, что следует построить элеватор мощностью 20 тыс. ц и оправдываться, что даже в самом худшем случае здесь гарантирован максимум возможной прибыли 93 тыс.

Обратившись к оценкам по критерию Гурвица при трех различных уровнях оптимизма (α=0,2; 0,5; 0,8), обнаруживаем целесообразность выбора проекта элеватора мощностью 30 тыс. ц с ожидаемой

17

прибылью соответственно 105360, 131100, 156840 д.е.

 

wi(L)

wi(B)

α=0.2

α=0.5

α=0.8

X1=20

93000

93000

93000

93000

93000

X2=30

131100

88200

105360

131100

156840

X3=40

126100

83200

100360

126100

151840

X4=50

121100

78200

95360

121100

146840

X5=60

116100

73200

90360

116100

141840

При подходе с позиций критерия Сэвиджа (упущенных возможностей и последующего сожаления об этом) строим матрицу сожалений D, вычитая из столбцов матрицы полезности наибольшие значения, и применяем к ней пессимистический критерий Вальда, дающий наименьшее значение максимального сожаления.

Для нашего примера по этому критерию оптимален проект элеватора мощностью 30000 ц. (прибегая к этому выбору, мы рискуем потерять прибыль до 4800 д.е.)

 

s1=14

s2=15

s3=16

s4=17

s5=18

s6=19

s7=20

min

x1=20

0

-9500

-23800

-38100

-52400

-66700

-81000

-81000

x2=30

-4800

0

0

0

0

0

0

-4800

x3=40

-9800

-5000

-5000

-5000

-5000

-5000

-5000

-9800

x4=50

-14800

-10000

-10000

-10000

-10000

-10000

-10000

-14800

x5=60

-19800

-15000

-15000

-15000

-15000

-15000

-15000

-19800

Таким образом, практически по всем критериям отдается предпочтение проекту 30000 ц и лишь глубокий пессимист во взглядах на ожидаемый урожай отдаст предпочтение проекту 20000 ц с гарантией ожидаемой прибыли лишь в 93 тыс. д.е. и значительных упущенных возможностей. Остальные проекты рассматривать явно нецелесообразно.

2.3.Вопросы для самоконтроля

1)В чем разница между понятиями šприбыльŸ и šожидаемая прибыльŸ?

2)Как изменится форма вышеприведенных критериев, если šфункция полезностиŸ определена как оценка затрат от принятых

18

решений?

3) Будет ли ошибочной замена в записи функции полезности для приведенного примера выражения min (1430 sj , xi 1000) на выражение:

а) 1000 xi ;

b) 1430 sj

; с) min (1430000 sj xi) ?

4)Как бы вы поступили с функцией полезности для рассмотренного примера, если погашение кредита на строительство должно осуществиться за 5 лет, но срок службы элеватора составит 10 лет?

5)Как изменится функция полезности для рассмотренного примера, если срок службы элеватора составит 10 лет, но кредит на строительство получен на 5 лет под 15% годовых?

6)Предположим, что характеристика внешней среды представляет собой непрерывную величину S, меняющуюся в интервале [a,b] c вероятностью p(S), и функция полезности W(x, S) непрерывна и дифференцируема по х и S. Можно ли отыскать оптимальное решение х, если:

a)найти max minW ( x, s ) (кстати, как это можно сделать);

x s

b

b) найти maxx p( S ) W( x,S )dS ? a

Есть ли какой-то смысл в этих предложениях?

2.4. Контрольные задания

2.4.1. Требования

Выберите вариант контрольного задания. Определите вектор состояний внешней среды и вектор решений. Постройте функцию полезности и выполните решение задачи, используя предложенные выше критерии. Оцените полученное оптимальное решение с позиций здравого смысла.

2.4.2.Варианты заданий

1.Фирма может за небольшую плату (100 руб.) составить любому ленивому студенту программу для каких-то типовых расчетов на

19

компьютере. Каждый сотрудник фирмы может качественно выполнить до 10 заказов. Стоимость аренды машинного времени составляет 800 руб. в месяц (этого времени достаточно для выполнения 10 работ). Количество студентов, пользующихся услугами фирмы, не превышает 100 человек в месяц. Определить число сотрудников фирмы, дающее максимум общего дохода (для регистрации фирмы необходима численность не менее двух человек).

2.Землевладелец на знойном юге решает вопрос о числе рабочих, привлекаемых к уборке томатов. Виды на урожай колеблются в зависимости от погоды от 500 до 800 центнеров, закупочная цена стабильна и равна 5 руб/кг. Рабочий за сезон собирает 20 центнеров, получая 1,2 руб/кг за уборку и 280 руб. для оплаты стоимости проезда к месту работ. Затраты на обеспечение рабочих жильем (речь не идет даже о трехзвездочной гостинице) составляют 300 руб. и не зависят от численности.

3.В сельхозрайоне с посевной площадью 1430 га решено построить элеватор по одному из типовых проектов на 20, 30, 40, 50 или 60 тыс. центнеров зерна. Привязка проекта обойдется в 37 тыс. руб.

Стоимость материалов и оборудования для элеватора мощности 20 тыс. ц зерна равна 60 тыс. руб. и увеличивается на 10% с ростом мощности на каждые 10 тыс. ц. Затраты на эксплуатацию элеватора мощности 20 тыс. ц зерна равны 10 тыс. руб. и увеличиваются на 10 тыс. руб. c ростом мощности на 10 тыс.ц. За хранение зерна на счет элеватора вносится плата 10 руб. за центнер. Урожайность колеблется от 14 до 20 ц /га. Какой элеватор выгоднее построить?

4.Председатель сельхозкооператива решает закупить бочки для засолки огурцов. Виды на урожай колеблются от 700 до 1000 кг, в бочку вмещается 50 кг, цена бочки – 300 руб., затраты на засолку – 20 руб. за бочку, аренда места на рынке – 50 руб., цена реализации – 7,20 руб./кг.

5.Универмаг, работающий по 10 часов в сутки, ежедневно посещают от 7 до 10 тыс. чел. Стоимость покупок одного посетителя в среднем – 50 руб. Время обслуживания – 1 мин. на покупателя. Затраты на оборудование одного рабочего места – 2400 руб., зарплата про-