Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

645_Galkina_M.JU._Metody_optimal'nykh_reshenij_

.pdf
Скачиваний:
4
Добавлен:
12.11.2022
Размер:
1.76 Mб
Скачать

цам, на деле представляют собой те единицы, которые не подлежат распределению.

Пример 9

В цехе предприятия имеются 5 универсальных станков, которые могут выполнять четыре вида работ. Производительность каждого станка при выполнении каждой работы задается матрицей С. Найти наиболее рациональное распределение работ между станками, максимизирующее суммарную производительность станков, если каждый станок можно загружать только од-

ной работой.

11

 

5

11

6

 

10

11

9

11 .

 

7

8

6

8

 

4

2

0

5

модель задачи. Пусть

6

Составим4 3

математическую7

 

1,если

− й станок выполняет −ю работу

=0,иначе

i= 1,2,3,4,5, j = 1,2,3,4

Каждый станок должен выполнять не более одной работы:

x11 x12

x13 x14 1,

x

21

x

x

x

1,

 

22

23

24

 

 

 

x32

x33 x34 1,

x31

x

41

x

x

x

1,

 

42

43

44

1.

x

x

x

x

 

51

52

53

54

 

Каждая работа должна выполняться только одним станком:

x11 x21 x31 x41 x51 1,

x12 x22 x32 x42 x52 1,

x13 x23 x33 x43 x53 1,

x14 x24 x34 x44 x54 1.

Условие неотрицательности переменных: xij 0, i = 1,2,3,4,5, j = 1,2,3,4.

Суммарная производительность:

Z 5x11 11x12 6x13 11x14 10x21 11x22 9x23 11x24 7x31 8x32 6x338x34 6x41 4x42 3x43 7x44 4x51 2x52 5x54 max.

Т.к. матрица С не квадратная, то введем фиктивный 5-ый вид работ с нулевыми производительностями для всех станков.

Перейдем к задаче минимизации. Для этого вместо функции Z рассмотрим функцию –Z и будем использовать, что max(Z) = –min(–Z). В матрице С поменяем все знаки элементов на противоположные.

41

 

 

5

11

6

 

 

 

 

11

9

 

 

10

С 7

8

 

6

 

 

 

6

4

 

3

 

 

 

 

 

 

 

4

2

 

0

 

 

 

 

6

0

5

0

11

 

1

0

2

0

 

 

 

11

1

0

2

0

8

 

1

3

4

0

7

 

 

 

 

1

3

5

0

5

 

 

 

I 1

III

2

V 5

11 0 I 11

11 0 II 11

8 0 III 8

7 0 IV 75 0 V 5

Этап 1

Для того чтобы все элементы матрицы стали неотрицательными, найдем в каждой строке максимальный по модулю элемент и прибавим этот модуль ко всем элементам соответствующей строки.

Этап 2

В каждом столбце находим минимальный элемент и вычитаем его из всех элементов соответствующего столбца.

5

0

3

0

6

Проводим минимальное количество вертикальных и горизон-

 

 

 

 

 

0

0

0

0

6

тальных линий, пересекающих все нули. Таких линий 5, по-

0

0

0

0

3

этому преобразования матрицы закончены.

0 3 2 0 20 3 3 0 0

Этап 3

Порядок составления матрицы X:

1.Т.к. в 5-ом столбце преобразованной матрицы имеется единственный элемент равный 0 (c55=0), то x55=1, а все остальные элементы 5-го столбца и 5- ой строки матрицы X равны 0. В матрице С исключаем из дальнейшего рассмотрения 5-ю строку и 5-ый столбец.

 

 

 

0

 

5

0

3

0

6

 

 

 

 

0

 

 

0

0

0

0

6

 

 

 

 

 

 

 

 

 

0 ,

C 0 0 0 0

3 .

X

 

 

 

 

 

0

 

 

0

3

2

0

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 0

0 0 1

 

 

0 3 3

0

0

 

2.Среди оставшихся невычеркнутыми элементов матрицы С нет строки или столбца, содержащих единственный 0. Поэтому выберем любой 0, например, c12=0. Поэтому считаем, что x12=1, а все остальные элементы 1-ой строки и 2- го столбца матрицы X равны 0. В матрице С исключаем из дальнейшего рассмотрения 1-ю строку и 2-ой столбец.

42

 

0

1

0

0

0

 

5 0 3 0

 

6

 

 

 

0

 

 

0

 

 

0

0

0

0

 

6

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

0 ,

C 0

0

0

0

 

3 .

X

 

 

 

 

 

 

 

 

0

 

 

0

 

 

0

3

2

0

 

2

 

 

 

 

 

 

 

 

 

 

 

 

0

0

0

0

1

 

 

0

3

3

0

 

0

 

 

 

 

 

 

 

 

 

3.Среди оставшихся невычеркнутыми элементов матрицы С нет строки или столбца, содержащих единственный 0. Поэтому выберем любой 0, например, c21=0. Поэтому считаем, что x21=1, а все остальные элементы 2-ой строки и 1- го столбца матрицы X равны 0. В матрице С исключаем из дальнейшего рассмотрения 2-ю строку и 1-ый столбец.

 

0 1

0

0

0

5 0 3 0

6

 

 

 

1

0

0

0

0

 

 

0

0

0

0

6

 

 

 

 

 

 

 

 

0

 

 

0 ,

C 0

0

0

0

3 .

X

0

 

 

 

 

0

0

 

 

0

 

 

0

3

2

0

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

0

0

1

 

 

0

3

3

0

0

 

 

 

 

 

 

 

4.Т.к. в 3-ем столбце преобразованной матрицы имеется единственный элемент равный 0 (c33=0), то x33=1, а все остальные элементы 3-го столбца и 3- ей строки матрицы X равны 0. В матрице С исключаем из дальнейшего рассмотрения 3-ю строку и 3-ий столбец.

 

0 1 0

0

0

5 0 3 0

6

 

 

 

1

0

0

0

0

 

 

0

0

0

0

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

0

0 ,

C 0

0

0

0

3 .

X

0

 

 

0

0

0

 

0

 

 

0

3

2

0

2

 

 

 

 

 

 

 

 

 

0

0

0

0

1

 

 

0

3

3

0

0

 

 

 

 

 

 

 

 

 

 

 

 

 

5. Т.к. c44=0, то x44=1.

Итак, оптимальное решение задачи о назначениях:

 

0

1

0

0

0

 

 

1

0

0

0

0

 

 

 

 

*

 

0

1

0

0

X

0

0 0 0 1 00 0 0 0 1

Т.к. последний столбец матрицы является фиктивным, то, отбросив его, получим оптимальное решение исходной задачи.

 

0

1

0

0

 

 

1

0

0

0

 

X*

 

 

0

0

1

0

 

 

0

0

0

1

 

 

 

 

 

 

0

0

0

0

 

 

 

 

По исходной матрице С и полученной матрице X находим максимальную производительность (суммируем только те элементы матрицы C, которым соответствуют единичные элементы матрицы X).

43

Zmax= 11 + 10 + 6 + 7 = 34.

Интерпретация решения:

Первый станок должен выполнять 2-ю работу, второй – 1-ю работу, третий станок – 3-ю работу, четвертый станок – 4-ю работу, пятый станок не будет выполнять никакой работы. При таком распределении работ производительность будет максимальна и составит 34 единицы.

2.2.Теория игр

2.2.1. Основные понятия

При решении ряда практических задач в области экономики, политики и военного дела приходится принимать решения в ситуациях, в которых сталкиваются интересы двух или более сторон, которые преследуют противоположные цели, причём результат любого действия каждой из сторон зависит от того, какое действие предпримет противник. Такие ситуации называются конфликт-

ными.

Примеры конфликтных ситуаций:

любая ситуация в ходе военных действий;

планирование военных операций;

конкурентная борьба в экономике;

выборы в парламент;

салонные игры (например, шашки, шахматы, карты).

Теория игр – математическая теория конфликтных ситуаций, ее цель – выработать рекомендации по рациональному образу действий участников конфликтной ситуации. При этом не учитываются элементы риска, просчеты и ошибки игроков.

Для математического анализа конфликтной ситуации отбрасывают второстепенные факты и строят формализованную модель конфликтной ситуации – игру. Конфликтные стороны называются игроками. Игра ведется по определенным правилам. Правила игры устанавливают возможные действия игроков, объём сведений каждой стороны о поведении другой, результат, к которому приводит каждая совокупность ходов. Правила определяют также конец игры, когда больше ходов делать не разрешается. Каждый игрок делает ход – выбор одного из вариантов действий, предусмотренных правилами игры. Ходы бывают личные и случайные. Личный ход – сознательный выбор игроком допустимого действия. Случайный ход – выбор допустимого действия с помощью механизма случайного выбора (например, подбрасывания монеты) и его осуществление. Будем считать, что в конце игры любой игрок получает выигрыш. Можно провести классификацию игр:

По числу игроков:

одного лица (например, пасьянс);

двух лиц – парная игра (например, шахматы);

n лиц – множественная (они делятся на коалиационные, когда несколько лиц могут заключить союз, и бескоалиационные).

По количеству и характеру ходов:

44

с полной информацией (например, шахматы);

с неполной информацией (например, карты. Большинство игр – игры с неполной информацией).

По количеству ходов:

конечные (у каждого игрока имеется конечное количество ходов);

бесконечные (например, дуэль).

По выигрышу:

с нулевой суммой (парная игра, в которой выигрыш одной стороны равен проигрышу другой);

с ненулевой суммой (например, экономические процессы создают или

уничтожают богатство).

Стратегией игрока называется совокупность правил, определяющая выбор варианта действий при каждом ходе игрока в зависимости от ситуации, сложившейся в игре. Игра m n – конечная парная игра, в которой у одного игрока имеется m стратегий, а у второго n стратегий.

Далее будем рассматривать парные игры m n с нулевой суммой.

Пусть имеется игра двух игроков A и B. Пусть у игрока A имеется m стратегий A1, A1,…, Am, а у игрока B имеется n стратегий B1, B1,…, Bn. Пусть aij – выигрыш (положительный или отрицательный) игрока A при выборе стратегии Ai игроком A и стратегии Bj игроком B. Если ходы случайные, то aij – математическое ожидание выигрыша игрока A. Платёжной матрицей, или матрицей игры, называется матрица

AB

B1

B2

Bn

 

A1

a11

a12

a1n

 

A2

a21

a22

a2n

 

 

Am

am1

am2

amn

 

Пример 10 (Игра «Поиск»).

 

Игрок A прячется в одном из двух убежищ, а игрок B его ищет. Правила

игры: если игрок B находит A, то A платит ему 1 рубль, в противном случае иг-

рок B платит A 1 рубль.

Стратегии игроков:

 

 

игрок A: A1 – спрятаться в убежище № 1, A2 – спрятаться в убежище № 2;

игрок B: B1

– искать в убежище № 1,

 

 

B2

– искать в убежище № 2.

Платежная матрица:

B

B1

B2

 

A

 

 

 

 

A1

-1

1

 

A1

1

-1

 

 

 

 

45

Это игра с неполной информацией. Если игра проводится один раз, то бессмысленно говорить о разумных стратегиях. Любой игрок с одинаковым основанием может применять любую стратегию. Но если игра многократно повторяется, то положение меняется. Если игрок будет придерживаться одной стратегии или чередования стратегий в определённой последовательности, то противник догадается об этом и начнёт выигрывать. Поэтому от верного проигрыша игроков может спасти только случайное чередование стратегий. Например, игрок перед своим ходом подбрасывает монету и, если выпала «решка», то игрок выбирает первую стратегию, а если «орёл», то вторую.

Оптимальной стратегией называется стратегия, которая при многократном повторении игры обеспечивает игроку максимально возможный средний выигрыш.

2.2.2. Нижняя и верхняя цены игры. Принцип минимакса

Дополним матрицу игры столбцом с минимальными значениями в строках и строкой с максимальными значениями в столбцах:

B

B1

B2

 

 

Bn

 

min в строке

 

 

A

 

 

 

 

 

 

 

 

 

 

 

A1

a11

a12

 

 

a1n

 

1

 

 

 

A2

a21

a22

 

 

a2n

 

2

 

 

 

 

 

 

 

 

 

 

Am

am1

am2

 

 

amn

m

 

 

 

 

 

 

 

 

 

 

 

 

 

max i

 

max в столбце

1

2

 

 

 

n

 

 

 

1 i m

 

 

 

 

 

 

min j

 

 

 

 

 

 

 

 

 

 

 

1 j n

 

 

Величина max

i

max

min a называется нижней ценой игры

 

1 i m

 

1 i m 1 j n

ij

 

 

или максимином.

Стратегия игрока A, соответствующая максимину , называется максиминной стратегией игрока A. Если игрок A придерживается своей максиминной стратегии, то ему гарантирован выигрыш не меньше , то есть – это тот гарантированный минимальный выигрыш, который может обеспечить себе игрок A, придерживаясь наиболее осторожной стратегии.

Величина min

 

j

 

min max

a называется верхней ценой игры

1 j n

 

 

1 j n 1 i m

ij

или минимаксом. Стратегия игрока B, соответствующая минимаксу , называ-

ется минимаксной стратегией игрока B.

Теорема 9 Для игры двух лиц с нулевой суммой .

Если игрок B придерживается своей минимаксной стратегии, то ему гарантирован проигрыш не больше . Положение, при котором игроки используют свои минимаксные стратегии, неустойчиво и может быть нарушено поступившими сведениями о выбранной стратегии другого игрока. Если оба игрока ра-

46

зумны, то игрок A будет выбирать свою максиминную стратегию, а игрок B – минимаксную.

Пример 11

Найдем нижнюю и верхнюю цены игры из примера 10.

B

B1

B2

min в строке

A

 

 

 

A1

-1

1

-1

A2

1

-1

-1

max в столбце

1

1

= -1

= 1

Таким образом, если игрок A будет делать личные ходы, а его противник B об этом узнает, то игрок A получит минимальный выигрыш -1, то есть он будет в проигрыше, а игрок B получит минимальный проигрыш 1, то есть он будет выигрывать. Аналогичное утверждение справедливо и для игрока B.

Игра называется игрой с седловой точкой, если нижняя и верхняя цена игры совпадают. В этом случае величина = = называется чистой ценой игры. Седловой точке соответствует пара минимаксных стратегий, которые называются оптимальными, а их совокупность называется решением игры. В игре с седловой точкой любому игроку выгодно придерживаться оптимальных стратегий (любое отклонение от оптимальной стратегии ухудшает положение игрока). Чистая цена игры в игре с седловой точкой является значением выигрыша, которое в игре разумных противников игрок A не может увеличить, а игрок B уменьшить. При разумном поведении игроков исход игры с седловой точкой заранее предопределен. Играть в такие игры имеет смысл, если противник не знает оптимальной стратегии.

Пример 12

Двое играют в следующую игру: одновременно выбрасывают 1, 2 или 3 пальца. Выигрывает тот, у кого больше пальцев (выигрыш равен разности выброшенных пальцев). Если оба выбросили одинаковое количество пальцев, то никто не выиграл. Платежная матрица:

B

B1

B2

B3

min в строке

A

 

 

 

 

A1

0

-1

-2

-2

A2

1

0

-1

1

A3

2

1

0

0

max в столбце

2

1

0

= 0

= 0

Так как нижняя и верхняя цены игры совпадают, то игра имеет седловую точку, поэтому игра решается в чистых стратегиях с чистой ценой игры

47

= 0. Оптимальные стратегии сторон: оба игрока выбрасывают по 3 пальца. При этом никто не выигрывает.

2.2.3. Решение игр в смешанных стратегиях

Если игра не имеет седловой точки, то игрок A гарантирует себе выигрыш, равный нижней цене игры, которая меньше верхней цены игры. Конечно, игрок А хочет увеличить выигрыш, а В – уменьшить проигрыш. Если игроки будут чередовать свои стратегии случайным образом, то в некоторых случаях А по-

лучит бόльший выигрыш, чем нижняя цена игры.

 

 

 

 

 

 

 

 

 

 

 

Смешанной

стратегией

 

игрока

 

A

 

называется

набор

 

вероятностей

̅= (

1,

,1…,

)m

 

 

 

 

 

 

 

+… + pm = 1, с которыми он чередует свои стра-

 

 

 

, где p1 + p2

тегии A , A ,…, A . Аналогично определяется смешанная стратегия игрока B

как набор

 

, ,…,

 

),

где q

 

+ q

 

+… + q

= 1. В этом случае выигрыш А

определяется=как(

 

 

 

 

1

 

2

 

 

(математическоеn

ожидание).

 

 

Теорема 10 (Фон( ̅,-

Неймана)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для любой конечной игры m n двух лиц существуют такие смешанные

для любых

̅= (

 

,

 

 

,…,

 

 

)

игрока А и

 

 

= (

 

,

 

,…,

 

)

игрока В,

что

стратегии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

других стратегий

 

 

 

(

 

,

 

,…,

 

)

и

 

= (

,

,…,

)

выполня-

ется неравенство:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

̅=

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

теоремы: Если игрок А отступает от стратегии

Экономический(смысл̅, ) ≤

 

(

̅,

 

)

(

̅,

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

его

то его выигрыш уменьшается.

Если игрок В отступает от стратегии

,

то

 

̅

проигрыш увеличивается. Таким образом, смешанные стратегии

 

обра-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

не выгодно

зуют седловую точку во множестве смешанных стратегий, игрокам( ̅,

)

 

 

отступать от стратегий, соответствующих этой точке. Если

 

 

– пара сме-

шанных

стратегий,

 

 

 

образующих

 

седловую

 

 

точку,

̅,то

величина

= ∑

 

 

называется ценой игры.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теорема 11 (О цене игры)

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

Цена игры удовлетворяет неравенству

 

 

 

 

 

 

 

 

 

 

 

2.2.4. Решение матричных игр 2 2 в смешанных стратегиях

Игра 2 2 – наиболее простой случай конечных игр. Рассмотрим игру, не имеющую седловой точки, с платежной матрицей

 

В1

В2

 

 

 

 

 

 

 

 

 

А1

a11

a12

 

 

 

 

 

 

 

 

 

А2

a21

a22

 

и

 

 

 

– смешанные стратегии игроков.

Найдем

 

Пусть

 

 

 

 

 

оптимальные̅=смешанные( , )

стратегии игроков. Если игрок В придерживается

= (

,

)

 

 

 

 

стратегии В1, то средний выигрыш А составит

. Если игрок В

придерживается стратегии В2,

 

 

составит

 

.

то средний выигрыш А +

выигрыши долж-

По свойству оптимальных смешанных стратегий эти средние

 

+

 

ны совпадать и быть равными цене игры. Получаем систему:

 

 

 

+

=

+

 

=

,

 

 

 

 

+= 1.

48

Решаем систему:

 

+ (1 − ),

 

+ (1 − ) =

 

 

( − ) + =,

( − ) + ,

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

.

= 1 −

 

= 1 −

 

 

 

=

 

 

 

 

 

 

 

 

Аналогично, составляем систему для игрока В:

 

+

 

=

 

 

+

= ,

 

 

+= 1 .

Решая систему, находим:

 

=

 

,

 

 

,

=

 

 

 

 

 

 

Цена игры

=,

Решение игры 2 2 можно найти также геометрически (рис. 22). Для этого на оси абсцисс отложим отрезок А1А2 длиной 1. Левый конец отрезка соответствует стратегии А1, правый – стратегии А2. Промежуточные точки отрезка соответствуют смешанным стратегиям ̅= ( , ) первого игрока. Причем расстояние от промежуточной точки отрезка до правого края – это вероятность p2 стратегии А2, а расстояние до левого края – вероятность p1 стратегии А1. Через концы отрезка А1А2 проведем прямые, перпендикулярные оси абсцисс, на них будем откладывать выигрыши при стратегиях А1 и А2 соответственно. Если игрок В применяет стратегию В1, то выигрыш первого игрока при стратегии А1 составляет a11, а при стратегии А2 составляет a21. Отложим эти выигрыши на перпендикулярах и соединим полученные точки прямой B B . Если игрок А применяет смешанную стратегию, то его выигрышу соответствует некоторая точка на отрезке B B . Аналогично строим отрезок B B , соответствующий применению вторым игроком стратегии В2. В соответствии с принципом максимина ломаная B NB – нижняя граница выигрыша, получаемого игроком А. Точка N, в которой выигрыш максимален, определяет цену игры и ее решение. Для нахождения оптимальной стратегии игрока А достаточно составить уравнения прямых и найти точку пересечения.

49

Рис. 22. Геометрическое решение игры 2 2

Аналогично можно рассмотреть задачу минимизации верхней границы выигрыша для игрока В.

Используя геометрическую интерпретацию, можно найти решение игр, заданных матрицей 2 n. Каждой из n стратегий игрока В будет соответствовать прямая. Точка N, лежащая на нижней границе и дающая наибольшую величину выигрыша, определяет цену игры и ее решение. При этом определяются активные стратегии игрока В (соответствующие им прямые пересекаются в точке N). Для активных стратегий вероятности не равны 0, остальные стратегии игроком В не используются (их вероятности равны 0).

Аналогично можно решить игру с матрицей m 2. В этом случае строят верхнюю границу выигрыша и на ней определяют минимум.

Пример 13

 

 

 

10

7

. Требуется:

Пусть игра задана платежной матрицей A

8

 

 

11

 

1)Решить игру аналитически.

2)Провести моделирование результатов игры с помощью таблицы равномерно распределенных случайных чисел, разыграв 30 партий; определить относительные частоты использования чистых стратегий каждым игроком и средний выигрыш, сравнив результаты с полученными теоретически в п.1.

Решение:

1. Найдем нижнюю и верхнюю цену игры.

50