Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Новосибирский Государственный Университет Экономики И Управления

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Глава 7.doc

Скачиваний:

Добавлен:

17.11.2019

Размер:

491.52 Кб

Скачать

☆

1 / 51 2 3 4 5 > Следующая >>>

Глава 7. Динамическое программирование §1. Примеры задач динамического программирования

В рассмотренных ранее задачах оптимизации решение находилось как бы за один шаг. Однако процедуру принятия решений во многих задачах планирования и управления можно представить как многошаговый процесс, т.е. состоящий из нескольких шагов.

Динамическое программирование — это математический метод оптимизации многошаговых процессов, разработанный в начале 50-х годов американским ученым Р. Беллманом. Его использование позволяет свести решение сложной задачи к последовательному решению серии более простых «подзадач». Название метода связано с тем, что первоначально с его помощью проводилась оптимизация динамических систем, т.е. систем, изменяющихся во времени. Однако затем он стал применяться и для решения задач, в которых временной фактор отсутствует, в частности для задач целочисленного программирования.

В настоящее время динамическое программирование является одним из наиболее распространенных оптимизационных методов, пригодным для решения различных прикладных задач: распределения ресурсов, управления запасами, замены оборудования, и т.п. Типичным примером задачи, для решения которой можно применить этот метод, является следующая задача перспективного планирования.

Пример 1.1. Планируется производственная деятельность фирмы на период времени в n лет. Для ее развития выделены капиталовложения в объеме K, которые нужно распределить по годам планового периода. Известно, что годовой доход фирмы зависит от объема средств, вложенных в начале года. Нужно определить, сколько капиталовложений следует выделить фирме в начале каждого года, чтобы общий доход за n лет был максимальным.

Это типичная задача динамического программирования. Распределение капиталовложений можно представить в виде многошагового процесса, где шагом является выделение средств фирме в начале каждого года планового периода.

Управление u_k на k-м шаге (k = ) этого процесса — величина капиталовложений, полученных фирмой в начале k-го года. Управление u в целом представляет собой совокупность всех пошаговых управлений:

u = (u₁, u₂,…, u_n).

Обозначим x_k — величину средств, доступных для выделения фирме после k-го года (остаток капиталовложений). Переменная x_kхарактеризует состояние управляемого процесса после k-го шага. Ясно, что

x₁ = K– u₁,

x₂ = x₁ – u₂,

…

x_n = x_n_-₁ – u_n.

Из этих соотношений видно, что состояние системы в конце любого шага зависит только от предшествующего состояния и управления на этом шаге. Очевидно, что объем средств, выделяемых фирме в текущем году, не может быть больше, чем остаток капиталовложений после предыдущего года. Поэтому управление k-го шага должно удовлетворять неравенству:

0 ≤ u_k ≤ x_k_-₁, k = .

Управление u = (u₁, u₂,…, u_n), для которого эти условия выполнены, будем называть допустимым.

Обозначим f_k(u_k) — доход, который получит фирма в k-м году, если ей выделить в начале этого года средства в объеме u_k. Функция f_k характеризует эффективность управления на k-м шаге.

Общая эффективность управления u оценивается при помощи показателя Z — суммарного дохода фирмы за весь плановый период. Этот показатель равен сумме пошаговых показателей эффективностей (годовых доходов):

Z = f₁(u₁).+ … + f_n(u_n).

Таким образом, задача состоит в выборе таких допустимых управлений , т.е. распределения капиталовложений, при котором функция Z достигнет максимума.

В этом примере многошаговый характер процесса управления, по сути, был задан его условиями, согласно которым средства выделяются в начале каждого года. Однако иногда, чтобы использовать метод динамического программирования, «многошаговость» управления приходится вводить искусственно.

Пример 1.2. Имеется груз, состоящий из неделимых предметов n видов, который нужно погрузить на баржу грузоподъемностью Р. Известны стоимость c_k и вес p_k каждого предмета k-го вида (k = ). Нужно определить, сколько предметов каждого вида следует погрузить на баржу, чтобы суммарная стоимость груза была максимальной, а его общий вес не превышал грузоподъемности баржи.

Обозначим u_k — количество предметов k-го вида, загружаемых на баржу. Тогда математическая модель этой задачи выглядит так:

Z = c₁u₁ + c₂u₂ + … + c_nu_n → max,

p₁u₁ + p₂u₂ + … + p_nu_n ≤ P,

u₁≥ 0, u₂≥ 0,…, u_n≥ 0,

u_k — целые числа для всех k = .

Это задача линейного целочисленного программирования, но для нахождения ее оптимального решения можно использовать динамическое программирование. Для этого процесс загрузки следует представить в виде многошагового управляемого процесса, состоящего из n шагов, причем на каждом шаге баржа загружается предметами одного вида.

Будем считать, что на первом шаге баржа загружается предметами первого вида, на втором шаге — второго вида и т.д. Управление u_kна k-м шаге (k = ) — это количество предметов k-го вида, загружаемых на баржу. Параметры состояния x_k на k-м шаге — это количество груза, которое еще можно погрузить на баржу после того как на нее погрузили предметы первых k видов. Ясно, что

, k = .

Так как на каждом шаге должны выполняться неравенства x_k ≥ 0, то управления на каждом шаге должны удовлетворять неравенствам:

, k = .

Управление u = (u₁, u₂,…, u_n), для которого эти условия выполнены, назовем допустимым.

Эффективность управления на k-м шаге определяется стоимостью всех предметов, загруженных на этом шаге, т.е. она равна c_ku_k. Эффективность всего процесса управления Z равна сумме эффективностей всех шагов, т.е. суммарной стоимостью загруженных предметов:

Z = c₁u₁ + c₂u₂ + … + c_nu_n.

Оптимальное управление доставляет максимальное значение этой функции на множестве всех допустимых управлений.

Пример 1.3. Решается задача оптимального распределения дефицитного ресурса (сырье, оборудование, инвестиции) между n объектами, причем общий объем ресурса равен S. Для каждого объекта считается известной зависимость между размером ресурса и величиной прибыли, полученной в результате выделения ресурса данному объекту. Эта зависимость, вообще говоря, имеет нелинейный характер. Нужно найти распределение ресурса, дающее максимальную общую прибыль.

Обозначим f_k(u_k) (k = ) — величину прибыли, получаемую от k-го объекта при выделении ему ресурса в объеме u_k. единиц. Математическая модель этой задачи имеет следующий вид:

Z = f₁(u₁) + … + f_n(u_n) → max,

u₁+ … + u_n= S,

u_k ≥ 0, k = .

Это задача нелинейного программирования. Если все функции f_k вогнутые, то она является задачей выпуклого программирования, и ее оптимальное решение можно найти при помощи какого-либо метода решения задач этого класса, например, при помощи метода множителей Лагранжа. Если же хотя бы одна из функций прибыли не является вогнутой, то использование методов нелинейного программирования может не привести к нужному результату, так как в этом случае найденный локальный максимум может не быть глобальным (см. п.6 §2 главы 5).

В такой ситуации для нахождения оптимального решения целесообразно использовать аппарат динамического программирования. Для этого нужно, представить распределение ресурса как многошаговый процесс, состоящий из n шагов, причем на каждом шаге ресурс выделяется одному из объектов. Будем считать, что на первом шаге ресурс выделяется первому объекту, на втором шаге — второму и т.д.

Управление u_kна k-м шаге (k = ) — это количество ресурса, выделяемого k-му объекту, а параметры состояния x_k — это остатки ресурса после его выделения первым k объектам, задаваемые формулами:

x₁ = S– u₁,

x₂ = x₁ – u₂,

…

x_n = x_n_-₁ – u_n.

Управление u_k на каждом шаге должно удовлетворять условию:

0 ≤ u_k ≤ x_k_-₁, k = .

Управление u = (u₁, u₂,…, u_n), для которого эти условия выполнены, будем называть допустимым.

Эффективность управления u_k на k-м шаге определяется величиной прибыли, получаемой от k-го объекта, т.е. она равна f_k(u_k). Эффективность всего процесса управления Z равна сумме эффективностей всех шагов:

Z = f₁(u₁).+ … + f_n(u_n).

1 / 51 2 3 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
19.04.2019968.19 Кб12все ответы.doc
#
31.03.2015180.52 Кб70Все ответы.docx
#
13.11.201925.87 Кб3Входной контроль Право, Основы права.docx
#
13.03.201623.55 Кб13География 26.02.15.doc
#
17.11.2019812.54 Кб42Глава 4.doc
#
17.11.2019491.52 Кб15Глава 7.doc
#
13.03.20161.05 Mб6глава1 спецглавы.docx
#
31.03.2015145.92 Кб9ГМС Вопросы семинаров и эссе.doc
#
31.03.201598.1 Кб10ГОС.РЕГУЛ. ВЭД.docx
#
31.03.20152.14 Mб46Гостиничное хозяйство.docx
#
31.03.201583.97 Кб11Государственная власть и её обоснование.DOC