- •3. Находжение методов решения задачи:
- •4.Проверка и корректировка полученной модели, 5. Выводи и реализация полученной модели на практике.
- •2. Общая постановка злп. Каноническая форма злп.
- •3. Базисные и свободные неизвестные, базисные решения.
- •5. Теорема о выпуклом многоугольнике.
- •8. Опорные прямые. Опорные решения. Симплексные преобразования.
- •9. Связь угловых точек с опорными решениями.
- •13. Критерий оптимальности для максимизации задач.
- •14. Двойственные задачи. Экономическая интерпретация двойственных задач.
- •15. Принципы построения двойственных задач. Связь между ними.
- •16. Симметричные двойственные задачи. Нахождение опт-решения.
- •17. Теоремы двойственности. Основное неравенство двойственности.
- •18. Транспортные задачи. Экономико-матем-ая модель тз.
- •19. Теорема о разрешимости тз.
- •20. Нахождение исходного опорного решения тз.
- •21. Переход к новому опорному решению тз.
- •26. Открытая модель тз. Сведение ее к закрытой модели.
- •27. Постановка задачи целочисленного программирования.
- •29. Понятие об игровых моделях. Классификация игр.
- •30. Приведение экономических задач к теоретико-игровой форме.
- •3 1. Парная конечная игра. Платежная матрица. Максиминная и минимаксная стратегии.
- •32. Цена игры. Устойчивость решений. Седловые точки.
- •35. Решение матричной игры в смешанных стратегиях.
- •36. Приведение матричной игры к злп.
- •37. Общая постановка задач динамического программирования.
- •38. Принцип оптимальности динамического программирования.
- •39. Принцип оптимальности Беллмана.
- •40. Примеры экономических задач, решаемых методом динамического программирования.
- •1. Задача о наборе самолетом высоты и скорости
- •2. Задача о распределении кредита.
- •3. Задача об оценке эффективности системы по критерию "затраты-эффект".
37. Общая постановка задач динамического программирования.
Динамическое программирование - метод оптимизации задач (процессов, операций), решение которых может быть разбито на несколько этапов, а целевая функция является, соответственно, аддитивной (или мультипликативной).
Основные свойства задач, которые могут быть решены методами динамического программирования.
1). Задача должна допускать интерпретацию в виде n-этапного (шагового) процесса принятия решения. Решение начинается с последнего n-го этапа и продолжается до 1-го. В процессе решения происходит переход от k-го этапа к k-1-му.
2). Должны быть заданы:
а) Zk - вектор переменных, описывающих возможные состояния системы (процесса) на каждом этапе - вектор фазовых состояний системы, k =1,n,
zi,k∈ Zk , i-ое - одно из возможных состояний системы на k-ом этапе;
б). Xi,k - вектор управлений - набор возможных управлений при нахождений системы на k-м этапе в i-м состоянии, xl,i,k - l-ое, одно из возможных, управлений;
3). Выбор управления (решения) на каждом этапе не должно влиять на состояние системы на предыдущих этапах
Целевая функция - суммарный выигрыш в задаче на максимум (суммарные потери в задаче на минимум) запишется в виде: W=∑ k=1 n ∆Wk, где ∆Wk - выигрыш (потери) на k- этапе.
Таким образом, на каждом k-м этапе система (процесс) может находиться в одном возможном для этого этапа состояний - i,k Zk z ∈ . В каждом состоянии системы может быть принято одно из возможных, согласно условиям задачи (операции), решений (управлений). В результате принятия решения система (процесс) переходит в одно из
Zk+1 состояний - zk+1,p(xl,i,k), при этом имеет место приращение выигрыша
(потерь), равное W (x ) ∆ k l,i,k
38. Принцип оптимальности динамического программирования.
Основной принцип динамического программирования заключается в
следующем. На каждом k-м этапе процесса для системы (процесса),
находящейся в одном из возможных для этого этапа состояний,
необходимо так выбрать управление, чтобы минимизировать суммарные
потери в задаче на минимум (максимизировать суммарный выигрыш в
задаче на максимум), состоящие из приращения потерь (выигрыша) на k-м
этапе и на всех предыдущих, начиная с k+1-го, этапах. Полученный таким
образом результат является условным оптимумом - т.е полученным при
условии нахождения системы в конкретном состоянии.
После нахождения условных оптимумов для всех состояний системы
на всех этапах от n-го до 1-го определяется безусловный оптимум, для чего
необходимо пройти последовательно по всем этапам в обратном
направлении от 1-го этапа до последнего.
39. Принцип оптимальности Беллмана.
Каково бы ни было состояние системы перед очередным шагом, надо выбрать управление на этом шаге так, чтобы доход на данном шаге плюс оптимальный доход на всех последующих шагах был максимальный.
Из принципа оптимальности следует, что оптимальную стратегию управления можно получить, если сначала найти оптимальную стратегию управления на n-м шаге, затем на двух последних шагах, затем на трех последних шагах и т. д., вплоть до первого шага. Таким образом, решение рассматриваемой задачи динамического программирования целесообразно начинать с определения оптимального решения на последнем, n-м шаге. Для того чтобы найти это решение, очевидно, нужно сделать различные предположения о том, как мог окончиться предпоследний шаг, и с учетом этого выбрать управление обеспечивающее максимальное значение функции дохода Такое управление, выбранное при определенных предположениях о том, как окончился предыдущий шаг, называется условно оптимальным. Следовательно, принцип оптимальности требует находить на каждом шаге условно оптимальное управление для любого из возможных исходов предшествующего шага.