Постановка задачи динамического программирования.

⇐ ПредыдущаяСтр 3 из 4Следующая ⇒

Постановку задачи динамического программирования рассмотрим на примере инвестирования, связанного с распределением средств между предприятиями. В результате управления инвестициями система последовательно переводится из начального состояния S₀ в конечное S_n. Предположим, что управление можно разбить на n шагов и решение принимается последовательно на каждом шаге, а управление представляет собой совокупность n пошаговых управлений. На каждом шаге необходимо определить два типа переменных: переменную состояния системы S_k и переменную управления x_k. Переменная S_k определяет, в каких состояниях может оказаться система на рассматриваемом k-м шаге. В зависимости от состояния S на этом шаге можно применить некоторые управления, которые характеризуются переменной x_k, которые удовлетворяют определенным ограничениям и называются допустимыми.Допустим, X = (x₁, x₂, …, x_k, …, x_n) – управление, переводящее систему из состояния S₀ в состояние S_n, a S_k – есть состояние системы на k-м шаге управления. Тогда последовательность состояний системы можно представить в виде графа, изображенного на рис. 1. x₁ x₂ x_k-1 x_kx_k+1 x_n S₀ → S₁ →... → S_k_-1→ S_k →... → S_n Рисунок 1.1 – График состояний системы

Применение управляющего воздействия x_k на каждом шаге переводит систему в новое состояние S¹(S, x_k) и приносит некоторый результат W_k (S, x_k). Для каждого возможного состояния на каждом шаге среди всех возможных управлений выбирается оптимальное управление х*_k, такое, чтобы результат, который достигается за шаги с k-го по последний n-й, оказался бы оптимальным. Числовая характеристика этого результата называется функцией Беллмана F_k (S) и зависит от номера шага k и состояния системы S.

Задача динамического программирования формулируется следующим образом: требуется определить такое управление Х*, переводящее систему из начального состояния S₀ в конечное состояние S_n, при котором целевая функция принимает наибольшее (наименьшее) значение F(S₀, X*) → extr.Особенности математической модели динамического программирования заключаются в следующем: 1) задача оптимизации формулируется как конечный многошаговый процесс управления; 2) целевая функция (выигрыш) является аддитивной и равна сумме целевых функций каждого шага: F = ∑ F_k (S_k_{− 1}, x _k) → extremum; k =13) выбор управления х_k на каждом шаге зависит только от состояния системы к этому шагу S_k_{− 1}, и не влияет на предшествующие шаги (нет обратной связи); 4) состояние системы S_k после каждого шага управления зависит только от предшествующего состояния системы S_k_-1 и этого управляющего воздействия х_k (отсутствие последействия) и может быть записано в виде уравнения состояния: S_k= f_k (S_k-1, х_k), k = 1, n; 5) на каждом шаге управление х_k зависит от конечного числа управляющих переменных, а состояние системы S_k зависит от конечного числа параметров; 6) оптимальное управление представляет собой вектор X*, определяемый последовательностью оптимальных пошаговых управлений: X = (х*₁, х*₂, …, х*_k, …, х*_n), число которых и определяет количество шагов задачи.

⇐ Предыдущая 1 234 Следующая ⇒

Данная страница нарушает авторские права?

mylektsii.su - Мои Лекции - 2015-2026 год. (0.31 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал