logo
конспескт(220301) второй семестр

4.3.4 Метод динамического программирования.

В основу этого метода, разработанного Беллманом Р., положен принцип оптимальности, согласно которому оптимальное управление САУ не зависит от предыстории самой системы. Метод динамического программирования дает возможность найти оптимальные управления и траектории из условия минимума функционала (4.5) для заданных уравнений объекта управления (4.6), начальных и конечных значений и и интервала времени при наличии ограничений и . Если необходимо обеспечить максимум функционала (4.5), следует принять знак минус перед интегралом.

Для решения поставленной задачи оптимизации используют вспомогательную функцию Беллмана

(4.13)

и нелинейное дифференциальное уравнение Беллмана в частных производных относительно функции

(4.14)

при следующих условиях:

; u(t) ; .

Решением этого уравнения находят оптимальное управление . Соответственно полученной функции по уравнению (4.6) определяют оптимальную траекторию вектора . Если уравнение Беллмана невозможно решить аналитически, то применяют численные методы.