МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

 

В технике существует класс объектов и процессов, управление которыми осуществляется на основе ограниченного числа решений, принимаемых последовательно в некоторые фиксированные моменты времени. Для решения задач оптимизации таких объектов американским ученым Р. Беллманом предложен метод, названный динамическим программированием.

В основу динамического программирования положен принцип оптимальности. Согласно ему оптимальное управление определяется конечной целью управления и состоянием системы в рассматриваемый момент времени независимо от того, каким образом система пришла в это состояние, т. е. оптимальное управление не зависит от предыстории системы. Это значит, что для любой оптимальной траектории каждый участок, связывающий любую промежуточную точку этой траектории с конечной, также является оптимальной траекторией.

Задачей оптимизации считается определение оптимальных управлений u°(t) и траектории Х°(t) из условия минимума (максимума) функционала

(3.91)

для заданных уравнений состояния объекта

, (3.92)

а также начальных и конечных фиксированных значений X(t0) и Х(Т) и интервала t0 £ t £ Т при наличии ограничений вида X(t) Î Wx и u(t) Î Wu. Здесь Wx и Î Wu – заданные допустимые области для координат состояния и управлений.

При этом вводится вспомогательная функция Беллмана

. (3.93)

Минимум функционала (3.91) при условиях (3.92) зависит от момента времени , значения ХDt и конечного момента времени Т:

, (3.94)

где – произвольный промежуточный момент времени в интервале – вектор коорди­нат состояния в момент времени .

Пусть – фиксированный момент времени, Dt – малое положительное число ( ). Тогда с учетом (3.94) вспомогательная функция

(3.95)

Соответственно полученным из (3.95) величинам u°(t) по уравнениям (3.92) определяем оптимальные траектории вектора выхода Х°(t). При решении задач оптимизации объектов методом динамического программирования используют функциональные уравнения Беллмана в частных производных либо численные методы.

Уравнение Беллмана и его применение для синтеза оптимальных систем. Первое слагаемое в правой части выражения (3.95) с точностью до малых величин более высокого порядка, чем Dt, можно заменить приближенным значением

. (3.96)

Второе слагаемое в правой части выражения (3.95), определяющее значение функции для любого момента времени , разложим в ряд Тейлора. Ограничиваясь линейными членами относительно приращений Dxi и Dt и переходя к пределу, заменим это слагаемое приближенным значением, если функция S(t, X) имеет непрерывные частные производные по всем t и xi(t):

. (3.97)

На основании (3.95), (3.96) и (3.97) запишем

(3.97)

при условиях

; (3.99)

.

Оптимальное управление u°(t) найдем в результате решения уравнения (3.98). Если координата управления ограничена u(t) Î Wu, то для внутренней точки области, определяемой множеством Wu, условие (3.98) можно заменить функциональными уравнениям и в частных производных:

(3.100)

Если S не зависит явно от времени, то . В этом случае при решении уравнений (3.100) для квадратичных функций F(...) функционала (3.91) и t0=0; tк=T=¥. А.М.Лётовым [7] предложено искать вспомогательную функцию в виде квадратичной формы, дифференцируемой по всем координатам xi:

. (3.101)

Для линейных объектов функция S(X) является функцией Ляпунова при t ® ¥. В результате решения (3.100) с учетом (3.101) найдем оптимальное управление в функции координат вектора состояния u°(X), которое обеспечивает устойчивые процессы.


<== предыдущая лекция | следующая лекция ==>
УПРАВЛЕНИЕ КАДРАМИ (ПЕРСОНАЛОМ) | Периодизация развития человека как субъекта труда




Дата добавления: 2019-07-26; просмотров: 235;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.009 сек.