формулируется следующим образом /8/.
Оптимальное управление
(поведение) определяется лишь целью и состоянием системы в
рассматриваемый момент времени и не зависит от состояний в
предыдущие моменты времени.
Из сформулированного принципа оптимальности следует, что в текущем
состоянии системы и поставленной цели заключена вся информация,
необходимая для определения дальнейшего оптимального управления.
Использование принципа оптимальности позволяет построить алгоритм
определения оптимального управления в динамической системе, т. е. развить
так называемый
метод динамического программирования.
Для изложения метода динамического программирования
применительно к непрерывным системам и процессам в них рассмотрим
внутри интервала
(t
0
, t
k
) момент времени t такой, что t
0
≤ t ≤ t
k
, и введем
функционал потерь вида
∫
+=
k
t
t
2k1k
ф)d
u,(Y,l)t(Y,l)tu,Y,I(t, . (95)
Этот функционал учитывает как потери в конечном состоянии системы,
так и оставшиеся потери на интервале
(t, t
k
). При этом на управление
накладывается дополнительное ограничение
)
riUu
ii
,1,|
0
|
. (95а)
В рассматриваемой стохастической задаче и при неточных измерениях
вектора фазовых координат вся информация о состоянии объекта измерения
содержится в апостериорной функции плотности вероятности
при
наблюдении вектора
Z(t) в интервале (t
)t,y(
€
)l(
1
ω
0
, t). Функционал потерь (95) является
случайной величиной. Наилучшей оценкой его в смысле минимума средней
квадратической ошибки при наблюдения вектора
Z(t) является условное
математическое ожидание. Условное математическое ожидание функционала
(95) зависит от указанной апостериорной функция плотности вероятности.
81