Принцип оптимальности и уравнение Беллмана
Формулировкапринципа оптимальности:"Оптимальноеповедениеобладаеттем
свойством, что, каковыбынибылипервоначальноесостояниеирешение (т.е. управление) в
начальныймомент, последующиерешениядолжнысоставлятьоптимальноеповедение
относительносостояния, получающегосяврезультатепервогорешения".
Доказательство необходимости принципа оптимальности можно легко получить,
рассуждаяотпротивного: есливынеиспользуетенаилучшимобразомто, чемвы
располагаете, товыникогданераспорядитесьнаилучшимобразомитем, чтовымоглибы
иметьвдальнейшем.
Нарисункеданаиллюстрацияпринципанапримерезадачисоднойфазовой
координатой. Кривая x*(t)(t
0
≤t≤t
1
)–этофазоваятраектория, соответствующаяоптимальному
управлению, начальноеиконечноесостояния – фиксированы. Всятраекторияподеленана
двечастиотносительномоментавремени τ. Согласнопринципуоптимальности, траектория
2, определеннаяпри τ≤t≤t
1
, должнапредставлятьсобойоптимальнуютраекториюпо
отношениюкначальномусостоянию x(τ). Следовательно, втораячастьоптимальной
траекториисамапосебедолжнабытьоптимальнойтраекторией, внезависимостиоттого,
чтопроисходилоссистемойдотого, каконапришлаксостоянию, являющемусяначальным
длявторойчаститраектории.