
53
6. Определим переходное отображение Y(x) = f(z(x)) (где z(x) = arg
xz≤≤0
max
A(z),
см. п. 3).
При
x ≥ z* z(x) = z*, откуда Y(x) = f(z*) =
x
~
. При x < z* z(x) = x, тогда
Y(x) = f(x) > x. Процесс изменения фазовой координаты x при таком
переходном отображении для некоторого начального условия
x
0
показан на
рис. 4.5.
В заключение рассмотрим задачу, в которой время (номер шага) явно
входит как аргумент функции полезности, стоящей под знаком суммы
(дисконтирующий множитель не считается за такой случай).
При этом результат оптимизации существенно зависит от упорядочения
шагов, поэтому понятие горизонта планирования использовать нельзя.
Следовательно, рекуррентное соотношение Беллмана в
данной задаче будет
записываться в общем виде (4.11).
4. Задача о ранце. Имеется контейнер емкостью V и
грузоподъемностью
M и N типов изделий, для каждого из которых известны
стоимость
c
i
, вес m
i
и объем v
i
. Требуется разместить в контейнере набор
изделий максимальной суммарной стоимости.
Решение. Обозначим через
x
i
– количество предметов i-го типа,
размещенных в контейнере. Тогда задача будет иметь вид:
L(x) =
∑
=
N
i
ii
xc
1
→ max,
∑
=
N
i
ii
xm
1
≤ M,
∑
=
N
i
ii
xv
1
≤ V,
x
i
∈ N, i = 1,…, N.
Сведем ее к дискретной задаче оптимального управления. Пусть "шагом"
операции является номер класса изделий, которые складываются в
0 x
0
1
z*
x
=
= x
+
2
1
x
x
1
x
1
x
0
x
2
x
Рис. 4.5.
…
…