§ 2. Km[]jZ^}gl gbc f_l h^
У розглянутому вище градієнтному методі вважалося, що досліджувана на
екстремум функція є диференційовною, тобто f (x )∈ C
1
, x ∈ E
n
.
Проте досить часто виникає практична потреба оптимізації негладких
функцій, наприклад, функцій такого виду
ff
i
i
( ) max ( )
x x=
,
де f
i
(x ) — лінійні функції. Тому розглянемо задачу безумовної мінімізації функції
f (x ), x ∈ E
n
, за умови, що вона не є диференційовною. При цьому бажано
побудувати процедуру, подібну до процедури градієнтного методу
x
s+
1
= x
s
−
ρ
s
∇ f (x
s
), s = 1,2,...
Оскільки для функції f (x ), яка не є диференційовною, градієнт ∇ f (x
s
) в
точці x
s
може не існувати, то природно замінити його більш загальною
конструкцією — субградієнтом f (x
s
). Зокрема, це можна завжди зробити, якщо
на функцію f (x ) накласти умову опуклості. Дійсно, якщо f (x ) — опукла функція, то
множина Z
s
={x ∈ E
n
: f (x ) ≤ z
s
}, z
s
= const, є опуклою. Тоді в довільній точці x
s
гіперповерхні рівня f (x )=z
s
, яка є границею множини Z
s
, існує опорна
гіперплощина, а вектор нормалі до неї, що лежить у півпросторі, який не містить
множину Z
s
, являє собою субградієнт f (x
s
).
$
∇
$
∇
Отже розглянемо задачу безумовної мінімізації опуклої функції f (x ), x ∈
E
n
. Задамо субградієнтний метод (метод узагальнених градієнтів) процедурою
x
s+
1
= x
s
−
ρ
s
γ
s
f (x
s
), s = 1,2,..., (10.8)
$
∇
де f (x
s
) — субградієнт функції f (x ) в точці x
s
,
ρ
s
— крок зміщення з точки x
s
у напрямку антисубградієнта − f (x
s
),
γ
s
— нормуючий множник, x
0
— початкове
наближення до точки мінімуму функції f (x ).
$
∇
$
∇
Виникають питання вибору кроку
ρ
s
на кожній ітерації та збіжності процедури
(10.8). У порівнянні із звичайним градієнтним методом принципи вибору кроку
ρ
s
повинні бути суттєво іншими.
Дійсно, у градієнтному методі f (x )∈ C
1
, тоді ∇ f (x
s
) та дотична
гіперплощина в точці x
s
до гіперповерхні рівня f (x )=z
s
існують і єдині, а рух по
антиградієнту −∇ f (x
s
) з точки x
s
в точку x
s+
1
= x
s
−
ρ
s
∇ f (x
s
), s = 1,2,...,
приводить при досить малих
ρ
s
>0 до менших значень цільової функції f (x ).
Зокрема, в методі найшвидшого спуску крок
ρ
s
вибирають за правилом
.))( (minarg
ss
0
s
ff xx ∇−=
>
ρρ
ρ
Якщо ж f (x )∉ C
1
, то ∇ f (x
s
) може не існувати. В цьому випадку замість
дотичної гіперплощини до гіперповерхні рівня f (x )=z
s
в точці x
s
доцільно
розглянути одну із нескінченої сукупності опорних гіперплощин до множини Z
s
, що
проходять через точку x
s
, та вектор нормалі до неї, який задає антисубградієнт
−∇ f (x
s
). При цьому, очевидно, може так трапитись, що вектор − f (x
s
) буде
$ $
∇
187