Если матрица G(w
t
) аппроксимируется на каждом шаге диагональной
матрицей µ
t
I, µ
t
0, получается метод Левенберга-Марквардта
∆w
t
= −
R
T
(w
t
)R
(w
t
)+µ
t
I
+
R
T
(w
t
)R(w
t
). (2.21)
При этом шаг спуска вдоль найденного направления всегда является единич-
ным, а параметр µ
t
выбирается так, чтобы минимизировать целевую функ-
цию. В отличие от других метод Левенберга-Марквардта не попадает под
рассматриваемую схему оптимизации; он относится к классу методов дове-
рительной окрестности. При µ
t
→ 0 направление почти совпадает с направле-
нием метода Гаусса-Ньютона, при µ →∞— с направлением антиградиента.
В задачах с большим значением целевой функции (с большой невязкой)
целесообразно использовать квазиньютоновские приближения H
t
матрицы
G(w
t
). Если используется формула BFGS для нахождения приближения, то
получается следующее:
H
t+1
= H
t
−
1
s
T
t
M
t
s
t
M
t
s
t
s
T
t
M
t
+
1
g
T
t
s
t
g
t
g
T
t
,
где M
t
= R
T
t
R
t
+ H
t
, s
t
= w
t
− w
t−1
и g
t
= R
T
t
J(w
t
) − R
T
t−1
J(w
t−1
).Нана-
чальной итерации берется H =0. Периодически для уменьшения влияния
погрешностей округлений снова полагают H =0. Если приближение осу-
ществляется на основе DFP-метода, то
H
t+1
= H
t
+
(g
t
− H
t
s
t
) g
T
t
+ g
t
(g
t
− H
t
s
t
)
T
g
T
t
s
t
−
(g
t
− H
t
s
t
)
T
s
t
g
t
g
T
t
g
T
t
s
t
2
,
где g
t
= R
T
t
J(w
t
)−R
T
t−1
J(w
t
). Следует отметить, что специальные методы ре-
шения НЗНК не всегда работают лучше методов оптимизации произвольных
дифференцируемых функций.
Расчет производных выходов сети по весам НС ПР возможен с помо-
щью процедуры, учитывающей суперпозиционный характер структуры сети
аналогично методу ОРО. При этом процедура построения матрицы Якоби да-
же несколько упрощается ∇
T
w
y(w
t
) в связи с тем, что подлежит вычислению
производная не функционала, а выхода сети.
41