114
обучения, для которой известно значение как входных, так и выходных
переменных, берется одна запись и подается на вход нейросети. По
описанному алгоритму вычисляются выходные значения. Очевидно, что
полученные значения весьма далеки от значений искомых зависимых
переменных. Тогда проводится такое изменение весов связей между
нейронами, которое уменьшает эту разницу. Эта
операция проводится
многократно для каждой записи из обучающей выборки. Как правило,
процесс обучения начинается со связей нейронов самого верхнего уровня и
потом распространяется на нейроны нижележащих слоев, поэтому этот
метод обучения называется обратным распространением ошибки. В
результате обучения мы получаем сеть, которая более или менее верно
описывает значения выходного параметра
для обучающих примеров, и
можно ожидать, что она будет так же хорошо предсказывать выходные
параметры и на других данных.
При проектировании и обучении нейронных сетей необходимо
соблюдать определенную осторожность, поскольку основной задачей
является достижение минимальной ошибки обобщения, или прогноза, а не
обучения. Негативным результатом обучения искусственной нейронной
сети может быть так
называемое переобучение, при котором сеть, по
существу, запоминает обучающие факты; при этом она обладает
минимальной предсказательной способностью, если на ее вход подаются
новые факты.
Переобученная нейронная сеть не будет обладать гибкостью,
способностью к обобщениям. Для уменьшения вероятности переобучения
необходимо, по возможности, не увеличивать количество слоев и нейронов
в скрытых слоях
и использовать как можно больше фактов при обучении.
Существуют эмпирические правила, помогающие определять диапазоны
изменения числа скрытых нейронов и обучающих фактов.
Нейронные сети имеют следующие недостатки:
•
Первый недостаток заключается в том, что очень трудно оценить
статистическую значимость получаемых в процессе обучения
прогностических моделей. Сеть обучается очень хорошо предсказывать
значения выходных параметров на этих записях, но очень трудно понять,
насколько устойчива эта зависимость, определяющая предсказываемые
значения, насколько значима полученная связь, и будет ли она так же
хорошо работать
для других данных. Все дело здесь в большом количестве
степеней свободы. Фактически, степенью свободы является каждый вес
связи между нейронами, и если, скажем, наша сеть включает несколько
десятков нейронов, число ее степеней свободы составляет несколько сотен.
Разумеется, что подгонкой по этим степеням свободы можно достичь
очень точного предсказания для обучающей
выборки, но совершенно
неочевидно, что предсказания будут также правильны и для новых данных,
не использованных в обучении.