Краснодар: КубГТУ, 2012. — 154 с. — ISBN 978-5-8333-0440-2.
Изложены основные принципы построения нейросетевых топологий с
подкреплением, в том числе на базе Q–обучения, сетей адаптивных
критиков и топологии «Внутренний учитель».
Подробно рассмотрены примеры реализаций нейросетевых топологий с подкреплением на основе топологии «Внутренний учитель» и нейро – нечеткого адаптивного критика.
Монография предназначена для специалистов в области разработки нейросетевых систем управления и систем поддержки принятия решений, научных работников, аспирантов и студентов технических специальностей. Введение
Вводные темы
Искусственные нейронные сети
Марковский процесс принятия решений
Постановка задачи динамического программирования
Принцип оптимальности Беллмана
Самообучаемые системы с самомодифицирующимися правилами
Обучение
Q-фактор
Приближенный алгоритм итерации по стратегиям
Алгоритм итерации по значениям
Алгоритм Q-обучения
Модифицированный алгоритм Q-обучения
Q-обучение с использованием расстояния Хемминга
Нейродинамическое программирование
Метод временной разности в задачах обучения с подкреплением
Комбинирование Q-обучения и TD(λ)
Методы ускорения Q-обучения
Процесс исследования пространства состояний
Применение нейронных сетей для Q-обучения
Адаптивные критики
Введение в адаптивные критики
Алгоритм SАRSА
Обобщенная схема адаптивных критиков
Q-критик и V-критик
Теория функциональных систем П.К. Анохина
Проект «Животное» М.М. Бонгарда
Нейросетевая типология «Внутренний учитель»
Исходные условия
Принцип обучения самообучению
Способы реализации метода в прикладных задачах
Топология «внутренний учитель» с использованием нечеткого вывода
Примеры применения нейросетевых моделей обучения с подкреплением
Модель системы поддержки принятия решений
Модель брокера сельскохозяйственного рынка
Система управления комплексом лифтов
Система управления мобильным роботом
Библиографический список
Подробно рассмотрены примеры реализаций нейросетевых топологий с подкреплением на основе топологии «Внутренний учитель» и нейро – нечеткого адаптивного критика.
Монография предназначена для специалистов в области разработки нейросетевых систем управления и систем поддержки принятия решений, научных работников, аспирантов и студентов технических специальностей. Введение
Вводные темы
Искусственные нейронные сети
Марковский процесс принятия решений
Постановка задачи динамического программирования
Принцип оптимальности Беллмана
Самообучаемые системы с самомодифицирующимися правилами
Обучение
Q-фактор
Приближенный алгоритм итерации по стратегиям
Алгоритм итерации по значениям
Алгоритм Q-обучения
Модифицированный алгоритм Q-обучения
Q-обучение с использованием расстояния Хемминга
Нейродинамическое программирование
Метод временной разности в задачах обучения с подкреплением
Комбинирование Q-обучения и TD(λ)
Методы ускорения Q-обучения
Процесс исследования пространства состояний
Применение нейронных сетей для Q-обучения
Адаптивные критики
Введение в адаптивные критики
Алгоритм SАRSА
Обобщенная схема адаптивных критиков
Q-критик и V-критик
Теория функциональных систем П.К. Анохина
Проект «Животное» М.М. Бонгарда
Нейросетевая типология «Внутренний учитель»
Исходные условия
Принцип обучения самообучению
Способы реализации метода в прикладных задачах
Топология «внутренний учитель» с использованием нечеткого вывода
Примеры применения нейросетевых моделей обучения с подкреплением
Модель системы поддержки принятия решений
Модель брокера сельскохозяйственного рынка
Система управления комплексом лифтов
Система управления мобильным роботом
Библиографический список