смотрен алгоритм нахождения оптимального по Парето реше-
ния игры (31) —(32) с помощью штрафных функций.
Метод оптимизации и построение множества значений функ-
ций выигрыша на оптимальных по Парето решениях предложен.
Б.
В. Гороховиком и М. П. Дымковым [43] и М. П. Дымковым.
[61].
Линейные задачи также рассматривались в работах Ка-
цутоши
[263],
О.ри
[247],
Андерсона и Летеша
[277],
Лозера
и Вольза
[276].
1.7. Принцип оптимальности и равновесные ситуации, опти-
мальные по Парето. Метод динамического программирования,
на котором основывается большинство достаточных условий в-
[151] и в настоящем обзоре, в свою очередь следует из прин-
ципа оптимальности Беллмана [6]. Пусть x(t),
t
0
^t^T,—
оптимальная траектория системы (10) и момент времени
^i
6
(-o-
T), Принцип оптимальности утверждает, что отрезок
оптимальной траектории от точки x\t\) до точки х(Т) также
является оптимальной траекторией. Это фактически означает,
что для начального состояния x(t{) та часть траектории, кото-
рая соответствует переходу из точки x(t{) в точку х(Т), являет-
ся оптимальной независимо от предыстории системы, т. е. от-
того,
каким образом система достигла состояния
x(t{).
Такой интуитивно очевидный принцип с успехом применяет-
ся в задачах оптимального управления и в антагонистических
дифференциальных играх двух лиц. Однако в дифференциаль-
ных неантагонистических играх (с ненулевой суммой) принцип
оптимальности требует уточнения. Дело в том, что в задачах
оптимального управления и антагонистических дифференциаль-
ных играх двух лиц понятие «оптимальности» достаточно ясно и.
однозначно — либо максимизируется целевая функция (опти-
мальное управление), либо один игрок максимизирует, другой —
минимизирует плату дифференциальной антагонистической
игры. В дифференциальных играх с ненулевой суммой само
понятие «оптимальность» требует уточнения: здесь под «опти-
мальностью» можно понимать и равновесность по Нэшу, и оп-
тимальность по Парето, по Слейтеру и т. д.
Поэтому, на наш взгляд, принцип оптимальности для диф-
ференциальных игр с ненулевой суммой нужно формулировать
в следующем виде. Пусть до начала 'игры все участники кон-
фликта согласовали между собой, какой концепции оптималь-
ности они будут придерживаться в течение игры. Предположим,.
что набор управляющих воздействий u°[t] = {u
l
°(t),..., u
N
°(t)}
(решение игры) и порожденная ими оптимальная траектория
x°(t) системы (1)
—
(2) реализуют выигрыши .игроков, удовлет-
воряющие выбранной концепции оптимальности, а момент
^6(/
0
,
Т) произволен. Тогда, чтобы а
0
было решением игры,.
необходимо, чтобы набор управлений и
0
на втором периоде
игры [t
u
T] и порожденная ими оптимальная траектория x°{t)
системы (1) с начальным состоянием x{t{) также реализовали
4Ъ