По построению р (х (Т), у (Г))<£. Пусть теперь й
{t)
= u* (х (/),
у (t), t), и хотя стратегия и* (х, у, /), использующая для выработки
управления информацию о положении Е, недопустима, стратегия
й (/) является допустимой, поскольку использует лишь информацию
о времени, прошедшем с момента начала игры и о начальном
состоянии игрока Е. Очевидно, что в ситуациях (й (t), v (х, у, t))
и (и* (х, y,J), v (х, у, t)) траектории игроков совпадают, поскольку
стратегия v (x, у, t) одинаково реагирует как на стратегию и* (х,
у,
/), так и на стратегию и (/) выбором управления v (х (/), у (/),
J*)).
Таким образом, мы показали, что для каждой стратегии v (х,
у,
t) существует программное управление
й
(/), являющееся допусти-
мой стратегией в игре_ с неполной информацией, и такое, что
Р (* (^L
У
(У))<е, где х (f), у (t) — соответствующие траектории.
Выбор v (х, у, t) произволен, поэтому отсюда следует, что
шр1ш>(х(Г),;и(Г)) = 0, (9.5)
где supinf берется по множествам стратегии игроков в игре с непо-
лной информацией.
Вместе с тем для любой стратегии и (х, г) игрока Р можно
построить такую стратегию v (х, у, t) игрока
Е,
что в
ситуации
(и
(х, г),
v (х, у, /)) выигрыш р игрока Е превзойдет рТ. Действительно, пусть
м
(х, /) — некоторая стратегия игрока Р. Так как его движение не
зависит от у (f), то траектория движения игрока Р может быть
получена интегрированием системы
х=й (х, t), х (t
0
)=x
u
(9.6)
независимо от движения игрока Е. Пусть х (/) — траектория, полу-
чившаяся в результате интегрирования системы (9.6). Соединим
точких (Г) иу
0
и направим движение игрока Епо прямой [х (7),>>
0
]
в направлении от точки х (Г) с максимальной скоростью. Очевид-
но,
что такое движение игрока Е обеспечивает расстояние между
ним и точкой х (Т) большее или равное /?Г. Обозначим построен-
ную таким образ_ом стратегию игрока Е через v (t). Тогда получим,
что в ситуации (й (х, t), v (?)) выигрыш игрока Е больше или равен
величине рТ. Отсюда следует, что
infsupp(x(r),>>(r))^pT, (9.7)
где inf sup берется по множествам стратегий игроков в игре с непо-
лной информацией.
Из (9.5) и (9.7) следует, что значение игры в классе чистых
стратегий в рассматриваемой игре не существует.
9.4. Определение. Под
смешанной кусочно-программной
стра-
тегией поведения
(СКПСП)
игрока
Р
будем понимать
пару ft () =
{т,
d},
где х —
произвольное разбиение отрезка времени
[0, 7]
конечным
числом точек
0=ti<t
2
<...<t
k
=Tи
d-отображение,
ставящее
в со-
285