систематически принимающих влево (P), и процент автомобилистов Б, принимающих вправо (1 –
Р). Условие для того, чтобы стратегия "принять вправо" стала для автомобилиста А эволюционно-
стабильной, формулируется следующим образом: EU (вправо) > EU (влево), или 0P+ 1 (1 – P) (1P
+ 0 (1 – P), откуда P > 1/2. Таким образом, при превышении доли автомобилистов во встречном
потоке, принимающих вправо, уровня 50% эволюционно-стабильной стратегией становится
"принять вправо" – сворачивать на правую обочину при каждом разъезде.
Эволюционно-стабильная стратегия – такая стратегия, что если ее использует большинство
индивидов, то никакая альтернативная стратегия не может ее вытеснить посредством
механизма естественного отбора, даже если последняя более эффективна по Парето.
В общем виде требования к эволюционно-стабильной стратегии записываются следующим
образом
12
. Стратегия I, используемая контрагентами с вероятностью р, является эволюционно-
стабильной для игрока тогда и только тогда, когда выполняются следующие условия: EU (I, p) >
EU (J, p), что тождественно pU (I, I) + (1 – p) U (I, J) > pU (J, I) + (1 – p) U (J, J). Из чего следует:
• U (I, I) > U (J, I) или
• U (I, I) = U (J, I) и U (I, J) > U (J, J),
где – U (I, I) выигрыш игрока при выборе стратегии I, если контрагент выбирает стратегию I;
U (J, I) – выигрыш игрока при выборе стратегии J, если контрагент выбирает стратегию I, и т.д.
Можно представить эти условия и в графической форме. Отложим по вертикальной оси
ожидаемую полезность выбора той или иной стратегии, а по горизонтальной – долю индивидов в
общей популяции игроков, выбирающих обе стратегии. Тогда мы получим следующий график
(значения взяты из модели разъезда двух автомобилей), изображенный на рис. 6.1.
Из рисунка следует, что и "принять влево", и "принять вправо" имеют равные шансы на то,
чтобы стать эволюционно-стабильной стратегией до тех пор, пока ни одна из них не охватила
больше половины "популяции" водителей. Если же стратегия перешагивает этот рубеж, то она
постепенно, но неизбежно вытеснит другую стратегию и охватит всю популяцию водителей. Дело
в том, что, если стратегия перешагивает рубеж 50%, для любого водителя становится выгодным
использовать ее в маневрах, что, в свою очередь, еще больше увеличивает привлекательность
данной стратегии для остальных водителей. В строгой форме данное утверждение будет
выглядеть следующим образом: dp / dt = G [EU (I, p) – EU (J, p)], G' > 0.
Рис. 6.11
Главным результатом анализа повторяющихся игр является увеличение числа точек
равновесия и решение на этой основе проблем координации, кооперации, совместимости и
справедливости. Даже в дилемме заключенных, как мы уже упоминали в предыдущей лекции,
переход к повторяющемуся взаимодействию позволяет достичь оптимального по Парето
результата ("отрицать вину"), не выходя за рамки нормы рациональности и запрета на обмен
информацией между игроками. Именно в этом смысл "всеобщей теоремы" (folk theorem): любой
исход, устраивающий индивида индивидуально, может стать при переходе к структуре
повторяющейся игры равновесным
13
. В ситуации дилеммы заключенных равновесным исходом
при определенных условиях может стать и простая стратегия "не признавать", и множество
смешанных стратегий. В числе смешанных и эволюционных стратегий, помимо Tit for Tat ("зуб за
зуб"), отметим следующие: Tit-For-Two-Tats – начинать с отрицания вины и признавать вину,
только если в два предшествующих периода кряду контрагент признавал вину; DOWING –
стратегия, исходящая из предположения о равновероятном использовании контрагентом стратегий
"отрицать вину" и "признавать" в самом начале игры. Далее каждое отрицание вины со стороны
контрагента поощряется, а каждое признание – наказывается выбором стратегии "признавать
вину" в следующий период; TESTER – начинать с признания вины, и если контрагент тоже
признает вину, то в следующем периоде отрицать вину (т.е. извиниться) и далее использовать
– 47 –