Матричные игры

Парная антагонистическая игра с конечными множествами и V стратегий игроков называется матричной.
Приведение игры к матричной форме является специфической задачей принятия решений, связанной с формированием исходных множеств стратегий игроков и моделированием исходов операции. Чаще всего представление реального конфликта матричной игрой проводится на ранних этапах исследования операций, когда не требуется находить сразу наилучшие стратегии, а достаточно определить лишь области возможных решений для проведения дальнейших обобщенных и детальных исследований (см. гл. 10). Таким образом в рамках концептуальных исследований как строгих, так и нестрогих конфликтов проблема описания ситуации принятия решений в виде матричной игры имеет два аспекта. Во-первых, представление множеств II и V стратегий конечным множеством репрезентативных альтернатив и, во-вторых, — формирование адекватных в рамках выбранного уровня исследования моделей целей и исходов операций (которые описываются скалярным показателем V? («, о), отражающим строгий антагонизм возможно и в нестрогом конфликте сторон).
В силу конечности множеств стратегий игроков решение минимаксной задачи не представляет затруднений, так как может быть осуществлено последовательно по схеме, представленной на рис. 21. Однако равенство нижней и верхней цены матричной игры в чистых стратегиях, как правило, не выполняется, что приводит к нарушению условия равновесия по Нэшу. Это объясняется взаимной возможностью сторон адаптироваться к поведению противника, т. е. повышать ранг рефлексии: прогнозировать возможную ответную реакцию противника и отклоняться от своей чистой стратегии I* (или /*) с целью улучшить значение выигрыша. Однако для того чтобы использовать критерий адаптивности, игрок должен получать текущую информацию, а следовательно, игра должна повторяться многократно. Таким образом, использование критерия адаптивности придает дополнительные стратегические возможности игрокам, позволяет им находить рациональное сочетание чистых стратегий, использование которых в определенной пропорции дает в среднем дополнительный выигрыш. Если бы такая игра повторялась достаточно большое число раз (в пределе бесконечное), а стороны осуществляли выбор решений на основе критерия адаптивности, то их наилучшей стратегией в смысле этого критерия оказались бы так называемые смешанные стратегии.'
Смешанной стратегией игрока называется вероятностное распределение на множестве его чистых стратегий.
Таким образом, случайная переменная й (б), значениями которой являются чистые стратегии I (соответственно /)» является смешанной стратегией первого (второго) игрока с функцией вероятности Р1.