Задачи принятия решений в условиях поведенческой неопределенности

Во многих практических задачах, связанных с оценкой эффективности, результат операции определяется не только действием оперирующей стороны (ЛПР), но и действиями других субъектов системы, которые в общем случае преследуют собственные цели, не всегда совпадающие с целями ЛПР. Неопределенность такого рода при принятии решений относят к классу поведенческих неопределенностей Ау. Анализом ситуаций принятия решений в условиях поведенческой неопределенности занимается специальная наука — теория игр. Объектом исследования в теории игр являются конфликтные ситуации, т. е. ситуации, в которых цели и интересы отдельных субъектов не совпадают. Случай совпадающих интересов всех .субъектов системы можно рассматривать как задачу принятия решений коллективным согласованным органом.
Основной постулат теории игр — любой субъект системы по меньшей мере так же разумен (рационален), как и оперирующая сторона (ЛПР) и делает все возможное, чтобы достичь своих целей. От реального конфликта игра (математическая модель конфликта) отличается тем, что она ведется по определенным правилам, которые устанавливают порядок и очередность действий субъектов системы, их информированность, порядок обмена информацией, формирование результата игры (кто и сколько выиграл или проиграл).
При формализации реального конфликта обычно различают следующие основные типы игр:
1) стратегические и нестратегические; первые характеризуются тем, что каждый субъект системы действует независимо от остальных, преследуя свои цели, а вторые — тем, что субъекты выбирают единую для всех стратегию;
2) парные игры и игры Ы-лиц;
3) коалиционные и бескоалиционные;
4) кооперативные и некооперативные; в первых разрешен обмен информацией о возможных стратегиях субъектов системы (игроков);
5) со строгим и нестрогим соперничеством;
6) конечные и бесконечные (в первых — конечное число стратегий игроков)
и другие.
При решении задач, связанных с оцениванием эффективности в технике, особую роль играют парные стратегические бескоалиционные конечные некооперативные игры. Модель проблемной ситуации в этом случае имеет вид.
Формальное выражение систем 0*1 предпочтений игроков = 1, 2) основывается на двух ведущих принципах рационального поведения: принципе наибольшего гарантированного результата и принципе равновесия.
Принцип наибольшего гарантированного результата основан на том, что рациональным выбором одного из субъектов системы должен считаться такой, при котором он рассчитывается на самую неблагоприятную для него реакцию другого субъекта системы. В соответствии с этим наилучшей стратегией, например, первого игрока является та, для которой значение является наибольшим.
Принцип равновесия (равновесие по Нэшу) основан на том, что рациональным выбором любого субъекта считается такая стратегия (и0 для первого или V0 для второго), для которой ситуация (и0, о0) обоюдовыгодна: любое отклонение от ситуации (и0, о0) не является выгодным ни для одного из игроков.
После выявления структуры предпочтений игрока на множестве IIX V ситуаций игры с целью применения того или иного принципа рационального поведения необходимо, прежде всего, установить, различаются ли интересы, игроков на множестве ситуаций. Если, например, предпочтения игроков строго противоположны на всех парах ситуаций, т. е.
называется минимаксной, так как она обеспечивает ему наименьший гарантированный проигрыш ХР*, который представляет собой верхнюю цену игры.
Таким образом, если игроки I и II выбирают наилучшие стратегии по правилам (13.124), (13.125) соответственно, то первый не может «выиграть» меньше ХР~, а второй — проиграть ему больше, чем ХР*. Отсюда следует важное соотношение.
Стратегии, определенные по правилам (13.124), (13.125), будут удовлетворять принципу равновесия лишь в том случае, если нижняя цена игры совпадает с верхней, т. е.
Выражение (13.128) представляет собой формальную запись принципа равновесия по Нэшу для антагонистической игры. Седловая точка существует, если множества V и V замкнуты, выпуклы и ограничены, функция ХР (и, V) непрерывна, вогнута по и ^ 0 и выпукла по V € V (см. т. 2).