Биматричные игры

Представление реального конфликта матричной игрой — лишь начальный этап исследования. Адекватность такого представления определяется степенью антагонизма реального конфликта. При более тонком анализе необходимо учитывать то обстоятельство, что интересы субъектов не являются строго противоположными, т. е. (13.121) выполняется не для всех ситуаций игры. Такие конфликты могут быть описаны неантагонистическими играми.
Как и ранее, основным принципом выбора игроками своих стратегий является принцип наибольшего гарантированного результата. Однако он не исчерпывает всех стратегических возможностей игроков. В отличие от антагонистических игр, в которых равновесная ситуация (в чистых или смешанных стратегиях) является недоминируемой по наибольшему гарантированному результату, в неантагонистических играх равновесная ситуация может доминироваться другой (может быть даже и неравновесной) ситуацией.
Для неантагонистических игр равновесная ситуация (й°, б°) (по Нэшу) определяется условиями:
Любая конечная антагонистическая игра имеет хотя бы одну равновесную ситуацию (13.133), и, кроме того, максиминные выигрыши игроков не превосходят их равновесных выигрышей. Поэтому в случае неантагонистической игры использование игроками максиминных стратегий может считаться рациональным лишь в том случае, если максиминный выигрыш совпадает по величине с равновесным. Следовательно, решение неантагонистических игр сопряжено с дополнительными трудностями: необходимо отыскивать не только равновесные, но и максиминные точки. Общим правилом рационального поведения в неантагонистической некооперативной игре является следование: максиминной стратегии, если ее выигрыш совпадает с равновесным;
стратегии, приводящей к равновесному выигрышу, если его величина превышает максиминный и есть уверенность, что противник также будет придерживаться равновесной стратегии;
максиминной стратегии, если величины выигрышей противника известны лишь приблизительно или вообще неизвестны.
Общие методы решения конечной антагонистической игры N лиц в равновесных стратегиях неизвестны. Однако для конечных игр двух лиц, которые наиболее распространены в практике оценивания эффективности и надежности технических систем, решение может быть найдено просто.
Конечная бескоалиционная игра двух лиц называется биматричной. Модель такой игры описывается проблемной ситуацией (13.119) в предположении, что наиболее предпочтительными стратегиями игроков могут быть как максиминные, так и равновесные (й°, а0). Описывать игру удобно двухэлементной матрицей (биматрицей). Алгоритм для нахождения недоминируемой равновесной ситуации (1°, /°) может быть составлен на основе системы (13.133), так как пара чистых стратегий.
Если равновесная по Нэшу ситуация в чистых стратегиях отсутствует, то, руководствуясь условием (13.133), можно отыскать ситуацию равновесия (й°, 0°) в смешанных стратегиях, которая в биматричной игре всегда существует. Идея алгоритма нахождения пары (й°, 0°) основана на следующем положении. Равновесной смешанной стратегией одного из игроков является такая, при которой средний выигрыш другого не зависит от применяемой им стратегии.
Пример 20. Реальная ситуация с нестрогим конфликтом моделируется игрой, заданной матрицей:
Нетрудно убедиться, что игра не имеет ситуаций равновесия по Нэшу в чистых стратегиях (см. алгоритм 8). Для того чтобы определить рациональную стратегий каждого игрока, необходимо найти максиминный и равновесный выигрыши и сравнить их.
Для обеспечения полноты анализа предварительно найдем чистые макси-минные стратегии игроков: противника, то, выбирая свой макси-минные стратегии, они придут к ситуации (/*, /*), которая реально обеспечит выигрыши.
Однако эта ситуация неустойчива, так как если второй игрок захочет улучшить свое положение на основе информации об устремлениях первого игрока (узнав его матрицу выигрышей), то он может выбрать стратегию, что приведет к ситуации, невыгодной для первого игрока. В свою очередь первый игрок, узнав платежную матрицу второго и предполагая описанную выше его реакцию (т. е. рефлексируя его поведение), может также отклониться от стратегии, что приведет к ситуации, невыгодной для второго игрока, и т. п. Подобная многоуровневая рефлексия (т. е. использование критерия адаптивности) приводит в итоге к смешанным максимальным стратегиям игроков.
Максимальные смешанные стратегии игроков определяются по их собственным платежным матрицам порядком, описанным на стр. 314. Поскольку рассматриваемая в примере 20 игра имеет размерность 2X2, ее можно решить аналитическим методом. Например, стратегия й* определяется следующим образом: первый игрок должен выбрать такие вероятности Р*1 и Р%11, которые обеспечивают ему неизменный выигрыш независимо от того, какую стратегию выбирает второй, т. е., если Р\г = х, то
Сравнение полученных результатов показывает, что смешанные максиминные стратегии обеспечивают игрокам больший средний гарантированный результат.
Найдем равновесную по Нэшу ситуацию (й°, 6°) в смешанных стратегиях. Для этого первый игрок может определить вероятности Р^ и Р^1, взяв за основу матрицу выигрышей второго игрока, выбрав такие их величины» чтобы выигрыш второго игрока не зависел от выбираемой им стратегии. Это приводит к следующему уравнению/
Таким образом, выигрыши игроков в ситуациях (й*, б*) и (/2°, й°) совпадают и соответственно равны поэтому применять стратегии й° и б° игрокам не обязательно. Это связано с тем, что отклонение одного из игроков от паворотной по Нэшу ситуации (й° V0) не может улучшить его положение, но может существенно повлиять на выигрыш другого игрока. Действительно, если второй игрок применит, например, максиминную стратегию С* в то время, как первый придерживается стратегии й°, то средний выигрыш первого в ситуации (Й°, 0*) составит
Если от равновесной ситуации будет отклоняться первый игрок и применит свою стратегию й*, то второй получит выигрыш.
Таким образом, для первого игрока целесообразно придерживаться максиминной, а для второго — равновесной смешанных стратегий.
Рассмотренный пример показывает, что при решении биматричных игр необходим весьма полный и подробный анализ, включающий ряд неформальных этапов. При этом необходимо определить максиминные и равновесные ситуации как в чистых, так и в смешанных стратегиях, а выбор решения осуществлять на основе анализа предпочтительности для игроков возможных отклонений от равновесных ситуаций.