<<
>>

3.3.2. Методы обоснования решений с использованием биматричных бескоалиционных и биматричных кооперативных игр

После того, как вне зависимости от числа игроков мы сформировали матричную игру и оценили личные стратегические возможности ЛПР как первого игрока при полном антагонизме сторон, целесообразно продолжить исследование проблемной ситуации на основе дополнительной информации о предпочтениях субъектов операции.

Здесь прежде всего следует проверить адекватность одного из наиболее жестких ограничений модели проблемной ситуации — антагонизм интересов сторон. Для этого следует установить, не является ли истинным хотя бы одно из следующих утверждений: ?

один из игроков не всегда выигрывает ровно столько, сколько ему проигрывает другой; т. е. на самом деле каждый игрок имеет свою функцию выигрышей, и при этом для большинства ситуаций игры оказывается, что vt(a, Ь) * - иг(а,Ь)\ ?

имеется хотя бы одна ситуация (кроме ситуации равновесия в максиминных стратегиях игроков), для которой интересы игроков совпадают или весьма близки; ?

для ЛПР цена матричной игры, т. е. величина наибольшего гарантированного результата в ситуации равновесия, имеет весьма незначительную ценность, поэтому ЛПР намерено использовать свои дополнительные стратегические возможности.

Если хотя бы одно из перечисленных утверждений истинно, то следует усложнить модель проблемной ситуации и сформировать биматричную игру, чтобы оценить стратегические возможности и перспективы применения равновесных стратегий и стратегий угроз.

Термин “биматричная” в названии игры объясняется тем, что на множестве {(г, ;)} ситуаций игры, где г к 1 — номера соответствующих стратегий первого и второго игроков соответственно, задается матрица, каждый из элементов которой содержит упорядоченную пару чисел (и,г/, ч2ц). В общем случае всегда можно сделать, чтобы эти числа были неотрицательными. Такими их и будем в дальнейшем считать. Для неантагонистической, в частности для биматричной, игры на основании принципа индивидуальной рациональности формулируют условие равновесия (по Нэшу) в следующем виде:

»,(?, Г) > »,(*, п (3.12)

1!г{ги, Я > ]),

где (г, ]) — произвольная из допустимых ситуаций биматричной игры;

(г°, ]°) — равновесная ситуация биматричной игры.

В чем принципиальное отличие условия, задаваемого системой (3.12), по сравнению с ситуацией равновесия в антагонистической игре?

При анализе антагонистических игр мы отмечали, что уклонение любого из игроков от ситуации равновесия, в то время- как другой продолжает придерживаться своей макси- минной (или минимаксной) стратегии, приводит к ухудшению положения “уклониста" и одновременно — к улучшению значения выигрыша у рационально поступающего игрока.

В неантагонистической игре такое же отклонение может по-разному повлиять на выигрыш другого игрока.

Например, если оба игрока отклонятся от равновесной ситуации, то в результате они могут оказаться в ситуации, в которой выигрыш каждого из них может остаться прежним, может увеличиться или уменьшиться.

Кроме того, важно знать, что равновесный (по Нэшу) выигрыш для каждого из игроков не меньше по величине, чем выигрыш в максиминной ситуации равновесия, т. е. в общем случае:

и,«”, Г) > «,«• П (3.13)

Я > vг(i*, я,

где (г*, ;*) — максиминная ситуация равновесия в матричной игре;

(г°, }°) — ситуация равновесия (по Нэшу) в биматричной игре.

Следовательно, если при анализе биматричной игры будет установлено, что равновесные выигрыши игроков существенно превосходят максиминные, то в таком случае игрокам стоит подумать о перспективах применения равновесных стратегий. С одной стороны, если они применят равновесные стратегии, они могут получить существенно более предпочтительные результаты. И следование такой идее может быть провозглашено как принцип групповой рациональности. Но ведь если один из игроков отклонится от равновесной ситуации, например применит максиминную, то его-то выигрыш не улучшится, а другому это может оказаться на руку. Таким образом, применение каким-то игроком его максиминной стратегии, его поведение в соответствии с принципом индивидуальной рациональности, гарантирует этому игроку пусть скромный, но “независимый”, гарантированный результат. А вот следование равновесной (по Нэшу) стратегии хотя и обещает игрокам потенциальные преимущества в игре, но требует от них определенной смелости. То есть равновесные стратегии по своей сути более рискованные.

Проиллюстрируем особенности решения биматричной игры на концептуальных примерах анализа проблемы взаимного сокращения объема выпускаемой продукции.

Пример 1. На переговоры по сокращению объема выпускаемой продукции каждая из сторон (далее условно именуемые А и В) прибывает со своими пакетами предложений для конкурента. У каждой из сторон две альтернативы — настаивать на принятии своих предложений или принять предложения конкурента.

Оценим выгодность всех возможных ситуаций в порядковой шкале, считая, что если стороны не придут к соглашению, то сохраняется status quo и полезность переговоров равна нулю. Если принимается предложение стороны А в ущерб стороне В, то выигрыш стороны А более чем в три раза превышает выигрыш стороны В. Аналогично оцениваются выигрыши, если принимается предложение стороны В в ущерб стороне А. Для полноты анализа будем считать, что ситуация, когда обе стороны соглашаются на план конкурента, также имеет нулевую ценность для обеих сторон (как невероятный случай). Итак, стороны имеют следующие множества стратегий:

А= {а! — означает “настаивать на своем плане”, а2 означает “согласиться на предложение стороны В”},

В = { Ь, — означает “настаивать на своем плане”, Ь2 — “согласиться на предложение стороны А’’}.

В результате биматрица игры примет следующий вид: Ь, Ь2 (0,0) (10,3) (ЗДО) (0.0) Вначале найдем максиминные стратегии для каждого из игроков. Обе стратегии первого игрока являются максимин- ными,. так как они обеспечивают одинаковый наибольший гарантированный результат (равный нулю). Аналогично обе стратегии второго игрока являются максиминными с тем же гарантированным результатом.

Поскольку только равновесные ситуации могут быть предметом результативных переговоров, предварительно следует провести анализ игры с целью установления таких ситуа ций. Для установления ситуаций равновесия по Нэшу воспользуемся графической интерпретацией правила (3.12). Стрелками будем обозначать условно-оптнмальный выбор для каждой из сторон: стрелка направляется на более предпочтительную альтернативу при фиксированной стратегии конкурента.

Условно-оптимальные выборы сторон Л и В совпадают на ситуациях (1,2) и (2,1), так как соответствующие стрелки (вертикальные для А и горизонтальные для В) сходятся на этих элементах биматрицы. Это означает, что для данной игры имеется две ситуации равновесия по Нэшу, выигрыши в которых превосходят максиминный уровень.

Однако этих ситуаций две, и они принципиально отличаются по предпочтительности для каждой из сторон: ситуация (1,2) более предпочтительна стороне А, а ситуация (2,1) — стороне В. Поэтому игра не имеет решения в чистых стратегиях. ь, Ь; ь, а, (0,0) (10,3)

Т а, (0,0) “» (10,3) *2 V

(3,10 1

(0,0) а2 (3,10) т

о

о Пример 2. Стороны А и В решают договориться о масштабах сокращения объема выпускаемой продукции. У каждой из сторон две стратегии: 1

— поддерживать выпуск на прежнем уровне; 2

— произвести существенное сокращение выпуска продукции.

Измерение предпочтительности ситуаций даст тот или иной результат в зависимости от того, отсутствуют или имеются у каждой из сторон действенные методы контроля выполнения договоренностей.

Вначале пусть действенных мер контроля нет. Это означает, что если стороны решат произвести существенное сокращение выпуска продукции, а затем какая-то из них тайно нарушит соглашение, то это резко отразится на предпочтительности создавшегося положения для другой стороны. 248

В результате биматрица игры может иметь, например, следующий вид:

Сторона В: Ь, Ь2

а, (3,3) <-(10,0)

Сторона А:

т т

(0,10) <-(9, 9)

Макснмннные стратегии игроков приводят к ситуации (1,1), обеспечивающей им одинаковые максиминные результаты равные трем. В то же время игра имеет одну равновесную ситуацию (1,1), совпадающую с максимннной и дающую каждому из игроков выигрыш, равный максиминному. Кроме того, равновесная ситуация доминируется немакси- минной и неравновесной ситуацией (2,2). Таким образом, согласно сформулированным критериям рациональности игра имеет решение в максиминных чистых стратегиях. Содержательно это означает, что при отсутствии действенных мер контроля за соблюдением соглашения и санкций за допущенные нарушения ни одной из сторон невыгодно идти на сокращение выпуска продукции.

Пусть теперь у каждой из сторон имеются действенные меры контроля за соблюдением соглашения и разработана система штрафных санкций за нарушения договоренности.

В этом случае биматрица игры может иметь, например, следующий вид:

Сторона В:

(3,3) <-(7,0)

Сторона А:

1Т X

(0,7) —>(8,8)

Макснмннные стратегии сторон остаются прежними (не идти на сокращение выпуска продукции). Равновесных по Нэшу ситуаций для данной игры две: (1,1) и (2,2). Ситуация (2,2) доминирует над ситуацией (1,1). Выигрыш в ситуации (2,2) для каждой из сторон выше максиминного, следовательно, решением игры является недоминируемая ситуация (2,2), имеющая выигрыш больше максиминного. Содержательно это означает, что при наличии действенных мер контроля за соблюдением соглашения и эффективной системы штрафных санкций за нарушения договоренностей сторонам выгодно идти на кардинальные сокращения выпуска продукции.

Рассмотренные примеры являются иллюстративными в смысле условности значений выигрышей сторон. Эти выигрыши назначались нами в соответствии с простым предпочтением одного исхода над другим без детализации, на сколько или во сколько раз сильнее то или иное предпочтение. Для таких игр — "игр с предпочтениями" — бессмысленно говорить о применении смешанных стратегий. Если же би- матричная игра описывается в шкале полезностей не менее совершенной, чем интервальная, то рассмотрение смешанных стратегий оправдано, если это допустимо их интерпретацией в рамках данного конфликта.

Итак, ситуация равновесия по Нэшу — это схема анализа, пригодная для случая, когда никакое кооперирование не допускается. Но что делать, если и равновесный (по Нэшу) выигрыш участников не устраивает? В таком случае им ничего не остается, как начать обмениваться информацией и договариваться о совместном поведении в игре. Математической моделью конфликта при таком подходе становится кооперативная игра, которая ведется по следующим правилам: •

разрешено заключать совместные соглашения; •

допускается совместный выбор стратегий (в общем случае — смешанных); •

допускается передавать полезность от одного игрока к другому (хотя, возможно, и не всегда линейно).

Каждый из приведенных пунктов правил ведения кооперативных игр в целом означает следование принципу групповой рациональности. Однако последний пункт, хотя и предполагает, что игроки могут "покупать и продавать" друг другу имеющуюся в их распоряжении полезность, чтобы улучшить собственное положение в игре, не накладывает каких- либо ограничений на то, как это должно делаться.

А ведь принцип индивидуальной рациональности будет заставлять каждого, образно говоря, “тянуть одеяло на себя", а значит — индивидуальная рациональность может войти в противоречие с групповой. Другими словами, если кооперирование допускается, то сразу возникает вопрос: “Что такое справедливый дележ?”

Нэш предложил компромиссную схему [45] распределения имеющейся в распоряжении игроков максимальной полезности, которая может быть принята за модель “справедливого дележа”. Суть этой схемы в следующем. Вначале Нэш предложил “начало отсчета” — минимальный результат, ниже которого игрок не согласится получить ни при каких обстоятельствах. Понятно, что этот минимальный результат определяется собственными стратегическими возможностями каждого игрока и равен наибольшему гарантированному результату, который он может получить в антагонистической игре. Затем нужно было вычислять приращения Ди,(1>,, v2) и Ди^и,,^) полезностей игроков от согласованного ими дележа и, и v2. Эти приращения составляли:

Ди,(и1( v2) = и, - V(3.14)

Диг(и,, v2) = vг - V2Щ,

где V * И V * — максиминные выигрыши первого и второго игроков соответственно.

После этого формируется целевая функция ф(г>,,иг)= гДи,^, и,) Ди^и,, v2), и на множестве {и,,и2} допустимых дележей. отыскивается максимум этой функции. В результате компромиссное решение и, и иг отыскивается в ходе решения задачи:

и,,и2: шах ф(и,,г>2). (3.15)

Если мы вспомним (см. п. 2.5), что мультипликативная функция моделирует некоторую допустимую компенсацию

уменьшения одних значений своих частных компонентов за счет увеличения других, то поиск экстремума в задаче (3.15) как раз и отражает стремление к наилучшему компромиссному дележу полезности между игроками. При этом согласно соотношению (3.15) большую часть общей полезности при дележе получит тот игрок, у которого минимаксный результат (то самое "начало отсчета") или status quo представляет более предпочтительную величину. Это примерно соответствует некой гипотетической ситуации дележа определенной суммы денег между богатым и бедным, однако саму эту сумму они получат только при условии, что смогут договориться, как ее разделить. В такой ситуации, чтобы получить хоть что-то, более бедный скорее всего вынужден будет пойти на некоторые уступки при дележе, а богатый, у которого финансовое положение более прочное, может позволить себе дольше торговаться и настаивать на большей доле для себя.

Предположим, что кто-то из игроков все же не удовлетворен компромиссным решением, получаемым в ходе решения задачи (3.15). В таком случае он может исследовать свои стратегические возможности по применению стратегий угроз.

Что мы будем понимать под стратегией угрозы? Во-пер- вых, это некая реальная или провозглашенная в качестве возможной для применения в игре альтернатива поведения того или иного игрока. Во-вторых, эта альтернатива должна быть эффективна в отношении достижения цели дележа, а именно — объявление одним из игроков о намерении использовать стратегию угрозы должно склонить другого игрока к мысли, что ему выгоднее пойти на уступки при дележе, чем попасть в ситуацию, когда будет применена стратегия угрозы. Таким образом, эффективность стратегии угрозы определяется не только результатом предполагаемого истинного воздействия по каким-то физическим объектам. Такое воздействие может привести к изменению состояния объектов, связей между ними, формы или качества входящих в них элементов. Кроме того, эффективность стратегии угрозы в значительной мере оценивается психологическим воздействием на субъекта, которому угрожают. И это психологическое воздействие приводит к тому, что у этого субъекта изменяются мнения относительно ценности тех или ситуаций конфликта, изменяются суждения о пропорциях дележа полезности и т. п. Обо всем этом мы подробно говорили в п. 1.1.3, когда обсуждали понятие эффективности решения. В-третьих, поведение угрожающего игрока и само провозглашение стратегии угрозы должны быть таковыми, чтобы у того, кому угрожают, не оставалось сомнений в том, что угроза может быть приведена в исполнение. Таким образом, стратегия угрозы эффективна только в том случае, если она правдоподобна, если она может улучшить положение угрожающего по отношению к тому, кому угрожают и если она сделана обдуманно. Последнее означает, что если угроза объявлена, то угрожающий обязательно ее применит, если потребуется.

Найти компромиссное решение в случае применения игроками стратегий угроз можно путем решения задачи (3.15), если при формировании целевой функции вместо величин V* и V* использовать значения ю1угр и v2yт'>, которые представляют собой величины полезностей игроков в ситуации, которая сложится после применения игроками своих стратегий угроз.

Рассмотрим простой иллюстративный пример. Проблемная ситуация моделируется биматричной игрой вида

(1,4) (-2,-4)

(-3,-1) (4,1)

Эта игра похожа на ту, которую мы обсуждали в примере 1. Для этой игры имеются две ситуации равновесия по Нэшу, выигрыши в которых превосходят максиминный уровень. Эти ситуации принципиально отличаются по предпочтительности для каждой из сторон: ситуация (1,1) более предпочтительна второму игроку, а ситуация (2,2) — первому.

Наибольший гарантированный результат V* игры для первого игрока равен -2 и обеспечивается этому игроку применением его первой стратегии. Для второго игрока его наибольший гарантированный результат и * равен -1 и достигается применением вторым игроком также его первой стратегии. Скорее всего, такие значения выигрышей игроков устроить не могут, поскольку в данной игре они оперируют максимальной полезностью 1)^= 5 (суммы выигрышей в ситуациях (1,1) и (2,2) игры).

Если игра будет вестись как бескоалиционная, то, согласно принципу индивидуальной рациональности, игроки применят свои максиминные стратегии и получат реальные (а не гарантированные) результаты, соответствующие ситуации (1,1). Это, конечно, устроило бы второго игрока (его выигрыш стал бы равным 4), но никак не первого. В такой ситуации первый игрок хотел бы применить стратегию угроз, чтобы добиться для себя некоторых уступок от второго. Какие у него в таком случае стратегические возможности?

На рис. 3.7 представлена область допустимых решений рассматриваемой нами биматричной игры.

Если бы игроки могли применять смешанные стратегии, то значения средних результатов игры можно было бы представить замкнутой ограниченной областью в виде четырехугольника. Вершины этого четырехугольника соответствуют значениям выигрышей участников игры в каждой из четырех ситуаций в чистых стратегиях. Номера ситуаций проставлены на рис. 3.7 в круглых скобках. На рисунке для примера выделена одна из сторон четырехугольника, соединяющая точки, моделирующие величины выигрышей в ситуациях (1,1) и (2,1). Этот отрезок — геометрическое место точек, представляющих значения средних результатов игры в случае, когда первый игрок применит какую-то смешанную стратегию Р = (р,, р2), причем 0 < р, < 1, рг = 1 - р,, а второй — свою первую чистую стратегию.

Широкой стрелкой на рис. 3.7 указано направление предпочтений обоих игроков на значениях функций и1 и и2 выигрышей. Менее предпочтительными для игроков являются ситуации (1,2) и (2,1), более предпочтительны для них ситуации

(1,1) и (2,2). Из геометрии области допустимых решений следует, что все недоминируемые дележи, среди которых следует вести поиск компромисса, образуют "северо-восточную" границу данной области. Это недомнннруемое множество представляет собой отрезок, соединяющий точки со значениями выигрышей для ситуаций (1,1) и (2,2). В то же время, как мы уже отмечали, ситуация (1,1) более предпочтительна для второго игрока, а ситуация (2,2) — для первого. Предположим, что первый игрок попробует угрожать применить свою вторую стратегию, если второй не согласится на компромиссное решение, геометрически приближенное к точке, отображающей на рис. 3.7 ситуацию (2,2).

Будет ли такая угроза первого игрока эффективной? Нет! Очевидно, что второй игрок может легко парировать эту уг- розу, ответив контругрозой применить свою первую стратегию. Да, второй игрок вроде бы рискует при этом оказаться в ситуации (2,1), которая принесет ему явный проигрыш, равный -1. Однако такой исход сильнее наказывает первого игрока, поскольку его проигрыш составит -3. Следовательно, позиция первого игрока в рассматриваемой игре весьма сложная, а вот у второго игрока есть весьма эффективная угроза — применить свою первую стратегию.

Против такой угрозы первый игрок ничего не может предпринять, существенно не ухудшив свое положение в игре. Поэтому первому игроку следует пойти на значительные уступки при дележе общей полезности.

Определим компромиссный дележ общей полезности игроков, приняв ситуацию (2,1) за ситуацию угрозы со значениями полезностей для игроков г?[угр= -3 и игУФ = -1. С учетом того, что максимальная полезность V = и, + на эффек-

шах 1 2 л л

тивной границе равна 5, можно положить и, = 5 ~ и,. В таком случае функция ф(и(, vг) = Дг^и,, vг) Ди2(и,, vг) примет вид: ф(и,, vг) = [и, - (-3)] [(5 - и,) - (-1)] = -V* + Зvl + 18.

Максимум в задаче безусловной оптимизации можно искать, например, применив сначала необходимое, а затем — достаточное условие существования экстремума. Согласно необходимому условию производная от функции по аргументу должна быть равна нулю. После несложных преобразований находим, что это условие выполняется для стационарной точки vl = 3,5. Достаточное условие для задачи на максимум состоит в отрицательности второй производной от функции по ее аргументу в стационарной точке. Это условие также выполняется. Следовательно, решением задачи (3.15), задающим компромиссное решение Нэша в биматричной игре с угрозами, будут значения и,= 3,5; и,= 1,5. Точка (и,,и2) = (1,5; 3,5) на эффективной границе области допустимых решений на рис. 3.7 отмечена кружком.

Если решение, полученное в рамках модели “линейного распределения полезности”, участников игры не устраивает, то им остается попробовать достичь соглашения путем переговоров в ходе деловой беседы.

<< | >>
Источник: Балдин К. В., Воробьев С. Н., Уткин В. Б. . Управленческие решения: Учебник. - 2-е изд. - М.: Издательско-торговая корпорация «Дашков и К°». - 496 с.. 2006

Еще по теме 3.3.2. Методы обоснования решений с использованием биматричных бескоалиционных и биматричных кооперативных игр:

  1. 1.3. Постановки и основные методы решения базовых задач обоснования решений
  2. 3.4.1. Классические методы решения "игр с природой"
  3. 3.3.1. Технология предварительного анализа проблемной ситуации с использованием теории матричных игр
  4. 3.3.3. Технология анализа игр N лиц и методы группового выбора
  5. 1.2.1. Содержание процесса обоснования решений
  6. Статья 202. Законность и обоснованность решения
  7. 2.1. Постановка задачи обоснования решений в условиях определенности
  8. 5. Проверка обоснованности используемых методов учета затрат на производство
  9. Статья 195. Законность и обоснованность решения суда
  10. 3.9. Другие решения проблемы несовместимых способов использования земли; возникающее при этом различие между правами собственности и контрактными правами, а также между методами запретов в судебном порядке и взыскания ущерба
  11. 11.1. Использование метода непрерывной инвентаризации
  12. 13.3. Исчисление ВВП методом конечного использования