Построение функции эффективности в условиях стохастической неопределенности

Выше были рассмотрены принципы принятия решений в условиях стохастической неопределенности по скалярным «объективным» показателям. В этих случаях критерий (13.11) трансформировался в критерии (13.13), (13.16), (13.18) без учета информации 0О об отношении ЛПР к различным ситуациям в условиях стохастической неопределенности. Если получаемые с помощью «объективных» показателей решения образуют достаточно широкое подмножество, то необходимо расширять число показателей, вводя помимо математического ожидания и дисперсии другие моменты распределения и его квантили. В общем случае задача становится бесконечномерной. Поэтому целесообразно сразу установить предпочтения ЛПР на множестве распределений, а затем — стратегий с использованием (13.11). Для этого необходимо прежде всего сузить множество распределений выделив недоминируемое их подмножество.
Стратегии и называются стохастически недоминируемыми. В (13.44)           информация 0С является самой простой: «большее значение вероятности получения результата не ниже у предпочтительнее меньшего для всех значений характеристики у». На рис. 1 стратегии и, V С 1/0 несравнимы.
Как правило, множество Ц0 оказывается весьма широким. Поэтому дальнейшее его сужение возможно лишь путем расширения информации 0С. В сходных ситуациях принятия решения разные лица по-разному относятся к одному и тому же вероятностному распределению на множестве исходов. В этом случае говорят, что они имеют различную психологическую доминанту в ситуациях с риском. Формально это выражается в том, что оценочная функция, (принимается, что р (у, уТР) = у) для лиц различных типов имеет различный вид. На рис. 6 представлены графики функции (у) для лиц с различной психологической доминантой.
Психологической доминанте «объективный» соответствует функция с (У) = У у что приводит к установлению предпочтений на множестве стратегий по «объективным» показателям (13,3) или (13.44). Поясним сущность оценочной функции для ЛПР с различной психологической доминантой на следующем примере.
Пример 9. Руководство хозрасчетного объединения (ЛПР), занимающегося производством и сбытом бытовой радиоаппаратуры, должно решить вопрос: запускать ли в серийное производство в следующей пятилетке новую модель (стратегия и^ или продолжать выпуск старой (стратегия и2), пользующейся пока спросом. Результаты проведенного' исследования (экспертного оценивания и конструкторских проработок) позволили определить облик новой модели и затраты у21 на ее производство, доход у22 объединения от продажи новой модели, если она будет пользоваться спросом, вероятность р2 спроса, а также аналогичные величины уп (потери от выпуска устаревшего образца), у 12 (доход от продажи этого образца) и вероятность рх в случае продолжения выпуска «старой» продукции.
Предположим, что сравнение альтернатив руководством предприятия по «объективным» показателям привело к следующим результатам дисперсия дохода.
Таким образом, стратегии их и и2 с точки зрения «объективного» ЛПР (рис. 6, а) являются эквивалентными.
Если ЛПР обладает любой другой психологической доминантой, т. е. оценочная функция не является линейной 06° (у) ф у), то сравнение стратегий необходимо проводить следующим образом: одной из стратегий. Например, одну и ту же альтернативу и со значениями равновероятных результатов ух < 0 и у2 > 0 «объективный» оценит величиной 0,5 (у2 + ух), а «азартный» 0,5 (/00 (у2) + /0° Ы). Причем, поскольку /0° (у2) > у2, а | /6° (уд)  то субъективная ценность (полезность) этой альтернативы выше у «азартного» по сравнению с «объективным», т. е. если, например, Уъ<\Уг\, то для «объективного» ЛПР стратегия имеет отрицательную полезность (ему невыгодна), в то время как для «азартного» она может считаться выгодной (имеющей положительную полезность).
В рассмотренном примере предпочтения на множестве стратегий устанавливались путем сравнения математических ожиданий оценочной функции. Такой показатель, учитывающий психологические особенности ЛПР в ситуациях стохастической неопределенности (ситуации с риском), называется функцией эффективности скалярного результата * и определяется (13.2), также являются оценочными функциями характеристик исходов у для ЛПР с рассматриваемой психологической доминантой. Поэтому при построении оценочных функций / 0 (у) можно произвольно выбирать начало отсчета Ь и единицу измерения а, т. е. оценочная функция задается в интервальной шкале.
При исследовании эффективности почти всегда имеют дело с конечным множеством исходов <3. Каждый исход ц ^ С в рассматриваемом случае характеризуется скалярной величиной у. Поэтому в дальнейшем будем рассматривать только конечные распределения Р* (и) на множестве значений.
Удобно описывать различные ситуации принятия решений в условиях стохастической неопределенности с помощью «лотерей».
Лотереей I называется пара (У, Р), где У = (ух, у2, ..., уп} — множество характеристик исходов, Р = (рх, р2, ..., рп) — вероятностное распределение на нем.
На рис. 7, а приведен пример простой лотереи, а на рис, 7, 6 составной (сложной) лотереи, в которой исходами лотереи / являются лотереи /у, / = = 1, 5. На основе выявленного отношения предпочтения на множестве лотерей {/ (и) | и € Щ строится отношение предпочтения на множестве стратегий V по правилу:
Анализ (13.46) показывает, что задача сводится к получению оценок 0С (у, Щ, Л (У, (V)), I = 17^ И вычислению соответствующих математических ожиданий. Так как /6° верна с точностью до положительного линейного преобразования (13.45), то для установления начала отсчета и единицы измерения удобно задать оценки для любых двух исходов, а затем остальные соизмерить с ними. В качестве таких исходов выбирают наиболее предпочтительный у+ и наименее предпочтительный у. и полагают
При соизмерении произвольного исхода у с у_ и у+ пользуются следующим допущением, которое называется правилом замены. Если в исходной лотерее I любой из исходов у заменить на эквивалентный ему по предпочтительности, то для ЛПР будет безразлично, в какой из лотерей (исходной или новой) участвовать.
Исход у в этом случае заменяют на лотерею вида у+ с вероятностью Р (у) и у_ с вероятностью 1 — Р (у). Это означает, что ЛПР должен ответить на вопрос: какова должна быть вероятность Р (у), чтобы для него было безразлично получение исхода у наверняка или получение наилучшего значения у+ с вероятностью Р (у) и наихудшего у_ — с вероятностью 1 — Р (у). Такое правило замены показано на рис. 8. В этом случае / с {у) = Р (у). При числе исходов не более 10—20 описанный метод можно успешно применять для получения лотерей Г (и), и ^ 0 и использовать (13.46) для установления предпочтения на множестве II стратегий. Эквивалентность лотерей V и Г на рис. 8, а следовательно, и / ~ Г объясняется тем, что математические ожидания оценочной функции для этих лотерей одинаковы:
В задачах с большим числом исходов (более 20—30) установление предпочтительности лотерей удобнее производить другим методом, основанным на построении и аппроксимации оценочной функции /0° [у) по ограниченному числу точек. При этом вначале целесообразно установить тип отношения ЛПР к риску (несклонный, склонный, безразличный) для различных интервалов возможных значений характеристики уу а затем искать подходящую аппроксимацию оценочной функции. В общем случае на этом этапе может быть выявлена и психологическая доминанта ЛПР на всем интервале возможных значений у.
Тип отношения ЛПР к риску вводится на основе понятия достоверного (детерминированного) эквивалента лотереи.
Достоверным эквивалентом лотереи I называется величина такая, что ЛПР безразлично получить ли исход наверняка или участвовать в лотерее: ЛПР обладает несклонностью к риску.
Несклонность ЛПР к риску означает, что он всегда предпочитает наверняка получить средний выигрыш, нежели участвовать в лотерее.