Задача статистических решений

Следовательно, задачу статистических решений можно рассматривать как задачу принятия решения относительно условий или результатов функционирования большой технической системы по результатам исследования ее сравнительно простых подсистем (подопераций).
Пример 1. При нормальном режиме технологического процесса любое изделие независимо от других оказывается годным с вероятностью рх. Изделия изготовляют партиями по N штук в каждой. Партия считается годной, если содержит не более Лд дефектных изделий. Качество контролируют путем проверки взятых из партии наудачу п изделий (л<С Щ. Требуется установить пороговое значение г®, на основании которого по величине 2 (г — число дефектных изделий в контрольной выборке объема п) следует с минимальным риском считать всю партию объема N годной, т. е. содержащей не более /гд изделий. В этом случае степень риска связывается с возможными потерями в операции от принятых решений (правильных и ошибочных), а величины потерь выступают как внешнее дополнение для подоперации контроля. Решающее правило может быть как двух- (только принимать или только не принимать), так и многоальтернативным (принимать, отправить на доработку или произвести сплошной контроль, забраковать). В последнем случае необходимо установить не один порог г°, а два — г1, г2. Если г< г1, принять партию, если г >- г2 — забраковать, в остальных случаях осуществить сплошной контроль.
Пример 2. Радиолокационная станция, находясь в режиме дежурного приема, должна зафиксировать факт появления объекта (летательного аппарата). Помимо полезного сигнала станция воспринимает помехи. В результате этого возможны четыре информационные ситуации: объект правильно распознан, помеха принята за объект, объект принят за помеху, помеха правильно распознана. Каждая информационная ситуация может быть охарактеризована потерями, связанными с принятым решением. При неизвестной априорной вероятности появления объекта задача статистических решений может, например, формулироваться следующим образом: найти такое пороговое значение амплитуды сигнала, регистрируемого локатором, чтобы принимаемые по нему решения обеспечивали минимально возможные в среднем потери.
Таким образом, каждая из рассмотренных задач может быть сформулирована в следующей общей постановке.
Исследуемый фактор X может принимать одно из т возможных значений (состояний) Л.х, Х2, Xт; априорные вероятности Р (к}), / = 1, т удовлетворяют условию 2 Р (^|)  1- Про-1=1 водится испытание, в котором осуществляется п независимых наблюдений какой-либо характеристики (признака) г фактора X. Результаты наблюдений представляются системой случайных величин (2ц 22) дискретного или непрерывного типа из-за стохастической природы фактора X или измерения признака. Распределение этой системы зависит от конкретного значения и определяется функцией правдоподобия. Функция правдоподобия известна для всех А,*, / = 1, т и задается в зависимости от типа случайной величины 2 следующими выражениями: для дискретной случайной величины ^ (21* г2» • • • > 2пАг) =
По результатам эксперимента (гх, 22» гп) требуется осуществить выбор одного из к0 решений хх, х2, ..., хког каждое из которых основывается на оценке (по полученным данным) действительного состояния Л,,-.
Последствия выбора любого решения к = 1, к0 при условии, что объект находится в состоянии Я*, 1= 1, т, характеризуются значениями функции потерь Пь* = П {хк, X}), где ПА. — потери, связанные с тем, что при истинном значении Я* фактора X было принято решение Х&. В этом смысле элементарные решения хд являются характеристиками стратегии ЛПР, а их упорядоченный набор задает облик стратегии.
Сформулированная задача является общей задачей принятия решений при заранее фиксированном числе наблюдений (фиксированный эксперимент) в случае конечного множества возможных состояний.
Выбор стратегии (решающего правила) щ, I = 1, /0 в теории статистических решений осуществляется следующим образом. Пространство характеристик 2 разбивается каким-либо образом на к$ непересекающихся областей г6, 6= 1, к0. На множестве 2 определяется множество решающих правил щ, предписывающих выбор того или иного решения х% при попадании выборки в ту или иную область. Стратегии щ могут быть рандомизированными (случайными) или нерандомизированными (детерминированными). Детерминированная стратегия устанавливает однозначное соответствие решений хд областям гА, на которые разбито множество г.
При попадании выборки (г1г г2, гп) в ту или иную область рандомизированное правило предусматривает случайный выбор одного из решений.
Общая задача принятия решения теоретически может быть сформулирована и для случая бесконечного множества срстояний          Однако в практических приложениях такая задача возникает крайне редко и поэтому здесь не рассматривается. Не рассматривается также метод последовательного анализа Вальда, изложенный в т. 2, своему смыслу рандомизированное .правило есть вероятностная смесь нерандомизированных правил.
В общем случае стратегия щ сложнее правила, т. е. наблюдатель может либо верить результатам эксперимента, либо поступать так, как считает целесообразным. Для иллюстрации этого рассмотрим следующий пример.
Пример 3. Для контроля качества мелкой партии из нее отбирают один образец и его размеры контролируют тремя шаблонами. В этом случае пространство г результатов, измерений является дискретным и содержит три точки (исхода %2> ёз), соответствующие трем возможным размерам по шаблонам. В соответствии с двумя возможными решениями (хх — принять партию, х2 — забраковать партию) необходимо определить множество возможных нерандомизированных стратегий. В соответствии с решениями х&, к = 1, к0 разобьем пространство 2 на к0 непересекающихся подобластей (рис. 2). Тогда каждому из возможных разбиений можно поставить в соответствие стратегии, число которых /0 = 2° = 8.
Содержательно стратегии предписывают следующий порядок действий: иг — принять партию при любом исходе эксперимента (рис. 2, а); и2 — принять партию, если изделие соответствует размерам первого или второго шаблона, и забраковать в противном случае (рис. 2, б). Аналогично определяются стратегии ы3,  ив (соответственно схемам разбиения на рис. 2, в—з).
Какого-либо общего метода определения функции потерь теория статистических решений не дает. На практике значения П&.* определяют из анализа внешнего дополнения с учетом реальных условий каждой задачи. Так, указанные значения оценивают либо убытками от выбора неправильных решений, либо наряду с убытками вводят в рассмотрение выигрыш от выбора правильных решений (отрицательные потери), либо одновременно с убытками и выигрышами учитывают затраты на эксперимент и т. д. Удобнее элементы матрицы потерь представлять относительными потерями.
Что обеспечивает неотрицательность всех ее элементов при любом подходе к определению потерь.
В качестве характеристики потерь, средних для многократного применения нерандомизированной стратегии  при условии, что действительное значение фактора А равно А*, принимается условная функция потерь (риска).
Для установления предпочтения на множестве стратегий V = {щ, I = — 1, /„} вводится числовая функция (показатель эффективности подоперации), которая в зависимости от имеющейся в распоряжении ЛПР информации имеет вид, где — апостериорная вероятность состояния А, соответствующая попаданию выборки &п в точку ^ пространства выборок 2 (предполагается, что детерминированная стратегия и совпадает с решением х).
Выражение (13.23) представляет собой средние потери (риск) от применения стратегии щ, выражение (13.24) — гарантированные средние потери, а (13.25) — апостериорные средние потери.
Если по тем или иным причинам нельзя определить матрицу потерь II П&* ||, то в качестве показателя эффективности часто используют следующую функцию, заданную на множестве возможных значений, значение которой суть апостериорная вероятность истинности состояния А — А*' при условии, что реализовалась выборка (2Х, г2, ..., гп). Решение ЛПР в этом случае связывают с идентификацией (распознаванием) состояния по результатам эксперимента.
В качестве критерия эффективности при использовании показателей (13.23)—(13.25) используют критерий оптимальности вида.
Если в (13.27) в качестве показателя эффективности используется (13.23), то такое правило называют байесовским, в случае (13.24) — минимаксным, а в случае (13.25) — байесовским апостериорным.
При использовании показателя (13.26) критерий оптимальности называют правилом максимума апостериорной вероятности.
В этом случае пространство 2 представляется тремя точками: 1 (г = 0), соответствующей числу г дефектных изделий в контрольной выборке, равному нулю.
В этом случае стратегией ЛПР и упорядоченный набор является следующее предписание действий по результатам эксперимента: принимать партию готовой продукции, если среди контрольных изделий окажется не более одной дефектной, и браковать, если оба контрольных изделия дефектны. В стратегии и частная ее характеристика (элементарное решение) ха отсутствует.
Однако такая стратегия может оказаться излишне осторожной, так как может существовать рандомизированная стратегия, для которой средние гарантированные потери меньше.
Поиск рандомизированной стратегии и можно осуществлять либо методом теории игр (этот метод будет рассмотрен позднее), либо основываясь на следующем положении, доказанном в теории статистических решений: рандомизированная минимаксная стратегия удовлетворяет условию.
Найдем рандомизированную стратегию и* из условия (13.28). На рис. 3 представлены элементы множества и его смешанное расширение.
Таким образом, рандомизированная стратегия ы* есть смесь детерминированных стратегий и и8 с вероятностями 0,12 и 0,88 соответственно. При этом гарантированные средние потери определяются выражением множество возможных априорных распределений состояний фактора Я; Р (Я) = (Р (Ях), Р (Яа), ..., Р (Кп))Т — вектор априорных вероятностей состояний фактора Я.
В практике исследования эффективности часто встречаются ситуации, когда неопределенный фактор Я, влияющий на исход операции, может принимать лишь два возможных значения: Такие задачи возникают при распознавании объектов и явлений, статистической проверке гипотез (см. т. 2), при проектировании автоматических систем и т. д. При этом измеряемая характеристика г фактора Я может рассматриваться как скалярная непрерывная случайная величина. В этом случае подоперация состоит в том, что по результатам измерения характеристики г необходимо принять решение о том, что фактор Я принял значение Ях (гипотеза Нг) или ^ (гипотеза Я2). Такое решение осуществляют с помощью заранее установленного порогового значения г°, например, следующим образом: если г — принять гипотезу.
На рис. 4 изображены условные плотности распределения характеристики г — / (г/А*) и ] (гДа), положение которых определяется' условными математическими ожиданиями тг^ и тг соответственно. Назначение порога 2® приводит к тому, что можно совершить два рода ошибок: принять гипотезу //2 при истинном состоянии фактора А, = = А^ — ошибка первого рода; принять гипотезу Нг при истинном состоянии А, = А^ — ошибка второго рода.
Часто эти ошибки называют «ложной тревогой» и «пропуском цели» соответствен но.
Вероятности а и Р ошибок первого и второго рода определяются выражениями:
Отнесение ошибок к тому или иному роду достаточно условно. Однако во многих случаях гипотезы назначают таким образом, чтобы ошибка первого рода приводила к более серьезным последствиям, нежели ошибка второго рода.
При выборе порога руководствуются пятью основными критериями: Байеса, минимаксным, максимума апостериорной вероятности, максимума правдоподобия и Неймана— Пирсона.
Критерий Байеса применяется, когда известны априорные вероятности Р (А.*) и матрица потерь |] П&; ||, I = 1, 2, к = 1,2, где П&* — потери от решения о принятии гипотезы Я* при истинном состоянии А, = А,*. Для определения .порога 2° используется отношение правдоподобия.
Минимаксный критерий используется при неизвестных априорных вероятностях Р (А,*) и заданной матрице потерь.
Критерий максимума апостериорной вероятности применяется при известных априорных вероятностях Р (А*) и неизвестной матрице потерь.
Критерий максимума правдоподобия используется тогда, когда не известны ни априорные вероятности, ни матрица потерь.
Критерий Неймана—Пирсона применяется в тех же случаях, что и критерий максимума правдоподобия, однако от ЛПР можно получить информацию о требуемом уровне вероятности ошибки первого рода.
Для решения практических задач и анализа различных ситуаций, связанных с выбором порога г°, удобно пользоваться так называемой рабочей характеристикой (рис. 5), которая представляет собой зависимость величины 1 — Р, называемой мощностью критерия, от величины а. С использованием рабочей характеристики помимо анализа зависимости величин а и Р при использовании критерия Неймана—Пирсона        можно определить ошибки а и р, соответствующие критерию Байеса и минимаксному критерию.
Для определения а и Р по критерию Байеса на рабочей характеристике надо найти точку, касательная в которой имеет угол наклона.
Для определения а и р по минимаксному критерию необходимо найти точку пересечения рабочей характеристики с прямой.
При неизвестных априорных вероятностях Р (Я) состояний фактора X ЛПР вынуждено использовать либо минимаксный критерий (если задана матрица потерь), либо критерий Неймана—Пирсона (при неизвестной матрице потерь). Однако даже в этом случае у ЛПР могут быть некоторые субъективные представления о том, какие значения неопределенного фактора более возможны, а какие менее возможны. Поэтому вместо весьма «осторожного» минимахсного критерия появляется возможность использовать более информативные критерии (Байеса, максимума апостериорной вероятности), восстанавливая по информации от ЛПР субъективное априорное распределение вероятностей на множестве.
Задача получения оценок субъективных априорных вероятностей родственна задаче выявления и измерения предпочтений на множестве, так как, проводя операцию, ЛПР ориентируется на более вероятные (возможные) состояния по сравнению с состоянием (состояниями). Формально это эквивалентно утверждению: «элемент важнее элемента или совокупности таких элементов».
Следовательно, для определения точечных оценок Р* (Х() априорных вероятностей Р (Я|) можно использовать аппарат, описанный на с. 206 и 211. В частности, оценки Р* (Х^) могут быть определены методами установления порядковых коэффициентов важности. Существуют и специальные методы оценки субъективных вероятностей. Рассмотрим те из них, которые основаны на использовании информации в форме элементарных суждений типа.
Информация типа (13.36) и (13.37) не всегда имеет место, так как весьма редко каждое из предыдущих состояний Я 1к в ранжированном ряду будет более вероятно, чем хотя бы одно из последующих в этом ряду, а также, что сдвиг /о будет одинаков для всех к. В произвольной ситуации система предпочтений на множестве Ае порождает систему неравенств вида, где Л, С — неотрицательные матрицы; 6, й — неотрицательные векторы.
Система (13.43) решается с помощью метода невязок.
Методами экспертного оценивания можно определять значения элементов матрицы потерь.