Экспертные оценки минимаксного метода и методов Байеса — Лапласа и Сэвиджа. Применение теории игр для оптимизации принимаемых решений

Критерий пессимизма-оптимизма Гурвица

В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска.

Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма.

Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях .

Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:

Wi = Cminj aij + (1-C) maxj aij (1.4.3)

Где C - коэффициент пессимизма.

Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально: W = max Wi

При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий азартного игрока, делающего ставку на то, что «выпадет» наилучший случай.

Критерий Гурвица применяется в ситуации, когда:

1. Информация о состояниях окружающей среды отсутствует или недостоверна;

3. Реализуется только малое количество решений;

4. Допускается некоторый риск.

Критерий Ходжа-Лемана

Этот критерий опирается одновременно на ММ-критерий и критерий максимального математического ожидания выигрыша. При определении оптимальной стратегии по этому критерию вводится параметр достоверности информации о распределении вероятностей состояний окружающей среды, значение которого находится в интервале .

Если степень достоверности велика, то доминирует критерий максимального математического ожидания выигрыша, в противном случае ММ-критерий

Платёжная матрица дополняется столбцом, коэффициенты которого определяются по формуле:

где u - параметр достоверности информации о вероятностях состояний окружающей среды.

Оптимальной по данному критерию считается та стратегия, в которой значение Wi максимально: W = max Wi

Данный критерий применим в следующем случае :

1. Имеется информация о вероятностях состояний окружающей среды, однако эта информация получена на основе относительно небольшого числа наблюдений и может измениться;

2. Принятое решение теоретически допускает бесконечно много реализаций;

3. При малом числе реализации допускается некоторый риск.

Пример решения статистической игры

Рассмотрим пример решения статистической игры в экономической задаче.

Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации - с осени до начала лета следующего года.

Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации:

A1 - реализовать всю капусту осенью, непосредственно после уборки;

A2 - заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев;

A3 - заложить всю капусту на хранение и реализовать её в весенние месяцы.

Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц.

На региональном рынке капусты может сложиться одна из следующих трёх ситуаций:

S1 - поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта;

S2 - в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен - в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации;

S3 - в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной. Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются. Поэтому рынок испытывает значительные сезонные колебания цен.

Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 6.

Таблица 6.

Выручка от реализации капусты, тыс. д.е.

В задаче необходимо определить:

1. Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно;

2. Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо:

а) получить минимально гарантированный выигрыш;

б) учесть значения риска от принятия различных решений;

в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3;

3. Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7;

4. Дать экономическую интерпретацию результатов решения задачи.

1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (таблица 7).

Таблица 7

Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты

Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 (W = 6,3)

3. Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма (на рисунке - ПО-критерий, таблица 9).

Таблица 9

Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма

Значения Wi для ММ-критерия найдём по формуле:

W1 = min (10, 5, 2) = 2

W2 = min (0, 10, 3) = 0

W3 = min (-10, 0 20) =-10

Оптимальной стратегией по максиминному критерию является стратегия A1 (W = 2).

Определим оптимальную стратегию по критерию недостаточного основания Лапласа.

По данному критерию оптимальной является стратегия A1 (W = 5,67).

По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 (формула (6)) - стратегия A3 (W = 11).

4. Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (таблица 10).

Таблица 10

Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков

По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 (W = 4,94).

6. Проведём экономическую интерпретацию результатов решения задачи.

Если предприятие имеет информацию о вероятностях состояния рынка капусты и значения этих вероятностей соответствуют исходным данным задачи, наиболее выгодной стратегией является продажа части капусты в осенние месяцы и хранение оставшейся капусты для реализации в течение зимних месяцев (прибыль составит 6,3 тыс. д.е.).

Эта же стратегия является наиболее эффективной, если информация о вероятностях состояний рынка капусты отсутствует и пользователю необходимо минимизировать степень возможного риска потери прибыли в процессе принятия решения (значение возможного риска составит 17 тыс. д.е.).

В случае, когда при отсутствии информации о состоянии рынка наиболее существенным для пользователя является не максимизация прибыли в абсолютном выражении, а получение её гарантированного объема, хотя бы и минимального, наиболее целесообразным решением является реализация всей капусты в осенние месяцы (прибыль составит 2 тыс. д.е.).

Это же стратегия является наиболее выгодной, если пользователь имеет информацию о вероятностях состояний рынка, соответствующую исходным данным, но эта информация не вполне достоверна (в случае, если информация имеет достоверность 0,7, прибыль составит 4,94 тыс. д.е.).

В случае, если информация о вероятностях состояний рынка отсутствует и риск значительных потерь не является для пользователя определяющим фактором при принятии решения, или если есть основания для оптимистической оценки ситуации на рынке капусты, при котором пользователь имеет возможность получить наибольшую прибыль от производства капусты, ему следует сохранить произведённую продукцию и реализовать её в весенние месяцы (прибыль составит соответственно 5.7 и 11 тыс. д.е.).

принятие решение оптимальный программный

Критерий Ходжа-Лемана.

Обозначается – HL-критерий. Представляет собой взвешенную сумму критериев Байеса-Лапласа и МиниМаксного.

где v – весовой коэффициент,
и отражает степень доверия к используемому распределению вероятностей.

Если v=0 - критерий HL совпадает с ММ-критерием;

Если v=1 – критерий HL совпадает с критерием Байеса-Лапласа.

Данный критерий применяется:

Вероятность появления событий F j – неизвестны, но можно сделать некоторые предположения.

Принятие решений теоретически реализуется и при малых числах реализации допускается некоторый риск.

Критерий Гурвица

Обозначается – HW-критерий.

В этом критерии оценочная функция представляет собой средневзвешенное между точками зрения крайнего оптимизма и крайнего пессимизма.

где с – весовой коэффициент. Обычно с=0,5. Тогда получаем среднее взвешенное.

Правило выбора согласно критерию Гурвица, формируется следующим образом:

матрица решений
дополняется столбцом, содержащим среднее взвешенное наименьшего и наибольшего результатов для каждой строки. Выбираются только те варианты, в строках которых стоят наибольшие элементы e ij этого столбца.

Если с=1 – критерий азартного игрока;

Если с=0 – критерий минимаксов.

Применяется этот критерий:

о вероятности наступления событий ничего не известно;

решение принимается малое число раз и допускается некоторый риск.

С – показывает степень допустимого риска.

Составной критерий Байеса-Лапласа и МиниМаксного критериев BL (MM )

Данный критерий позволяет управлять величиной допустимого риска и более того, позволяет выбрать решение, в котором риск будет оправдан.

Идея этого критерия: вначале находится решение по МиниМаксному критерию и это решение используют в качестве опорного. После этого выбирают уровень допустимого риска, т.е. величину на которую возможный выигрыш может быть меньше, чем в опорном решении (в худшем случае). Из дальнейшего рассмотрения исключаются все решения, у которых величина риска превышает допустимый. Обозначим i 0 – номер опорного решения.

- величина допустимого риска.

В результате получаем множество решений. Это дает возможность выбрать среди них решения, в которых риск оправдан, т.е такие решения, дополнительный выигрыш которых в лучшем случае по сравнению с базовым вариантом превышает возможный проигрыш в худшем случае.

Пример: пусть некую технологическую установку требуется подвергнуть проверке с приостановкой ее работы. К текущему моменту времени установка может находиться в одном из трех состояний:

F 1 – неисправностей нет и установка может продолжать работу;

F 2 – требуется незначительный ремонт отдельных деталей;

F 3 – дальнейшая эксплуатация установки возможно только после капитального ремонта.

Возможные решения:

E 1 – осуществить полную проверку оборудования с привлечением специалистов со стороны;

E 2 – провести осмотр и возможный ремонт своими силами;

E 3 – отказаться от проверки и не приостанавливать выпуск продукции.

Исходя из опыта, предприятие построило следующую матрицу, приняв во внимание основной критерий – затраты на проверку и ремонт.

По МиниМаксному критерию следует выбрать решение Е 1 , т.е. осуществить полную проверку оборудования с привлечением специалистов со стороны.

=-20, т.е. решение Е 1 .

Критерий Сэвижда.

Строим матрицу сожалений:

По критерию Сэвиджа – решение Е 1 .

Критерий Байеса-Лапласа.

Предположим, что все состояния равновероятны – 1/3.

По критерию Байеса-Лапласа предпочтительнее решение Е 3 .

Критерий Гурвица. с=0,5

Принятие решений в многоцелевых задачах

Отличительной особенностью многоцелевых задач является отсутствие одного оптимального решения.

Рассматриваются целое множество решений, которое называется множество Паретто оптимальных решений или множеством компромиссных решений.

Причем любое решение из этого множества может быть оптимальным. Без привлечения дополнительной информации об отношении предпочтения лица, принимающего решение (ЛПР), решить задачу невозможно.

Все методы делятся в зависимости от того, какая информация используется.

Все методы можно разделить на 2 класса:

методы, основанные на построении отношения предпочтения более сильного, чем отношение Паретто.

Методы, основанные на построении агрегированного критерия.

Предпочтительное большинство методов используют информацию об относительной важности критериев.

Отношение Паретто – это отношение превосходства, которое определяется следующим образом: решение считается эффективным, если не существует другого решения, не уступающему ему по всем параметрам и превосходит хотя бы по одному.

Таким образом, это бинарное отношение позволяет сравнивать и в результате получать множество оптимальных решений:

Методы выбора наилучшего решения.

Метод выделения главного критерия.

Один из критериев называется главным, на остальные накладываются ограничения. Наилучшем решением будет решение оптимизирующие (максимизирующее, минимизирующее) главный критерий с учетом ограничений на остальные критерии.

Метод последовательных уступок

Упорядочивание критериев по убыванию важности и решение выбирается по следующему алгоритму: выбирается один по важности критерий и среди текущего множества решений выбирается наилучший по данному критерию, затем назначается некоторая уступка и текущее множество решений сужается до решений, у которых оценка по текущему критерию уже наилучшего варианта не более, чем уступки. После этого, переходят к следующему по важности критерию.

Метод составного критерия

Информация об относительной важности критериев отображается в виде набора весовых коэффициентов.

Проблемы данного метода: 1) выбора весовых коэффициентов. Применяется метод анализа иерархии (метод Саати); 2) критерии должны быть приведены к одной шкале или масштабу; 3) недостатки по одному критерию можно компенсировать преимуществом по другим критериям: наложением ограничений на все критерии.

Нормативные методы

Сводятся к построению множества нормативов по каждому критерию и некоторой метрики, которая показывает степень отклонения решений от нормативов. Наилучшее решение имеет минимальное отклонение от нормативов:

Методы логического объединения критериев.

Все критерии преобразуются таким образом, что они могут принимать логические значения (истина, ложь). Истина означает, что i-я цель достигнута, а ложь – цель не достигнута. Обобщенный критерий записывается в виде логической функции и решение считается эффективным, если функция принимает значение «истина». Методы нечеткой логики позволяют выразить степень достижения цели по каждому критерию и обобщенный критерий с очень высокой точностью.

Метод ELEKTRE

Определение отношения Паретто: веса критериев. Все множество критериев разбивается на три подмножества:

- подмножество критериев, по которому вариант x>y.

И считается, что вариант x превосходит y, если значение этой функции некоторому пороговому значению. Кроме того, обходятся дополнительные специальные условия, ограничивающие возможность сравнения вариантов.

Вводится еще одна функция, которая называется индексом несогласия.

Пример:

Сформировать множество Паретто;

γ 1 =1; γ 2 =1; γ 3 =1; γ 4 =1.

Должно быть ≥ 1

Метод порядковой оптимизации.

Используется информация об относительной важности критериев. Данный метод основан на определении упорядоченности критериев по важности; нахождении порядковых отношений, которые удовлетворяют этому упорядочиванию; построении полинома по этим порядковым отношениям.

Пример: В роли ЛПР выступает покупатель автомобиля. ЛПР сформировал для себя 5 критериев:

Комфортность;

Престижность марки;

Скоростные качества;

Внешний вид авто.

Критерии 1 и 2 имеют одинаковую важность, также как и критерии 3, 4 и 5. Критерии 1 или 2 важнее критериев 3, 4 и 5. Понятие «быть лучше» для покупателя означает превосходить по первым двум критериям и по любой паре из оставшихся. Инициирующий полином в данном случае выглядит следующим образом:

Если возьмем следующее упорядочивание критериев - схема важности критериев – то на основании этого:.

Проблемы: 1) сам процесс получения информации об относительной важности критериев трудоемкий; 2) ЛПР может давать противоречивую информацию о сравнительной важности критериев; 3) оценки по критериям должны быть предоставлены в строгих шкалах.

Метод эффективен, если количество критериев небольшое. Применение данного метода не зависит от количества сравниваемых вариантов. Не требуется, чтобы критерии были одной природы и выражены в одних единицах.

Метод Подиновского

Основан на построении более сильного отношения, чем отношение Паретто. Информация об относительной важности критериев не преобразуется в числовую форму. От ЛПР получается информация о том, что некоторая группа критериев важнее или равноценно другой группе критериев. Позволяет сузить множество вариантов. Далее информация используется для упорядочивания векторов оценок решений, поле чего из нового множества векторов выбирается не доминируемое по Паретто.

Ограничения применения метода: критерии должны быть однородны.

Критерий Ходжа-Лемана привносит фактор определенной субъективности при принятии решения.

Решение принимается в условиях риска. Однако у ЛПР есть некое недоверие к распределению вероятностей состояний окружающей среды.

Поэтому ЛПР вводит некий "коэффициент доверия" l к вероятностям состояний окружающей среды (0 £ l £ 1). Чтобы сильно не рисковать, обычно таким коэффициентом берут 0,4. Этот коэффициент ещё называют уровнем оптимизма.

Показатель эффективности стратегии Аi по критерию Ходжа-Лемана находится по формуле:

#Для случая оптимизации потерь критерий будет таким:

Z = #

Таким образом, исходную матрицу необходимо дополнить справа еще тремя столбцами. В первый нужно внести значения математических ожиданий всех стратегий, умноженных на уровень оптимизма l = 0,4. Во второй нужно внести значения наименьших элементов всех строк, умноженных на уровень пессимизма 1 – l = 1 – 0,4 = 0,6 . В третий добавленный столбец внесем сумму значений первых двух добавленных столбцов:

Пример вычислений для первой строки:

0,4  (0,33 + 0,27 + 0,153 + 0,115 + 0,256) = 0,4  5,75 = 2,3

= 0,6  3 = 1,8

В нашем случае наибольший элемент 4,78 (в матрице он выделен). Таким образом, в нашем примере оптимальной стратегией будет А3, т.е. инвестор для вложения должен выбрать третий проект.

Ответ А3 .

Стараясь занять наиболее уравновешенную позицию, Гурвиц предположил оценочную функцию, которая находится где-то между точкой зрения крайнего оптимизма и крайнего пессимизма:

e ir = {Ce ij + (1- C) e ij },

где С – весовой множитель.

Правило выбора согласно критерию Гурвица, формируется следующим образом:

матрица решений дополняется столбцом, содержащим среднее взвешенное наименьшего и наибольшего результатов для каждой строки. Выбираются только те варианты, в строках которых стоят наибольшие элементы e ir этого столбца.

При С =1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”

e ir = e ij ,

т.е. мы становимся на точку зрения азартного игрока, делающего ставку на то, что «выпадет» наивыгоднейший случай.

В технических приложениях сложно выбрать весовой множитель С , т.к. трудно найти количественную характеристику для тех долей оптимизма и пессимизма, которые присутствуют при принятии решения. Поэтому чаще всего С := 1 / 2 .

Критерий Гурвица применяется в случае, когда:

о вероятностях появления состояния F j ничего не известно;

с появлением состояния F j необходимо считаться;

реализуется только малое количество решений;

допускается некоторый риск.

2О. Критерий Ходжа–Лемана.

Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра n выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае – ММ-критерий, т.е. мы ищем

e ir = {n + (1-n) e ir }, 0 £ n £ 1.

Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом:

матрица решений дополняется столбцом, составленным из средних взвешенных (с весом n º const ) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца.

При n = 1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при n = 0 становится минимаксным.

Выбор n субъективен т. к. Степень достоверности какой-либо функции распределения – дело тёмное.

Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:

F j неизвестны, но некоторые предположения о распределении вероятностей возможны;

принятое решение теоретически допускает бесконечно много реализаций;

при малых числах реализации допускается некоторый риск.

3О. Критерий Гермейера.

Этот критерий ориентирован на величину потерь, т.е. на отрицательные значения всех e ij . При этом

e ir = e ij q j .

Т.к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие e ij <0 обычно выполняется. В случае же, когда среди величин e ij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования e ij - a при подходящем образом подобранном a > 0. При этом оптимальный вариант решения зависит от а .

Правило выбора согласно критерию Гермейера формулируется следующим образом:

матрица решений дополняется ещё одним столбцом содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния F j . Выбираются те варианты в строках которых находится наибольшее значение e ij этого столбца.

В каком-то смысле критерий Гермейера обобщает ММ-критерий: в случае равномерного распределения q j = , j =, они становятся идентичными.

Условия его применимости таковы:

вероятности появления состояния F j неизвестны;

с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться;

допускается некоторый риск;

решение может реализоваться один или несколько раз.

Если функция распределения известна не очень надёжно, а числа реализации малы, то, следуя критерию Гермейера, получают, вообще говоря, неоправданно большой риск.

Экспертные оценки минимаксного метода и методов Байеса - Лапласа и Сэвиджа

Приведенные в подпараграфе 2.8.1 простейшие критерии и стратегии принятия решений (2.8.1) (2.8.5) имеют ясное и логическое объяснение мотивов, которыми руководствуются лица, принимающие решения. Далее можно перейти к рассмотрению обобщенных классических критериев принятия решений. К ним относятся минимаксный критерий, критерий Байеса - Лапласа, критерий Сэвиджа, а также другие обобщения.

Минимаксный критерий и метод

Минимаксный критерий использует оценочную функцию (2.8.1, а), соответствующую пессимистической позиции, формализуемой соотношением

Справедливо соотношение

причем Zn„„ в (2.8.8) - оценочная функция минимаксного критерия.

Правило выбора решения в соответствии с минимаксным критерием интерпретируется следующим образом. Матрица решений {ву} дополняется еще одним столбцом из наименьших результатов еГ каждой строки. При принятии решения следует выбрать такие варианты Ею, строки которых соответствуют наибольшим значениям ег этого столбца. Выбранные таким образом варианты полностью исключают риск, поскольку лицо, принимающее решение, ориентировано на пессимистическую позицию, что не позволяет получить худший результат. Вне зависимости от условий Fj результат выбора не может оказаться ниже 2.тт. Минимаксный критерий относится к числу фундаментальных, поскольку используется весьма часто. Применение минимаксного критерия оправдано в следующих ситуациях:

1) о возможности появления внешних состояний (условий) Б] ничего неизвестно (например, неизвестны вероятности появления состояний Р])щ,
2) приходится считаться с появлением различных внешних состояний Рр
3) решение реализуется только один раз;
4) необходимо исключить всякий риск (недопустимо получение результата ниже значения 2,„,„).

Критерий и метод Байеса - Лапласа

Для построения оценочной функции данного критерия используется априорная информация о вероятностях ц} появления внешних условий Ру Тем самым данная вероятностная модель учитывает каждое из возможных последствий. Пусть - вероятность появления внешнего состояния (условия) Ру Тогда критерий Байеса - Лапласа

соответствует множеству

Фактически в данном критерии в качестве оценочной функции выбирается математическое ожидание оценки, соответствующей у"-му варианту, причем усреднение происходит по множеству условий Г^.

Правило принятия решении (2.8.11)-(2.8.13) имеет вероятностную интерпретацию. При этом ситуация, в которой принимается решение, характеризуется следующими обстоятельствами:

- вероятности появления состояний (условий) известны и не зависят от времени;
- решение реализуется (теоретически) бесконечно много раз;
- для малого числа реализаций решения допускается некоторый риск.

Позиция лица, принимающего решения на основе критерия Байеса - Лапласа, является более оптимистичной, чем по минимаксному критерию.

Критерий и метод Сэвиджа

Этот критерий основывается на предварительном преобразовании матрицы системных оценок в соответствии с соотношениями

Оценочная функция имеет вид

Множество оптимальных вариантов решения определяется соотношением

Смысл критерия (2.8.16) становится ясным после анализа соотношений (2.8.14)-(2.8.17).

Величины а =(тахе, еЛ, вычисляемые в соответствии

(2.8.14), можно трактовать как максимальный дополнительный выигрыш, который достигается, если В состояний Fj вместо варианта £", выбрать другой, оптимальный для этого внешнего состояния. Величины ay =(тахву е^) можно также интерпретировать и как потери (штрафы), возникающие в состоянии Fj при замене оптимального для него варианта

Тогда величина eir определенная равенством (2.8.12), представляет собой - при интерпретации йу как потерь - максимально возможные (по всем внешним состояниям Fj) потери в случае выбора варианта Ej. Согласно соотношениям (2.8.15), (2.8.17) максимально возможные потери минимизируются за счет выбора £;.

С точки зрения матрицы {еф критерий Сэвиджа связан с риском, однако с позиции матрицы {ау) он от риска свободен, поскольку использует стратегию минимаксного критерия.

Обобщенный минимаксный критерий и метод

Этот критерий использует расширение доли вероятностно заданной неопределенности. Предположим, что для каждого из возможных внешних состояний Fj определена вероятность его появления

Введем вероятность Р, применения г"-го варианта решения и будем предполагать возможность реализации т вариантов решения. Тогда среднее значение

где Р= (/>„ ...,/>,„), д = (

В реальной ситуации вектор ц неизвестен. В этом случае, ориентируясь на наименее выгодное распределение ц состояний Fj, можно добиться максимального увеличения е(Р, д) за счет выбора наиболее удачного распределения Р вариантов решения £;. Подобная стратегия соответствует расширенному минимаксному критерию, причем в данной ситуации реализуется игровая стратегия: состояния Fj минимизируют критерий, а варианты Е, его максимизируют. Общая формулировка данного расширенного минимального критерия имеет вид

где векторы Рид определены в (2.8.18).

Таким образом, цель расширенного минимаксного критерия - нахождение наилучшего распределения вероятностей на множестве вариантов Е, когда в многократно использовавшейся ситуации ничего не известно о вероятностных состояниях ^, относительно которых предполагается "невыгодное" распределение.

Производные критерии, оценки и принятие решений

Данный класс критериев позволяет рассматривать задачи принятия решения с обобщенных позиций, причем обобщение предполагает более полный учет априорно известных факторов, а также введение новых функциональных элементов.

Следует иметь в виду, что для интерпретации критериев можно воспользоваться идеями подпараграфа 2.8.1. В соответствии с подпараграфом 2.8.1 целесообразно свести рассмотренные производные (обобщенные) критерии в табл. 2.8.

Критерий Гурвица

Оценочная функция критерия Гурвица находится между точками предельного оптимума (С = 0) и крайнего пессимизма (С = 1). Характерно, что при С = 1 критерий Гурвица превращается в минимаксный критерий (см. подпараграф 2.8.1).

Критерий Ходжа - Лемана

Критерий основан на минимаксном критерии и критерии Байеса - Лапласа, характеризуется тем, что с помощью параметра в выражает степень доверия к используемому распределению вероятностей. При V = 1 критерий переходит в критерий Байеса - Лапласа, а при V = 0 - в минимаксный критерий. Ситуация, в которой рекомендовано применение этого критерия, характеризуется следующими условиями: вероятности появления состояний Е] неизвестны, но некоторые предположения о распределениях вероятностей возможны; принятое решение теоретически допускает бесконечно много реализаций: при малых числах реализации допускается некоторый риск.

Критерий Ю. Б. Гермейера

Данный критерий ориентирован на оценочные функции, отражающие величину потерь, т.е. на отрицательные значения всех е-у матрицы оценок, применяется в хозяйственных задачах и ориентирован на цены и затраты. Смысл остальных параметров: <77 - вероятность условия Еу а ег - минимум математического ожидания затрат. В критерии Ю. Б. Гермейера допускается некоторый риск при принятии решения, а также должны быть известны вероятности Цр

Таблица 2.8.

Минимаксный критерий и метод Байеса - Лапласа

Метод позволяет лучше адаптироваться к ситуации за счет введения составных частей, логически унаследованных от других критериев (см. табл. 2.8). На первом этапе формирования критерия фиксируется опорное значение 2тт, задаваемое минимаксным критерием. Затем задается допустимый риск 5д0|| >0 и определяется множество согласия Величины £,-=£^0- ште^ё 1 характеризуют наиболее возможные потери в сравнении с е^. После этого формируется выигрышное множество /2. Множеству /] п ¡2 принадлежат варианты решений, для которых в определенных состояниях могут иметь потери по сравнению с состоянием, задаваемым минимаксным критерием, однако в других состояниях имеется, по меньшей мере, прирост выигрыша.

Таким образом, рассмотренные методы позволяют расширить классы методов, используемых для принятия решений в условиях неполной статистически заданной неопределенности на основе обработки таблиц экспертных оценок.