Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Критерий Гурвица
(критерий взвешенного оптимизма /пессимизма) В основе этого критерия лежит гипотеза о том, что уровень пессимизма ЛПР принимает некоторое значение α: 0 ≤ α ≤ 1. Чем больше α, тем пессимистичнее настроен ЛПР. Для каждой строки xi определяется: - число аi = min f((xi, yj); - число bi = max f((xi, yj). Затем для каждого значения xi и α рассчитывается число: H(xi, α) = α * аi + (1- α)* bi и выбирается max H(xi, α) = h(α). Пример 3: Для Примера 2 найти наилучшую стратегию по критерию Гурвица, при значении α = ½ Таблица 10. Таблица 10
Очевидно, что если α = 1, то критерий Гурвица превращается в критерий Вальда. Докажем, что критерий Гурвица удовлетворяет принципу доминирования. Доказательство. Пусть стратегия xi является доминирующей. Это значит, что для всех j, 1 ≤ j ≤ n и для всех k, 1 ≤ k ≤ m, k ≠ j, выполняется неравенство: f(xi, yj) ≥ f(xk, yj). (1.34) Из этого следует, что: max f(xi, yj) ≥ max f(xk, yj). (*) Докажем выполнение неравенства (*) подробнее: max f(xi, yj) = f(xi, yp) max f(xk, yj) = f(xk, yq) f(xi, yj) ≤ f(xi, yp) f(xk, yj) ≤ f(xk, yq)
Из (1.34) следует, что f(xk, yq) ≤ f(xi, yq) ≤ f(xi, yp). Таким образом, получается bk ≤ bi. Введём обозначения: min f(xi, yj) = аi = f(xi, yl), min f(xk, yj) = ak = f(xk, yr) Из неравенства доминирования (d) следует, что f(xk, yp) ≤ f(xi, yr) аi = f(xi, yl) ≥ f(xk, yl) ≥ min f(xk, yl) = ak аi ≥ ak Так как α ≥ 0, 1- α ≥ 0, то: α * аi ≥ α * аk (1- α)* bi ≥ (1- α)* bk Выполнение условий перестановки и аддитивной постоянной достаточно очевидно. Недостаток критерия Гурвица: недостаточная обоснованность выбора параметра α (его значение основано на оценке отношения ЛПР к риску). § 2.1.11. Критерий Сэвиджа (критерий наименьших сожалений) Критерий основан на гипотезе, что ЛПР предпочитает такое решение, при реализации которого у него возникают наименьшие сожаления. Рассмотрим матричные игры, заданные Таблицей 1. Если ЛПР думает, что среда примет какое-то определенное состояние yj, он выберет стратегию, максимизирующую его выигрыш при данном состоянии среды yj, Обозначим соответствующую стратегию xl, тогда очевидно, что для всех стратегий xi справедливо неравенство f(xl, yj) ≥ f(xi, yj), другими словами f(xl, yj) – наибольший элемент в столбце j. Следовательно, для любого столбца j и любой строки i разность rij= f(xl, yj)- f(xi, yj) является неотрицательным числом и показывает потерю выигрыша ЛПР, если он выберет стратегию xi, а среда примет состояние yj. Итак, критерий Сэвиджа даёт следующий алгоритм выбора наилучшего решения: 1) для всех yj находят наилучшее решение для данного состояния: сj = max f(xi, yj) 2) для каждого исхода xi для всех yj находят значение потерь или сожалений: rij = сj - f(xi, yj) 3) получают матрицу потерь: R = || rij || 4) для каждой альтернативы находят наибольшее сожаление: Si = max rij 5) решаем задачу нахождения хk: Sk ≤ Si minmax rij Пример: Найти решение оптимальное по критерию Сэвиджа для матрицы Таблица 11: Таблица 11
1-1 6-3 8-2 7-4 9-5 cij = 1-0 6-6 8-8 7-7 9-9
0 3 6 3 4 6 cij = 1 0 0 0 0 1
max cij = 6 – наибольшее сожаление. Можно показать, что критерий Сэвиджа удовлетворяет принципу доминирования, инвариантности при перестановке, инвариантности при добавлении аддитивной постоянной. Критерий Сэвиджа отличается от критерия Вальда тем, что для критерия Сэвиджа реализуется принцип minmax для матрицы потерь, а для критерия Вальда - maxmin для матрицы выигрышей.
|