Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Принятие решений по критерию Байеса с возможностью проведения эксперимента
Пусть ЛПР известны вероятности различных состояний среды Если эксперимент не проводится, то в соответствии с критерием Байеса, выбирается то решение
Предположим, что у ЛПР имеется возможность проведения эксперимента (поиска дополнительной информации) с целью уточнения состояния среды, затраты на который составляют величину Эксперимент называется идеальным, если по его результатам будущее состояние среды определяется точно. Пусть эксперимент проведён и выяснено состояние среды, которое действительно состоится. Зная это состояние среды, ЛПР, конечно, будет выбирать то решение, которое обеспечивает ему максимальный выигрыш при данном состоянии среды. Если этим состоянием среды оказалось
Так как вероятность того, что среда окажется в состоянии
Математическое ожидание этого гипотетического выигрыша равно
Вычитая от
Идеальный эксперимент следует проводить, если
Перепишем неравенство (4.19) в следующем виде:
Так как
Учитывая, что
Величина Пример. Матрица выигрышей
где Вектор вероятностей состояний среды Решение. От матрицы выигрышей переходим к матрице рисков:
Определяем средние риски для каждого решения:
Так как Рассмотрим случай неидеального эксперимента, когда его результат не позволяет точно определить будущее состояние среды, а лишь приводит к одному из Пусть в результате проведённого эксперимента получен исход
где Используя апостериорные вероятности состояний среды, находим апостериорные средние выигрыши:
Оптимальная стратегия при k -ом исходе соответствует максимальному апостериорному среднему выигрышу Решение о целесообразности проведения неидеального эксперимента производится на основе выполнения неравенства:
где вероятность исходов определяется по формуле полной вероятности:
Если неравенство (4.23) выполняется, то проведение эксперимента целесообразно, в противном случае – нецелесообразно. Пример. Матрица выигрышей (в тыс. грн.) для случая неопределённости состояний среды имеет вид:
Априорные вероятности состояний среды Определить целесообразность проведения эксперимента, если он приводит к двум исходам В 1 и В 2, а условные вероятности Решение. 1. Определяем максимальный априорный средний выигрыш:
Следовательно, если эксперимент не проводить то оптимальной по критерию Байеса является решение Определяем: 1. вероятности исходов экспериментов
2. Определяем апостериорные вероятности состояний среды для каждого из исходов неидеального эксперимента. Если исход эксперимента
Если имел место исход
3. Находим максимальный средний апостериорный выигрыш для каждого из исходов
Таким образом, если бы результатом эксперимента был исход Определяем средние апостериорные выигрыши для каждого решения
Если бы в результате эксперимента получился исход Для определения целесообразности проведения неидеального эксперимента в соответствии с (4.23) рассчитываем величину:
Так как Итак, при принятии решения по критерию Байеса с возможностью проведения эксперимента ЛПР принимает вначале решение проводить ли эксперимент, а затем выбирает оптимальное решение в зависимости от результата эксперимента (если была принято решение его проводить) или на основании априорных вероятностей состояния среды (если было принято решение эксперимент не проводить). Данная многошаговая задача принятия решений может быть представлена в виде дерева игры и решаться как позиционная игра, в которой в роли второго игрока выступает среда.
|