![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Апріорної невизначеності
3.1 Основні положення статистичної теорії прийняття рішень
Розглянемо спрощену дихотомічну (двохальтернативну) модель прийняття рішень. Нехай на вході СПР (рис. 3.1.1а), яка функціонує за умов дії на неї випадкового фактора f (t), роздільно у часі відбуваються дві події А 1і А 2. За основну приймемо гіпотезу
а) б)
Рисунок 3.1.1– Дихотомічна модель прийняття рішень: а) інформаційна модель СПР; б) розбиття простору допустимих рішень на два класи Побудова оптимальної в інформаційному сенсі роздільної гіперповерхні між областями Якщо для двохальтернативного рішення відомі ймовірності
де
З урахуванням, що
Необхідною умовою мінімізації Рпом є від’ємність виразу в квадратних дужках в (3.1.2). Звідки маємо відношення правдоподібності:
Таким чином, за критичне значення критерію максимума правдоподібності слід прийняти У випадку, коли На практиці широке застосування знайшов статистичний критерій Неймана-Пірсона, який дозволяє мінімізувати вираз (3.1.1) при заданих обмеженнях на одну із помилок. Звичайно приймається
3.2. Мінімізація залишкової невизначеності за статистичними критеріями
Залишкова невизначеність після прийняття рішень характеризується умовною ентропією, яка в статистичній теорії прийняття рішень подається у вигляді функції [10]
де Відомо, що ймовірність прийняття гіпотези p (
де Функція (3.2.2) обчислюється як результат інтегрування функції щільності розподілу ймовірностей по області p ( де Після підстановки (3.2.2) і (3.2.3) у вираз (3.2.1) обчислимо його похідну по змінній роздільної гіперповерхні та прирівняємо її нулю:
Прийнявши до уваги, що загальний обсяг
що дає відношення правдоподібності:
Для вибору порогу розпізнавання
Рисунок 3.2.1– Номограма для обчислення порогу розпізнавання за критерієм Неймана-Пірсона
Оскільки при
3.3. Детерміновані теоретико-ігрові моделі прийняття рішень
Розглянемо задачу вибору із скінченої множини допустимих рішень
Таблиця 3.3.1– Таблиця платежів
Величина У випадку відсутності інформації про стан природи має місце детермінована задача прийняття рішень за умов невизначеності. Для її розв’язання існують такі три основні підходи за відповідними критеріями. Критерій максиміну. Нехай
У цьому випадку виграш називаеться максиміном, який забезпечує гарантований прибуток за будь-яких станів природи. Критерій мінімакса або втрачених можливостей. Цей критерій мінімізує програш у результаті втрачених можливостей. Тому поміняв місцями max і min у виразі (3.4.1) отримаємо критерій мінімакса:
Таким чином, мінімакс забезпечує мінімальний програш за будь-яких станів природи. Для його обчислення формується платіжна матриця – матриця втрачених можливостей, значення елементів якої є оберненими до значень відповідних елементів матриці виграшів. Критерій рівноможливих станів природи. Цей критерій як оптимальну визначає таку стратегію, для якої сума виграшів є максимальною, тобто
Приклад 3.3.1 [14].Нехай задано матрицю виграшів (табл. 3.3.2).
Таблиця 3.3.2 – Матриця виграшів
На практиці стратегії Знайдемо оптимальну стратегію за максимінним критерієм (3.3.1):
Таким чином, можна зробити висновок, що максимінною стратегією є Для визначення мінімаксної стратегії сформуємо із урахуванням табл. 3.3.2 матрицю втрачених можливостей (табл. 3.3.3). Таблиця 3.3.3 – Матриця втрачених можливостей
Для табл. 3.3.3 за критерієм (3.3.2) знайдемо мінімаксну стратегію:
Таким чином, за мінімаксним критерієм оптимальною так само є стратегія Нарешті, для табл. 3.3.2 знайдемо оптимальну стратегію за критерієм рівноможливих станів природи (3.3.3):
Бачимо, що стратегія
3.4. Прийняття рішень за умов ризику
При прийнятті рішень за умов ризику доцільно використовувати статистичну модель. Нехай відомі ймовірності
На практиці для обчислення оцінок імовірностей
Таблиця 3.4.1–Таблиця платежів
Алгоритм визначення оптимальної стратегії полягає в знаходженні взважених сум виграшів для всіх станів природи. Як розв’язок вибирають ту стратегію
Приклад 3.4.1. Нехай відомі ймовірності
Таблиця 3.4.2 – Матриця виграшів
За формулою (3.4.1) маємо: Таким чином, краще всього використовувати стратегію Для дослідження впливу значень ймовірності
Рисунок 3.4.1– Області вибору оптимальних стратегій
Як показано на рис. 3.4.1, при 0 < p < 1/9 краще використовувати стратегію
3.5 Вибір оптимальних змішаних стратегій за умов неповної невизначеності. Байесівський підхід
Знайдемо середній виграш для кажної допустимої стратегії Sl за теоремою про повну ймовірність:
Стратегія, для якої функцяя U(Sl), що визначається за формулою (3.5.1), є максимальною, називаеться байесівською. Розглянемо випадок, коли ОПР отримує деяку апріорну інформацію шляхом проведення експерименту без урахування вартості його проведення. У цьому випадку збільшення гарантованого виграшу досягається використанням не однієї стратегії, а декількох, які називаються змішаною стратегією. Приклад 3.5.1 [14]. Для отримання гарантованої середньої корисності від запланованих турпоходів турист перед кожним турпоходом дзвонить у бюро погоди, отримуючи прогностичну інформацію. У найпростішому випадку турист повинен вибрати одну з таких альтернативних стратегій: b 1 – одягнутися стосовно до теплої погоди; b 2 – одягнутися стосовно до холодної погоди. Як експерт по проведенню багатоденних турпоходів турист складає матрицю виграшів (табл. 3.5.1), де q 1 – тепла погода і q 2 – холодна погода
Таблиця 3.5.1– Матриця виграшів
За критерієм максиміну перевага віддається стратегії Тепер ускладнемо задачу. Нехай турист отримує одну із трьох відповідей: z1 – очікується тепла погода; z2 – очікується холодна погода; z3 – прогноз невизначений. При цьому за накопиченими статистичними даними відомі ймовірності кожної з відповідей для двох станів природи (табл. 3.5.2)
Таблица 3.5.2– Імовірності станів природи
Тоді задача формулюється так: яку із двох стратегій b 1 або b 2 слід вибрати залежно від одного з трьох результатів експерименту. У цьому випадку маємо 23 змішані стратегії, які наведено в таблиці 3.5.3.
Таблиця 3.5.3– Матриця змішаних стратегій
Тут стратегія S 1 є легковажною, оскільки незалежно від результату експерименту турист одягається як для теплої погоди. Стратегія S 2 – песимістична, оскільки незалежно від результату експерименту турист одягається як для холодної погоди. Прийнятними вважаються стратегії S 3 і S 4. Для формування таблиці корисностей обчислемо за даними табл. 3.5.1 і 3.5.2 для кожної із стратегій { Sl } і двох станів природи взважені суми корисностей U (q1, Sl) і U (q2, Sl):
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
У результаті отримаємо матрицю виграшів (табл. 3.5.4)
Таблиця 3.5.4 – Матриця виграшів
Виключемо з табл. 3.5.4 “погані” стратегії S 2, S 5 і S 6, які мають середні виграші меньше ніж за іншими стратегіями. Тоді замість табл. 3.5.4 отримаємо табл. 3.5.5, в якій стратегії, що залишилися, називаються допустимими.
Таблиця 3.5.5– Матриця виграшів
З табл. 3.5.5 видно, що стратегія S 7=(b 2, b 2, b 1) є максимінною, за якою треба одягнутися тепло, якщо прогнозується тепла або холодна погода, и легко, якщо прогноз невизначений. Ця стратегія гарантує середню корисність у 5, 2 у. о. на один турпохід. Для порівняння нагадаємо, що стратегія b 2 гарантує середню корисність тільки у 4 у. о. Таким чином, використання змішаної стратегії при отриманні додаткової інформації збільшує величину виграшу. 3.6. Метод Белмана за умов невизначеності
Застосування методу Беллмана для розв’язання багатокрокових задач прийняття рішень за умов невизначеності розглянемо на конкретному прикладі. Приклад 3.6.1[15].Торгівельна фірма повинна прийняти рішення про закупівлю партії товару у зовнішнього виробника з наступною перепродажею товару
Таблица 3.6.1 – Прибуток, що одержується при різних
рівнях попиту
У даному модельному прикладі прогнозується, що сумарний торгівельний щомісячний прибуток від продажу докупленого через чотири місяці товару буде декілька менше, ніж при початковій закупівлі великої партії, і складатиме 180 у. о. в місяць при високому попиті і 40 у. о. – при низькому попиті. Витрати на закупівлю великої та малої партії товару відповідно складають 1000 і 200 у.о., а витрати на можливу додаткову закупівлю товару (через чотири місяці) дорівнюють 840 у. о. Попередні маркетингові дослідження показали, що ймовірність високого попиту на даний товар дорівнює 0, 75, а низького – 0, 25. Треба рекомендувати керівництву торгівельної фірми таке вирішення проблеми, щоб забезпечити максимальний очікуваний через рік прибуток. За умов апріорної невизначеності мова може тут йти тільки про максимізацію математичного сподівання обсягу прибутку, що очікується. Якщо ситуація з торгівельною фірмою є унікальною (одиничною), тоді доцільно для формування рішення реалізовувати принцип гарантованого результату на базі максимінного критерію, що в будь-якому випадку корисно на першій стадії дослідження з метою попередньої оцінки потенційних можливостей.
Рисунок 3.6.1 – Дерево рішень
Розв’язання задачі здійснимо за методом Беллмана шляхом просуванням по розв’язуючим вершинам графа справа-наліво. Таким чином, спочатку обробляється розв’язуюча вершина 4 (рис. 3.6.2).
Рисунок 3.6.2– Обчислення прибутку, що очікується, для вершини 4 Із отриманих двох чисол 380 є найбільшим (максимізується прибуток). Цим числом відмічається вершина 4, а стрілка співпадає з напрямком
Рисунок 3.6.3– Вибір напрямку руху з вершини 4
Далі переходимо до вершини 1 (рис.3.6.4). Основний висновок полягає в тому, що за критерієм математичного сподівання доцільно з вершини 1 йти в напрямку
Рисунок 3.6.4–Обчислення прибутку, що очікується, для вершини 1 При обробленні вершини 4 формується матриця рішень (табл. 3.6.2), де: 600=180*8-840; -520=40*8-840; 400=50*8; 320=40*8. Сама матриця рішень є матрицею платежів (у ній представлено сумарний прибуток за останні вісім місяців).
Таблица 3.6.2 – Матриця рішень для вершини 4
У вершині 1 маємо матрицю рішень (платежів), представлену у вигляді табл. 3.7.3, де: 380 = 50 * 4 + 380 - 200; 280 = 40*12-200; 1400 = 200*2-1000; -280 = 60*12-1000.
Таблиця 3.6.3– Матриця рішень для вершини 1
Розв’яжемо тепер ту саму задачу, використовуючи принцип гарантованого результату. У вершині 4 так само маємо матрицю виграшів, представлену в табл. 3.6.2. За критерієм максиміну підсумовуємо, що оптимальним є рішення
Таблиця 3.6.4 –Матриця рішень для вершини 1 у випадку
гарантованого результату
За критерієм гарантованого результату кращей виявляється альтернатива Таким чином, за умови невизначеності на різних етапах багатокрокової процедури прийняття рішень метод Беллмана дозволяє знаходити оптимальні стратегії поведінки в будь-якій розв’язуючій вершині, тобто для будь-якого стану, в якому може опинитися реальна система.
3.7. Марківські моделі прийняття рішень
Розглянемо багатокрокову задачу прийняття рішень із скінченим числом станів
Елемент Визначення 3.7.1. Процес називається марківським, якщо ймовірність переходу системи в будь-який можливий стан в кожний момент Розглянемо конкретний приклад ситуації, коли вона може бути описана за допомогою апарату марківських моделей. Приклад 3.7.1[15].Деяка фірма займається розробкою програмного забезпечення для комп’ютерних систем. На початку кожного року вона розв’язує задачу заміни обладнання з метою забезпечення необхідного технологічного середовища розробки. Залежно від результатів експертної оцінки обладнення стан фірми (система S) характеризується як " добрий" (1), " задовільний" (2) і " поганий" (3), тобто система може знаходитися в одному із трьох указаних станів. Тоді матриця перехідних ймовірностей може мати вигляд:
Якщо матриця перехідних ймовірностей не змінюється, то достатньо проаналізувати весь життєвий цикл системи S. Допустимо, що залежно від станів, в яких послідовно знаходиться система, може бути обчислено прибуток фирми. Логічно допустити, що прибуток за період
Елемент Маючи матриці
Тут в матриці прибутків враховано витрати на реорганізацію та модифікацію. Наприклад, елемент Для прикладу, що розглядається, розглянемо основні моменти вибору оптимального рішення. Допустимо, що планування
Рисунок 3.7.1– Дерево рішень
Згідно із загальним алгоритмом динамічного програмування, розв’язуємо задачу з кінця, рухаючись справа- наліво по розв’язуючим вершинам. Почнемо з вершини
При виборі рішення
Число 5, 3 більше числа 4, 7, тому із вершини Далі переходимо до вершини
Вершина
Вершина Одержані числа 5, 3, 3, 1, 0, 4 характеризують один акт зміни стану і локальний прибуток, що при цьому отримується. Далі ці обчислення вже не повторюються, а значення цих локальних прибутків знадобляться в подальших розрахунках. Перейдемо тепер до початку другого року. Почнемо з вершини
Число 8, 19 більше числа 8, 03, тому вершину Для вершин
Вибираємо число 5, 61 і виділяємо стрілку 2. Далі маємо:
Для першого этапу аналогічно отримаємо:
Тепер зворотна процедура динамічного програмуваннязавершена і, рухаясь від початку дерева рішень до кінця, можна " прочитати" оптимальне рішення: числа 10, 74; 7, 92; 4, 23 означають оптимальний прибуток, що очікується, якщо відповідно система знаходилась на початку в станах 1, 2 і 3. Ці прибутки, що очікуються, досягаються, якщо ми завжди будемо вести себе " оптимально", тобто відповідно з поміченими на дереві рішень стрілками. А саме: в якому б стані не знаходилась система на початку першого року, доцільним є рішення, пов’язане з модернізацією обладнення. Те саме відноситься до початку другого року (всі виділені стрілки спрямовано " вниз"). І тільки, якщо на початку третього року ми опинимось у стані 1, нам недоцільно проводити модернізацію обладнання фірми. Таким чином, задачу, що розглядається, розв’язано. 3.8 Запитання та завдання для самопідготовки 1. Яка центральна задача статистичної теорії прийняття рішень? 2. Який алгоритм прийняття рішень за статистичним критерієм? 3. Що називається критерієм максимуму правдоподібності? 4. Який алгоритм прийняття рішень за критерієм ідеального спостерігача? 5. Який алгоритм прийняття рішень за статистичним критерієм Неймана-Пірсона? 6. Вибрати за номограмою (рис. 3.2.1) порогове значення критерію Неймана-Пірсона та його обґрунтувати. 7. Поясніть суть максимінного критерію. 8. Поясніть суть мінікаксного критерію. 9. Поясніть суть критерію рівноможливих станів природи. 10. Знайдіть оптимальну за максимінним критерієм стратегію для матриці виграшів (табл. 3.8.1):
Таблиця 3.8.1 – Матриця виграшів
11. Знайдіть оптимальну за мінімаксним критерієм стратегію для матриці втрачених можливостей, побудованої із урахуванням матриці виграшів, заданої табл. 3.8.1. 12. Знайдіть оптимальну стратегію для матриці виграшів (табл. 3.8.1) за критерієм рівно можливих станів природи. 13. Який алгоритм визначення оптимальної стратегії за умов ризику? 14. Визначити оптимальну стратегію за матрицей виграшів (табл. 3.8.2).
Таблиця 3.8.2 – Матриця виграшів
15. Побудувати графічно області вибору оптимальних стратегій залежно від імовірності 16. Яка стратегія називається байесівською? 17. Що називається змішаною стратегією? Поясніть суть використання змішаних стратегій. 18. Який процес називається марківським?
|