Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Критерії функціональної ефективності навчання СПР
4.2.1 Ентропійний КФЕ
Для оцінки функціональної ефективності СПР широко використовуються ентропійні нформаційні критерії. Наприклад, за Шенноном такий нормований критерій має вигляд
, (4.2.1.1) де - апріорна (безумовна) ентропія:
; (4.2.1.2)
апостеріорна умовна ентропія, яка характеризує залишкову невизначеність після прийняття рішень:
, (4.2.1.3) де – апріорна ймовірність прийняття гіпотези gl; p(mm/gl) – апостеріорна ймовірність появи події mmза умови прийняття гіпотези ; М – число альтернативних гіпотез. На практиці при оцінюванні функціональної ефективності СК, що навчається, можуть мати місце такі допущення: · рішення є двоальтернативним (М =2); · оскільки здатна навчатися СК слабо формалізованим процесом функціонує за умови невизначеності, то за принципом Бернуллі-Лапласа виправдано прийняття рівноймовірних гіпотез . Тоді критерій (4.2.1.1) з урахуванням виразів (4.2.1.2) і (4.2.1.3) набирає такий частинний вигляд:
. (4.2.1.4)
При двоальтернативному рішенні (M =2) за основну беремо гіпотезу g1 про знаходження значення ознаки розпізнавання, що контролюється, в полі допусків d і як альтернативну їй - гіпотезу g2. При цьому мають місце чотири можливих результати оцінки виміру ознаки (рис. 2), які характеризуються наступними ймовірностями – точнісними характеристиками: помилка першого роду – (рис. 2а); помилка другого роду – (рис. 2б); перша достовірність– (рис. 2в) і друга достовірність– (рис. 2г), де x, z - виміряне та дійсне значення ознаки розпізнавання відповідно. Розіб’ємо множину значень ознак на області та . Область включає значення, що знаходяться в допуску , а – не в допуску. Тоді можна записати
Рисунок 2 - Можливі результати оцінки виміру ознак розпізнавання при М=2
Виразимо апостеріорні ймовірності через апріорні за формулою Байєса:
та, прийнявши p (m 1) =p (m2) = 0, 5, отримаємо:
(4.2.1.5)
Після підстановки (4.2.1.5) в (4.2.1.4) отримаємо формулу для обчислення КФЕ за Шенноном:
(4.2.1.6) 4.2.2 Інформаційна міра Кульбака
Логарифмічна статистична інформаційна міра Кульбака [7] дозволяє оцінювати диференційну інформативність ознак розпізнавання. Здобудемо робочу формулу для обчислення міри Кульбака та встановимо її зв’язок з точнісними характеристиками процесу навчання за МФСВ. Введемо логарифмічне відношення повної ймовірності правильного прийняття рішень про належність реалізацій класів і k -му контейнеру , побудованому на k -му кроці навчання СПР розпізнавати реалізації класу , до повної ймовірності помилкового прийняття рішень , яке для двоальтернативної системи оцінок рішення має такий вигляд:
де , – гіпотези про належність контейнеру реалізацій відповідно до класів і При допущенні, що , загальна міра Кульбака остаточно набуває вигляду
(4.2.2.1)
Нормовану модифікацію критерію Кульбака можна подати у вигляді , (4.2.2.2)
де – значення критерію при і для формули (4.2.2.1). Нормування критеріїв оптимізації є доцільним при порівняльному аналізі результатів досліджень і при оцінці ступеня близькості реальної СПР до потенційної. 4.2.3 Обчислення інформаційного КФЕ
Обчислювальний аспект оцінювання функціональної ефективності машинного навчання набуває важливого значення у задачах інформаційного синтезу СПР і потребує врахування специфіки як їх функціонування, так і їх призначення. Розглянемо процедуру обчислення інформаційного КФЕ в рамках алгоритму навчання за МФСВ. Оскільки інформаційний критерій є мірою різноманітності не менше ніж двох об¢ єктів, то для його обчислення потрібна навчальна матриця, яка складається із векторів-реалізацій двох класів: і Нехай клас є основним, тобто найбільш бажаним для ОПР. Тоді належність вектора-реалізації із навчальної матриці класу береться за основну гіпотезу g 1 , а неналежність – за альтернативну гіпотезу g2. Алгоритм зчитування навчальної матриці може бути побудовано двома способами. За першим способом послідовно зчитуються реалізації , а потім – реалізації . За іншим способом при кожному випробуванні обробляються реалізації обох класів. Розглянемо обчислення модифікації ентропійного інформаційного КФЕ за Шенноном для двоальтернативного рішення при рівноймовірних гіпотезах згідно з формулою (4.2.2). Оскільки інформаційний критерій є функціоналом від точнісних характеристик, то при обмеженому обсязі навчальних вибірок слід користуватися їх оцінками
; ; , (4.2.3.1) де , - кількість подій, які означають відповідно належність та неналежність реалізацій образу контейнеру , якщо дійсно ; , - кількість подій, які означають відповідно належність і неналежність реалізацій контейнеру , якщо вони насправді належать класу ; n min - мінімальний обсяг репрезентативної навчальної вибірки. Після підстановки відповідних позначень (4.2.3.1) в (4.2.1.6), отримаємо робочу формулу для обчислення ентропійного КФЕ навчання СПР розпізнаванню реалізацій класу для двоальтернативного рішення і при рівноймовірних гіпотезах: . (4.2.3.2)
Структурну схему алгоритму обчислення критерію (4.2.3.2) за паралельним способом оброблення навчальної матриці в процесі побудови у радіальному базисі оптимального контейнера класу подано на рис. 3. Тут наведено такі вхідні дані: Х 1, Х 2 - еталонні двійкові вектори класів і відповідно; – навчальна матриця, яка складається з реалізацій цих класів; N = , де NM -обсяг репрезентативної навчальної вибірки; D – радіус контейнера класу . Вихідні дані: Е – значення КФЕ; А, В, D 1, D 2- значення точнісних характеристик процессу навчання СПР: помилки першого і другого родів, Рисунок 3 – Структурна схема обчислення інформаційного КФЕ
перша і друга достовірності відповідно. За схемою, що розглядається, блок 5 обчислює при кожному випробуванні кодову відстань D (N)шляхом складання за модулем два вектора Х 1з поточним вектором-реалізацією X (N)і підрахунку кількості одиниць в одержаній сумі. При кожному непарному випробуванні визначається відстань D (N) між вектором Х 1 і реалізацією свого класу, а на кожному парному - між вектором Х 1 і реалізацією іншого класу. Обчислення коефіцієнтів К 1, К2, К 3і К 4 здійснюється за таким алгоритмом (блоки 6 – 12): а) порівняння (блок 6): якщо D (N) £ D (реалізація належить області класу ), то при непарному випробуванні обчислюється К1: = К1 +1(² своя² реалізація), а при парному - К 3: = К 3+1 (² чужа² реалізація). Визначення парності або непарності реалізацій здійснюють блоки 7 і 8, які перевіряють виконання умови N/ 2 =F, де F – ціле число. Якщо умова виконується, то випробування парне, інакше - непарне. Якщо D (N) > D (реалізація не належить області класу ), то при непарному випробуванні обчислюється коефіцієнт К2: = К2 +1(² своя² реалізація), а при парному – К 4: = К 4+1 (² чужа² реалізація); б) порівняння (блок 13): якщо N = NM, то обчислюються оцінки точнісних характеристик за (4.2.3.1), інакше обробляється наступна реалізація; в) при виконанні умови блока 15: (D 1> 0, 5 і D2> 0, 5) обчислюється інформаційний критерій, наприклад, за формулою (4.2.1.6), інакше видається повідомлення «КФЕ не визначено». Знання точнісних характеристик процесу навчання дозволяє визначати робочу область значень КФЕ. Виходячи із вимоги практичної цінності рішень, які приймаються СПР, на робочу область визначення функції інформаційного КФЕ необхідно вводити обмеження знизу. Так, для двоальтернативного рішення такими обмеженнями є: D1 > 0, 5 і D2 > 0, 5, тобто значення першої та другої достовірностей у робочій області не можуть бути менше значень відповідних помилок. Після відповідної підстановки (4.2.3.1) у (4.2.2.1) отримаємо робочу формулу для обчислення міри Кульбака:
, (4.2.3.3)
де r - число цифр у мантисі значення критерію . Зрозуміло, що залежно від величини числа r будуть змінюватися значення критерію (4.2.3.3), але це не впливає на положення глобального максимуму в робочій області визначення їх функцій.
|