![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Ідентифікація закону розподілу
Ідентифікація закону розподілу за експериментальними даними Ідентифікація закону розподілу. Оцінка розподілу по критеріям згоди " хі - квадрат" та Колмогорова - Смірнова. Ідентифікація закону розподілу Якщо деякі з елементів системи поводяться стохастично, то в процесі звичайного моделювання виникає проблема: як перевірити сумісність експериментальних даних з деяким теоретичним розподілом? Інакше кажучи, виникає питання: чи відповідає частота спостережуваних вибіркових значень тій частоті, з якою вони повинні б появляться при деякому імовірнісному розподілі, що відповідає певному теоретичному закону? Якщо частота подій (значень вимірюваної величини) близька до величини, що передбачається теоретично, то надалі можна будувати модель вихідних або очікуваних подій на основі теоретичного розподілу. Рис. 7.1. Гістограма для даних табл. 7.1 Зазвичай, при проведенні експерименту одразу не можна висловити розумну здогадку (гіпотезу) відносно розподілу випадкової змінної, поки не зберемо і не проаналізуємо достатню кількість об'єктивних (облікових або експериментальних) даних, що відносяться до досліджуваного експерименту. Зібрані дані зазвичай підсумовують у вигляді розподілу відносних частот (гістограми, див. лекцію 5); така гістограма приведена на рис. 7.1. Якщо маємо справу з дискретною змінною, то записуємо частоти появи кожного з її можливих значений. Якщо змінна безперервна, розбиваємо весь діапазон її значень на рівні інтервали (групи) і записуємо частоти появи кожної групи. Число груп зазвичай беруть в межах від 5 до 20 залежно від конкретних даних. Тоді відносна частота для кожної групи дорівнює частки від ділення спостережуваного числа події даної групи на загальне число подій. Таблиця 7.1 і рис. 7.1 ілюструють порядок такої обробки експериментальних даних при неперервній змінній, а таблиця. 7.2 і рис. 7.2 — при дискретній. Таблиця 7.1 Розподіл тижневої продуктивності
Закінчивши побудову гістограми, зазвичай переходять до підбору відповідного до даного випадку теоретичного закону розподілу. Перший спосіб — візуально порівняти отриману гістограму з декількома кривими теоретичних розподілів. Так, порівнюючи гістограму рис. 7.2 з теоретичними кривими, приведеними на рис. 7.3, можна бачити, що вона схожа на розподіл Пуассона. В той же час гістограма рис. 7.1 схожа з кривою нормального розподілу. Проте таке візуальне порівняння дозволяє лише передбачити, до якого теоретичного розподілу треба прагнути «підігнати» експериментальне, і ніколи не дає достатніх підстав, аби остаточно прийняти деяку гіпотезу (теоретичний розподіл). Рис. 7.2. Гістограма для відносних частот даних табл. 7.2
Рис. 7.3. Типові теоретичні криві розподілу ймовірностей Після того, як аналітично підібрано одне або декілька теоретичних розподілів (наприклад, нормальне, Пуассона, біноміальне, гамма-розподіл і т. д.), з якими, як передбачається, можна погоджувати експериментальні дані, слід визначити параметри розподілу, з тим аби піддати їх перевірці за допомогою статистичних критеріїв. Якщо передбачуваний розподіл є функцією двох параметрів, останні зазвичай удається оцінити на основі вибіркового середнього і вибіркової дисперсії. Таблиця 7.2 Розподіл відносних частот телефонних запитів за одночасовий інтервал
Коли експериментальні дані розбиті на групи, середнє і дисперсію можна обчислити за відповідними формулами
де k — число груп (інтервалів вибірки);
Таблиця 7.3 Обчислення статистичних параметрів для дискретних даних табл. 7.2
Для дискретних даних таблиці 7.2 необхідні обчислення зведено в таблицю 7.3, а для неперервних даних таблиці 7.1 — в таблицю 7.4. Спочатку було зроблено припущення, що даним таблицям. 7.2 може відповідати розподіл Пуассона. Із [1,..., 3] відомо, що в цьому розподілі середнє дорівнює дисперсії (зазвичай позначається Таблиця 7.4 Обчислення статистичних параметрів для неперервних даних табл. 7.1
У наведеному прикладі дані таблиці 7.2, що представляють число запитів, що отримуються по телефону в бюро технічної інформації, задовольняють всім цим критеріям. Якщо хочемо і далі вважати можливим розподіл Пуассона, то можна прийняти, що 6.2. Оцінка розподілу за критерієм згоди «хі - квадрат» Для статистичної оцінки гіпотези про те, що сукупність емпіричних, або вибіркових, даних трохи відрізняється від тієї, яку можна чекати при деякому теоретичному законі розподілу, розглянемо два види випробувань на відповідність зробленій гіпотезі. Одним з параметрів, що дозволяють оцінити розходження між спостережуваними і очікуваними частотами, є величина де
інтервалам. Якщо Застосовуючи метод перевірки гіпотез по критерію згоди 1. Відносні значення частот або їх значення, виражені у відсотках, брати не можна; іншими словами, необхідно користуватись даними прямих спостережень або абсолютними значеннями частот. 2. Значення спостережуваних частот для кожної групи або інтервалу мають дорівнювати 5 або більш. Якщо це не так, то суміжні групи або інтервали повинні об'єднуватися. 3. Число рівнів свободи задається вираженням Розглянемо два приклади з практичного застосування критерію ПРИКЛАД 7.1. Припустимо, що необхідно перевірити дані таблиці 7.2. на їх відповідність розподілу Пуассона при довірчому рівні 0, 95. Відомо [1, …, 3], що розподіл Пуассона виражається формулою де
У попередньому підрозділі було визначено, що для випадку, який розглядається Таблиця 7.5 Розрахункові величини
Для одержання ПРИКЛАД 7.2. Припустимо, що розглядається вибірка, одержана з генератора випадкових чисел, який видав 500 цифр, розподілених по випадковому закону. Зареєстрована частота їх появи представлена в таблиці 7.6. Якби цифри генерувалися дійсно по випадковому закону, то можна було б чекати, що кожна цифра появиться близько 50 разів. Використовуючи рівень значущості 0, 99, перевіримо, наскільки отримані результати відповідають рівномірному розподілу. Хід розрахунків ілюструється таблицею 7.6. Таблиця 7.6 Розрахунок величини
Таблична величина Оскільки
|