Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Тема: Основы математической статистики. Ціль: Ознайомитися з поняттям математична статистика
Ціль:
Теоретичні відомості: Математична статистика — розділ математики, присвячений встановленню закономірностей випадкових явищ або процесів на підставі обробки статистичних данных—результатов спостережень або вимірювань. Найбільш важливими в прикладному плані є три задачи математичної статистики: 1. Оцінка невідомої функції розподілу або щільності вірогідності, коли по конкретних значеннях , отриманим в результаті незалежних вимірювань випадкової величини , потрібно оцінити невідому функцію розподілу величини або її щільність вірогідності , якщо — безперервна випадкова величина. 2. Оцінка невідомих параметрів. У цьої задачі передбачається, що на підставі фізичних або загальнотеоретичних міркувань можна укласти, що випадкова величина має функцію розподілу певного вигляду, залежну від декількох параметрів, значення яких невідомі. За наслідками спостереження величини потрібно оцінити значення цих параметрів. Завдання можна ставити поза зв'язком з функцією розподілу. Наприклад, потрібно оцінити: математичне очікування, дисперсію або моменти випадкової величини ; амплітуду, частоту або фазу радіоімпульсу, спостережуваного на фоні шуму; кореляційну функцію або спектральну щільність стаціонарного випадкового процесу і так далі. 3. Статистична перевірка гіпотез. Зазвичай це завдання формулюється так. Нехай на підставі деяких міркувань можна вважати, що функція розподілу досліджуваної випадкової величини є . Необхідно з'ясувати, чи сумісні дослідні дані з гіпотезою, що випадкова величина дійсно має розподіл . Задачу можна сформулювати інакше. Припустимо, спостережувані значення випадкової величини обумовлені двома або кількома різними причинами (гіпотезами). У результаті спостереження величини необхідно вирішити, з якою з гіпотез слід пов'язувати отримані значення величини . Наприклад, нехай на вхід радіоприймального пристрою надходить випадкове коливання , яке в кожен момент часу є або сумою сигналу сигнала і перешкоди (гіпотеза ), або одной перешкоди (гипотеза ). У деякий фіксований момент часу вироблено вимір величини . По отриманому числовому значенню потрібно вирішити найкращим чином, чи був присутній на вході сигнал , тобто вибрати одну з двох гіпотез: або . Початковими даними, що підлягають обробці, служать результати спостережень над випадковою величиною . Безліч всіх можливих значень випадкової величини називається генеральною сукупністю, а безліч досвідчених значень — вибірковими значеннями, число — об'ємом вибірки. Якщо відомі функція розподілу або щільність вірогідності випадкової величини , то говорять, що вибірка належить розподілу або . Розташувавши числа у зростаючому порядку, так що при , отримаємо впорядковану вибірку, звану варіаційним або статистичним рядом. По вибірці об'єму визначаються її статистичні характеристики — наближені значення відповідних імовірнісних характеристик сукупності. Чим більше , тим краще наближення. Аналогом функції розподілу випадкової величини служить статистична (емпірична) функція розподілу вибірки, яка є частотою події : (4.1) де — число членів вибірки, менших . Коли вибір здійснюється з безперервного розподілу і число вибіркових значень велике (порядка сотні), доцільно будувати гістограму, яка є статистичною апроксимацією щільності вірогідності . Для цього область експериментальних значень випадкової величини розбивають на зазвичай однакових інтервалів і обчислюють відносну щільність точок в кожному інтервалі:
, , (4.2)
де — число експериментальних точок в -м інтервалі; — відносна частота. Підраховані таким чином значення зображають графічно у вигляді ступінчастої кривої: по осі абсцис відкладають відповідні інтервали і на кожному з них як на підставі будують прямокутник висотою . Отримана ступінчаста крива називається гістограмою. Якщо необхідно апроксимувати гістограму відповідним аналітичним виразом якій-небудь теоретичній щільності вірогідності зіставляють гістограму з графіками щільності вірогідності. Великий набір щільності вірогідності дає система кривих Пірсону, що задається диференціальним рівнянням:
.
Параметри визначаються з умови збереження перших чотирьох моментів статистичного розподілу. По методу моментів параметри підбирають так, щоб перші моменти розподілу дорівнювали б відповідним статистичним моментам. Число прирівнюваних нижчих моментів визначається кількістю невідомих параметрів Щоб оцінити, наскільки добре вибраний теоретичний закон розподілу узгоджується з результатами спостережень, використовують критерії згоди, серед яких найчастіше застосовується критерій . По цьому критерію за міру розбіжності результатів спостережень і теоретичного розподілу приймають величину:
, (4.3)
де - об'єм вибірки - число інтервалів розбиття експериментальних даних - число значень в -м інтервалі -відносна частота - ймовірність попадання випадкової величини у -й інтервал. Випадкова величина незалежно від розподілу величини , при асимптотично розподілена згідно із законом з ступенями свободи, де — число параметрів теоретичного розподілу, що оцінюються за наслідками спостережень. Рекомендується наступна методика застосування критерію для оцінки розбіжності теоретичного і статистичного розподілів. 1. По формулі (4.3) підрахувати значення . 2. Визначити число мір свободи . 3. Вибрати достатньо малу (зазвичай рівну 0, 05 або 0, 01) ймовірність звану рівнем значущості. 4. За допомогою таблиці додатку III по відомих і знайти значення величини , яка визначається рівністю
(4.4)
5. Якщо значення то теоретичний розподіл вважають таким, що погано узгоджується з результатами спостережень при рівні значущості , якщо , то вважають, що вибраний теоретичний розподіл узгоджується з експериментальними даними. Властивості вибірки описуються також простішими характеристиками — вибірковими (статистичними) моментами: вибірковим середнім , вибірковою дисперсією і так далі Вибіркові середнє, дисперсія, початковий і центральний моменти -го порядку визначаються відповідно формулами:
, (4.5) , (4.6) , (4.7) . (4.8)
Если отдельные значения в ряде распределения повторяются по несколько раз, то следует учесть частоту каждого повторения. Тогда, например, формулы (4.5) и (4.6) примут вид:
(4.5а) , (4.6а)
де — значення величини у -м досвіді; — частота значення . Оцінками математичного очікування дисперсії , початкових і центральних моментів випадкової величини можуть служити відповідні вибіркові характеристики (4.5) —(4.8). При збільшенні числа спостережень за оцінку дисперсії переважно брати не статистичну дисперсію , а «виправлену» вибіркову дисперсію:
, (4.9)
яка є незміщеною оцінкою. Приклад 1. Помилки 15 вимірювань дальності до мети за допомогою радіодальномера представлено таблицею
Потрібно: 1) побудувати розподіл вибірки 2) побудувати статистичну функцію розподілу 3) визначити вибіркову середню , вибіркову дисперсію помилки вимірювання і виправлену дисперсію помилок приладу. Розв’язання. Варіаційний ряд має вигляд: —15, —15, —10, —10, —10, —5, —5, —5, —5, 6, 6, 6, 12, 12, 18. Він містить шість різних значень: —15, —10, —5, 6, 12, 18. Частоти цих значень рівні відповідно: 2, 3, 4, 3, 2, 1. 1. Розподіл вибірки представимо таблицею
2. Побудуємо статистичну функцію розподілу. Найменше значення помилки вимірювання рівно —15. Отже, при . Значення , а саме спостерігалося 2-а разу, тому при . Значення , а саме , спостерігалося 2-а разу, а спостерігалося 3-и разу, тому , при . При . При . При .
При .
Таким чином, статистична функція розподілу може бути представлена таблицею:
Графік функції : 3. Визначимо вибіркову середню і вибіркову дисперсію помилки вимірювання. Використовуючи формули (4.5а), (4.6а), (4.9) отримуємо: м (4.5а) м2 (4.6а) «Виправлена» вибіркова дисперсія:
.
Приклад 2. Протягом 24 ч реєструючий пристрій контролю кожну годину фіксує напругу мережі. Після первинної обробки даних отриманий розподіл вибірки в інтервальній формі, приведений в таблиці
Побудувати гістограму вибірки. Розв’язання. З таблиці видно, що часткові інтервали однакові =2 В. Тому, відповідно до (4.2) , = отримуємо: = , = , = , = , = .
Для побудови гістограми відкладемо по осі абсцис вказані в таблиці часткові інтервали і на кожному з них побудуємо прямокутник заввишки , . Наприклад, над інтервалом 219-221 прямокутник має висоту 0, 208. Гістограма вибірки представлена на рисунку нижче:
Завдання 1. 1. В результаті п'яти вимірювань фізичної величини X одним приладом, який не має систематичної помилки, отримані наступні результати: 92; 94; 103; 105; 106. Визначити: а) вибіркову середню вимірюваної величини; б) вибіркову і виправлену дисперсії помилок приладу. 2. З 100 транзисторів в середньому буває два бракованих. Перевірено десять партій по 100 транзисторів в кожній. Відхилення числа бракованих транзисторів від середнього приведені в таблиці:
Побудувати розподіл вибірки, емпіричну функцію розподілу і гістограму вибірки. 3. Побудувати гістограму по розподілу вибірки, представлену таблицею:
4. Вимірювальним приладом, що практично не має систематичної помилки, було проведено п'ять незалежних вимірювань, результати яких представлені в таблиці
Потрібно: 1) визначити вибіркову середню , вибіркову дисперсію помилки вимірювання і виправлену дисперсію помилок приладу. 5. Проведено чотири вимірювання дальності до нерухомої мети за допомогою радіолокатора, в результаті отримані наступні дані: 2470, 2490, 2580, 2520 м. Потрібно: 1) визначити вибіркову середню , вибіркову дисперсію помилки вимірювання і виправлену дисперсію помилок приладу. 6. Помилки 500 результатів вимірювань дальності до мети радіодалекоміром приведені в таблиці 7.
Потрібно: 1) побудувати гістограму і емпіричну функцію розподілу помилок вимірювання дальності; 2) визначити вибіркову середню , вибіркову дисперсію помилки вимірювання і виправлену дисперсію помилок приладу.
|