![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Теорема Ляпунова
Якщо Теорема Ляпунова дає підстави стверджувати, що усереднений результат достатньо великого числа вимірювань має розподіл, близький до нормального.
Генеральна сукупність і вибірка Сукупність однорідних об’єктів, які піддаються статистичному аналізу називають генеральною сукупністю. Кількість об’єктів у генеральній сукупності називають об’ємом генеральної сукупності. У процесі статистичних спостережень вивчаються ознаки (одна або кілька), притаманні об’єктам цієї сукупності. Ознаки можуть бути кількісними або якісними. Розрізняють два види статистичних спостережень — суцільне і вибіркове. При суцільному спостереженні досліджується кожен об’єкт генеральної сукупності. Однак практично такий вид досліджень використовується досить рідко. При вибірковому спостереженні з генеральної сукупності формується вибіркова сукупність (або вибірка) — обмежена множина випадково відібраних з генеральної сукупності об’єктів, для якої проводяться статистичні дослідження. Результати досліджень вибірки переносяться на генеральну сукупність. Очевидно, що для того, щоб правильно оцінювати досліджувану ознаку генеральної сукупності за вибіркою, вибірка повинна достатньо точно представляти генеральну сукупність. Кажуть, що вибірка є репрезентативною, якщо кожен елемент генеральної сукупності має однакову ймовірність потрапити до цієї вибірки.
Дискретний варіаційний ряд Нехай з генеральної сукупності зроблена вибірка, причому значення Статистичним розподілом вибірки називають перелік варіант і їх відносних частот. Ламану з вершинами в точках Позначимо через Функцію називають емпіричною функцією розподілу (або функцією розподілу за вибіркою) ознаки. Функцію розподілу генеральної сукупності називають теоретичною функцією розподілу. Відмінність між емпіричною і теоретичною функціями розподілу полягає в тому, що теоретична функція розподілу F (x) визначає імовірність події Х < x, а F* (x) — її відносну частоту. Однак на підставі закону Бернуллі можемо стверджувати, при великих п функція F* (x) практично мало відрізняється від F (x). Це дає нам змогу знаходити наближені значення числових характеристик розподілу випадкової величини (медіани, квантилей, математичного сподівання, стандартного відхилення та ін.), використовуючи емпіричну функцію розподілу. Інтервальний варіаційний ряд Якщо досліджувана ознака розподілена неперервно, то область зміни її значень розбивають на кілька однакових проміжків, які називають класами. Ширину класу визначають за формулою
де k — кількість класів. Кількість класів та їх межі вибираються так, щоб межі класів були зручними для розрахунків. Оптимальною для вибірки об’ємом 80 – 150 елементів є кількість 8 – 12 класів. Класи Гістограмою відносних частот називають функцію, яка на кожному інтервалі Точкові та інтервальні оцінки Нехай генеральна сукупність має розподіл з деяким невідомим параметром ξ. Результати експериментів для визначення цього параметра будемо розглядати як незалежні однаково розподілені випадкові величини Оцінкою статистичної характеристики ξ називається статистика, експериментальна реалізація якої приймається за невідоме значення величини ξ. Зрозуміло, що не кожна статистика може служити такою оцінкою. Оскільки результати експерименту мають випадковий характер, то будь-яка статистика є випадковою величиною. Для того, щоб статистика могла виступати оцінкою ξ, потрібно, щоб її розподіл був зосереджений достатньо близько до невідомого значення ξ. Тоді при багаторазовому застосуванні такої статистики її середнє значення буде досить доброю оцінкою значення ξ. Оцінка
Практичну цінність мають незміщені, придатні і ефективні оцінки. Як випливає із закону Бернуллі, незміщеною, придатною точковою оцінкою імовірності події є відносна частота появи цієї події. Незміщеною, придатною точковою оцінкою математичного сподівання генеральної сукупності за вибіркою є вибіркове середнє — середнє арифметичне елементів вибірки
Вибіркова дисперсія Незміщеною оцінкою дисперсії генеральної сукупності виступає величина
Однак величина Поняття про статистичну перевірку гіпотез Задачі знаходження вірогідних областей для параметрів розподілів споріднені до задач перевірки статистичних гіпотез. Статистичною гіпотезою будемо називати припущення про вид або параметри розподілу деякої ознаки генеральної сукупності. Розрізняють два види статистичних гіпотез про параметри розподілу. Гіпотези першого типу стверджують, що невідомий параметр набуває певного значення (або належить деякому проміжку значень). Гіпотеза другого типу полягає в тому, що невідомі параметри у двох (або кількох) незалежних вибірках мають однакові значення. Останнє практично означає, що серії експериментів, у яких отримані ці вибірки, здійснювались в однакових умовах. Статистична перевірка гіпотези полягає в тому, щоб на основі проведених спостережень підтвердити або відхилити цю гіпотезу. Тому поряд із даною статистичною гіпотезою, яку, як правило, називають нульовою (оскільки в більшості випадків вона стверджує, що відхилення значення досліджуваного параметра від заданого числа дорівнює нулю), розглядають альтернативну гіпотезу, котра є запереченням даної. Далі будується процедура перевірки гіпотези (критерій згоди) — правило, яке дозволяє за даними спостережень приймати гіпотезу або відхиляти її (тобто приймати альтернативну гіпотезу). Для цього вибирають статистичний критерій — випадкову величину, яка є статистикою вибірки. Розрізняють параметричні і непараметричні критерії. Якщо статистичний критерій залежить від параметрів розподілу досліджуваної величини, то його називають параметричним. Непараметричні критерії не залежать від параметрів розподілу досліджуваної величини Вважається, що розподіл критерію відомий. Множину Оскільки подія При побудові процедур перевірки гіпотез бажано добиватись мінімального рівня обох помилок, однак зниження рівня однієї з них приводять до збільшення рівня іншої. Розглянемо такий приклад. Ознаки і змінні. Шкали вимірювання ознак Ознаками будемо називати вимірювані психологічні явища. Ними можуть бути затрачений на виконання завдання час, кількість виконаних завдань, кількість допущених помилок, рівень тривожності, інтенсивність реакції, вибраний колір тощо. Змінні, що відповідають цим ознакам є випадковими величинами, оскільки наперед не відомо значень, яких вони можуть набути у конкретному спостереженні. Проведення математичної обробки результатів спостережень передбачає числовий характер їх представлення. Приписування за певними правилами числових значень об’єктам або подіям називають вимірюванням. Іншими словами, результати спостережень повинні бути виміряні за допомогою спеціальних шкал. У психологічних дослідженнях виділяють чотири типи шкал вимірювання: номінативна; порядкова (або ординальна); інтервальна шкала; шкала рівних відношень. Номінативна шкала — це шкала, елементами якої є назви об’єктів чи явищ. Наприклад, результати опитування у тесті Люшера вимірюються шкалою, елементами якої є назви кольорів. Особливим видом номінативної шкали є дихотомічна шкала, яка складається лише з двох значень. Наприклад, стать — чоловіча або жіноча; відповідь на запитання — так або ні. Як бачимо, елементи номінативної шкали не є числами. Для проведення математичної обробки результатів спостережень необхідно спочатку прокласифікувати їх, тобто визначити, скільки раз у експерименті зустрічається кожне із значень шкали. Частоти появи цих значень вже можна піддавати статистичній обробці. Порядкова шкала класифікує дані за впорядкованими класами. Якщо у номінативній шкалі не мав значення порядок запису елементів шкали, то елементи порядкової шкали утворюють послідовність класів. Для кожних двох класів порядкової шкали можна вказати, який з них більший від іншого. Порядкова шкала повинна містити не менше трьох класів, наприклад, темп реакції — повільний, середній, швидкий. Від класів порядкової шкали можна перейти до чисел, якщо кожному класу поставити у відповідність його ранг — номер у послідовності класів. Побудована таким чином шкала на жаль не відображає реальних відмінностей між класами. Так клас з рангом 3 може значно більше відрізнятись від класу з рангом 2, ніж, наприклад, клас з рангом 8 від класу з рангом 7. Але навіть виміряні за такою шкалою дані можуть дати істотну інформацію після статистичної обробки. Інтервальна шкала утворюється розбиттям області значень досліджуваної ознаки на рівні інтервали. Такою шкалою є, наприклад, шкала лінійки, шкала секундоміра, шкала динамометра, тощо. Однак вимірювання психологічних явищ фізичними одиницями не завжди є вимірюванням у психологічній інтервальній шкалі. Так відмінність на 1 с у тривалості розв’язування задачі, яку можна розв’язати за 5 с, істотно відрізняється від такої ж відмінності для задачі, яку розв’язують за 5 хв. Шкала рівних відношень — це шкала, яка класифікує об’єкти пропорційно до вираженості вимірюваної властивості. Наприклад, якщо при виборі однієї з трьох альтернатив, альтернативу А обрали 8 досліджуваних, альтернативу Б — 16 досліджуваних, а альтернативу В — 32 досліджуваних, то можемо стверджувати, що альтернативу Б вибирають удвічі частіше, ніж альтернативу А, а альтернативу В — у 4 рази частіше.
У першому випадку критерій служить для перевірки наступних гіпотез: Н 0: розподіл ознаки збігається із заданим теоретичним; Н 1: ознака розподілена за відмінним від заданого законом. Якщо називають емпіричним значенням Кількість ступенів вільності ν визначають за формулою
де k — кількість варіант, l — кількість незалежних параметрів розподілу, які визначаються за вибіркою. Якщо Критерій Колмогорова Критерій Колмогорова застосовують для перевірки узгодженості емпіричного розподілу деякої випадкової величини із заданим неперервним теоретичним розподілом, тобто для перевірки гіпотез:
Критерій ґрунтується на зіставленні нагромаджених емпіричних і теоретичних частот (кумулянт). Статистикою виступає величина
де Якщо справджується нульова гіпотеза, то для достатньо малих проміжків інтервального варіаційного ряду і для достатньо великого обсягу вибірки статистика D має граничний розподіл, який не залежить від функції F, а саме
що дозволяє визначати критичні значення
Зокрема для Якщо емпіричне значення статистики Критерій Смирнова Критерій Смирнова дозволяє на підставі двох серій незалежних спостережень
Для перевірки гіпотез використовують статистику Смирнова
де Розподіл статистики Смирнова не залежить від виду функції розподілу і є протабульованим для малих т і п. Критична область визначається нерівністю
де Перевірка гіпотези про рівність двох дисперсій Перевірку гіпотези про рівність дисперсій двох нормально розподілених генеральних сукупностей на основі вибірок з них здійснюють за допомогою критерію Фішера. Оцінками дисперсій генеральних сукупностей слугують обчислені за вибірками з них незміщені оцінки Н 0: Дисперсії нормально розподілених генеральних сукупностей рівні. Н 1: Дисперсія генеральної сукупності з більшою незміщеною оцінкою дисперсії більша від дисперсії генеральної сукупності, представленої іншою вибіркою. Статистика Фішера
де
Виявлення відмінностей у рівні досліджуваної ознаки Критерій Розенбаума Критерій Розенбаума призначений для порівняння двох вибірок за рівнем досліджуваної ознаки виміряної в порядковій або інтервальній шкалі. Критерій непараметричний. Статистичні гіпотези формулюються так. Н 0: Рівні досліджуваної ознаки у вибірках статистично не відрізняються. Н 1: У одній з вибірок рівень досліджуваної ознаки вищий, ніж в іншій. Статистика Розенбаума
де Критичні значення критерію Q наведено в таблиці 6 додатка. Критерій дозволяє констатувати наявність відмінності в рівнях досліджуваної ознаки, якщо обсяги вибірок приблизно однакові і більші десяти.
Критерій Манна-Уітні Критерій Манна-Уітні також призначений для порівняння двох вибірок за рівнем досліджуваної ознаки виміряної в порядковій або інтервальній шкалі. Критерій непараметричний. За об’єднаною вибіркою формується варіаційний ряд. Для кожного значення варіанти визначається її ранг — порядковий номер (або середнє арифметичне порядкових номерів) цієї варіанти у ряді. Для кожної вибірки обчислюється сума рангів значень, що до неї входять. Статистичні гіпотези формулюються так. Н 0: Рівні досліджуваної ознаки у вибірках статистично не відрізняються. Н 1: У одній з вибірок рівень досліджуваної ознаки вищий, ніж в іншій. Статистика Манна-Уітні обчислюється за формулою
де
Критерій Стьюдента І. Вибірки взяті з однієї генеральної сукупності У цьому випадку для дисперсій має виконуватись гіпотеза Статистика де ІІ. Вибірки взяті з різних генеральних сукупностей У цьому випадку гіпотеза про рівність дисперсій може не виконуватись. Статистика де ється, якщо В пакеті STATISTICA 6.0 порівняння середніх двох вибірок нормально розподілених ознак реалізовано в модулі Basic Statistics/Tables (рис.19). Якщо вибірки взято з однієї генеральної сукупності, то використовуємо субмодуль t-test, independent, by groups. Для двох різних генеральних сукупностей використовуємо субмодуль t-test, independent, by variable.
Критерій знаків Критерій призначений для встановлення достовірності зсуву в значеннях досліджуваної ознаки, виміряної за порядковою, інтервальною чи шкалою рівних відношень. Критерій дає змогу встановити напрям зміщення, але не дозволяє оцінити абсолютну величину цих зміщень. Статистичні гіпотези, що перевіряють за цим критерієм формулюються так. Н 0: Типовий зсув у значеннях досліджуваної ознаки в двох заданих умовах відсутній. Н 1: Типовий зсув у значеннях досліджуваної ознаки в двох заданих умовах є закономірним. Статистика G критерію обчислюється як відношення кількості зсувів нетипового напрямку до загальної кількості п наявних зсувів (нульові різниці не беруться до уваги). За умови, що нульова гіпотеза правильна, а пари спостережень незалежні, статистика G має біномний розподіл з параметрами п і
Критерій Вілкоксона Як і критерій знаків призначений для перевірки таких самих статистичних гіпотез. Однак на відміну від критерію знаків критерій Вілкоксона враховує не тільки напрям, але й інтенсивність зсувів значень досліджуваної ознаки, тому критерій є більш надійним. Статистика Т критерію Вілкоксона дорівнює сумі рангів модулів нетипових зсувів значень досліджуваної ознаки (нульові різниці не беруться до уваги). Критерій має лівосторонню критичну область. Критичні значення для рівнів значущості 0, 05 та 0, 01 наведені в таблиці 9 додатку. Обидва критерії в пакеті STATISTICA 6.0 реалізовані в модулі Nonparametrics / Comparing two dependent samples (variables). Дані тестувань необхідно вносити в окремі змінні.
|