Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Теорема Ляпунова






Якщо — незалежні випадкові величини, що мають однаковий закон розподілу зі скінченими математичним сподіванням і дисперсією, то випадкова величина має розподіл, який наближається до нормального коли п прямує до нескінченості.

Теорема Ляпунова дає підстави стверджувати, що усереднений результат достатньо великого числа вимірювань має розподіл, близький до нормального.

 

Генеральна сукупність і вибірка

Сукупність однорідних об’єктів, які піддаються статистичному аналізу називають генеральною сукупністю. Кількість об’єктів у генеральній сукупності називають об’ємом генеральної сукупності. У процесі статистичних спостережень вивчаються ознаки (одна або кілька), притаманні об’єктам цієї сукупності. Ознаки можуть бути кількісними або якісними.

Розрізняють два види статистичних спостережень — суцільне і вибіркове. При суцільному спостереженні досліджується кожен об’єкт генеральної сукупності. Однак практично такий вид досліджень використовується досить рідко. При вибірковому спостереженні з генеральної сукупності формується вибіркова сукупність (або вибірка) — обмежена множина випадково відібраних з генеральної сукупності об’єктів, для якої проводяться статистичні дослідження. Результати досліджень вибірки переносяться на генеральну сукупність. Очевидно, що для того, щоб правильно оцінювати досліджувану ознаку генеральної сукупності за вибіркою, вибірка повинна достатньо точно представляти генеральну сукупність.

Кажуть, що вибірка є репрезентативною, якщо кожен елемент генеральної сукупності має однакову ймовірність потрапити до цієї вибірки.

 

Дискретний варіаційний ряд

Нехай з генеральної сукупності зроблена вибірка, причому значення досліджуваної ознаки зустрічалось раз, раз, раз. Число є об’ємом вибірки. Величини називають варіантами, а записану у порядку зростання їх послідовність — варіаційним рядом. Числа називають частотами варіант , а — відносними їх частотами.

Статистичним розподілом вибірки називають перелік варіант і їх відносних частот.

Ламану з вершинами в точках називають полігоном відносних частот.

Позначимо через кількість спостережень, при яких значення спостережуваної ознаки було меншим, ніж х. Величину називають нагромадженою (або кумулятивною) частотою варіанти .

Функцію

називають емпіричною функцією розподілу (або функцією розподілу за вибіркою) ознаки. Функцію розподілу генеральної сукупності називають теоретичною функцією розподілу. Відмінність між емпіричною і теоретичною функціями розподілу полягає в тому, що теоретична функція розподілу F (x) визначає імовірність події Х < x, а F* (x) — її відносну частоту. Однак на підставі закону Бер­нуллі можемо стверджувати, при великих п функція F* (x) практично мало відрізняється від F (x). Це дає нам змогу знаходити наближені значення числових характеристик розподілу випадкової величини (медіани, квантилей, математичного сподівання, стандартного відхилення та ін.), використовуючи емпіричну функцію розподілу.

Інтервальний варіаційний ряд

Якщо досліджувана ознака розподілена неперервно, то область зміни її значень розбивають на кілька однакових проміжків, які називають класами. Ширину класу визначають за формулою

, (ІІІ.2)

де k — кількість класів. Кількість класів та їх межі вибираються так, щоб межі класів були зручними для розрахунків. Оптимальною для вибірки об’ємом 80 – 150 елементів є кількість 8 – 12 класів.

Класи разом з частотами пі попадання значень у кожен клас утворюють інтервальний варіаційний ряд.

Гістограмою відносних частот називають функцію, яка на кожному інтервалі набуває значення , де — відносна частота попадання значень змінної в цей інтервал. Площа підграфіка цієї функції на кожному проміжку дорівнює відносній частоті попадання значень досліджуваної ознаки у цей проміжок, а площа всього підграфіка функції дорівнює одиниці. Тому гістограма відносних частот є емпіричною щільністю розподілу ознаки. Для побудови емпіричної функції розподілу достат­ньо сполучити відрізками точки з координатами (тут , а — відносна частота, що відповідає інтервалу ).

Точкові та інтервальні оцінки

Нехай генеральна сукупність має розподіл з деяким невідомим параметром ξ. Результати експериментів для визначення цього параметра будемо розглядати як незалежні однаково розподілені випадкові величини . Будь-яку функцію результатів експериментів будемо називати статистикою.

Оцінкою статистичної характеристики ξ називається статистика, експериментальна реалізація якої приймається за невідоме значення величини ξ.

Зрозуміло, що не кожна статистика може служити такою оцінкою. Оскільки результати експерименту мають випадковий характер, то будь-яка статистика є випадковою величиною. Для того, щоб статистика могла виступати оцінкою ξ, потрібно, щоб її розподіл був зосереджений достатньо близько до невідомого значення ξ. Тоді при багаторазовому застосуванні такої статистики її середнє значення буде досить доброю оцінкою значення ξ.

Оцінка буде придатною оцінкою параметра ξ, якщо

Оцінка буде незміщеною оцінкою параметра ξ, якщо

.Оцінка буде ефективною оцінкою параметра ξ, якщо вона має найменшу дисперсію серед усіх статистик від .

Практичну цінність мають незміщені, придатні і ефективні оцінки.

Як випливає із закону Бернуллі, незміщеною, придатною точковою оцінкою імовірності події є відносна частота появи цієї події.

Незміщеною, придатною точковою оцінкою математичного сподівання генеральної сукупності за вибіркою є вибіркове середнє — середнє арифметичне елементів вибірки

(або для згрупованої вибірки)

Вибіркова дисперсія (або для згрупованої вибірки) має математичне сподівання , яке не дорівнює дисперсії генеральної сукупності, і тому є зміщеною оцінкою дисперсії генеральної сукупності.

Незміщеною оцінкою дисперсії генеральної сукупності виступає величина

Однак величина є зміщеною оцінкою середнього квадратичного відхилення генеральної сукупності.

Поняття про статистичну перевірку гіпотез

Задачі знаходження вірогідних областей для параметрів розподілів споріднені до задач перевірки статистичних гіпотез. Статистичною гіпотезою будемо називати припущення про вид або параметри розподілу деякої ознаки генеральної сукупності.

Розрізняють два види статистичних гіпотез про параметри розподілу. Гіпотези першого типу стверджують, що невідомий параметр набуває певного значення (або належить деякому проміжку значень). Гіпотеза другого типу полягає в тому, що невідомі параметри у двох (або кількох) незалежних вибірках мають однакові значення. Останнє практично означає, що серії експериментів, у яких отримані ці вибірки, здійснювались в однакових умовах.

Статистична перевірка гіпотези полягає в тому, щоб на основі проведених спостережень підтвердити або відхилити цю гіпотезу. Тому поряд із даною статистичною гіпотезою, яку, як правило, називають нульовою (оскільки в більшості випадків вона стверджує, що відхилення значення досліджуваного параметра від заданого числа дорівнює нулю), розглядають альтернативну гіпотезу, котра є запереченням даної. Далі будується процедура перевірки гіпотези (критерій згоди) — правило, яке дозволяє за даними спостережень приймати гіпотезу або відхиляти її (тобто приймати альтернативну гіпотезу). Для цього вибирають статистичний критерій — випадкову величину, яка є статистикою вибірки. Розрізняють параметричні і непараметричні критерії. Якщо статистичний критерій залежить від параметрів розподілу досліджуваної величини, то його називають параметричним. Непараметричні критерії не залежать від параметрів розподілу досліджуваної величини Вважається, що розподіл критерію відомий. Множину значень критерію, які не суперечать нульовій гіпотезі називають областю допустимих значень, а множину решти значень — критичною областю. Точки, які відділяють область до­пустимих значень від критичної області називають критичними точками. Розрізняють лівосторонню, правосторонню (рис. 14 б) та двосторонню (рис. 14 в) критичні області.

Оскільки подія випадкова, то гіпотеза відхиляється або приймається внаслідок спостереження випадкової події. А це означає, що при при­йнят­ті рішення дослідник може допустити похибку. Помилку, яка полягає у відхиленні нульової гіпотези (прийнятті альтернативної гіпотези), коли вона правильна, називають помилкою першого роду, а помилку, яка полягає у прийнятті нульової гіпотези, коли вона хибна, — помилкою другого роду. Ймовірність a похибки першого роду називають рівнем значущості критерію, а ймовірність b похибки другого роду — його оперативною характеристикою. Величину 1 – a називають надійністю критерію, а величину 1 – b — його потужністю.

При побудові процедур перевірки гіпотез бажано добиватись мінімального рівня обох помилок, однак зниження рівня однієї з них приводять до збільшення рівня іншої. Розглянемо такий приклад.

Ознаки і змінні. Шкали вимірювання ознак

Ознаками будемо називати вимірювані психологічні явища. Ними можуть бути затрачений на виконання завдання час, кількість виконаних завдань, кількість допущених помилок, рівень тривожності, інтенсивність реакції, вибраний колір тощо.

Змінні, що відповідають цим ознакам є випадковими величинами, оскільки наперед не відомо значень, яких вони можуть набути у конкретному спостереженні. Проведення математичної обробки результатів спостережень передбачає числовий характер їх представлення. Приписування за певними правилами числових значень об’єктам або подіям називають вимірюванням. Іншими словами, результати спостережень повинні бути виміряні за допомогою спеціальних шкал.

У психологічних дослідженнях виділяють чотири типи шкал вимірювання: номінативна; порядкова (або ординальна); інтервальна шкала; шкала рівних відношень.

Номінативна шкала — це шкала, елементами якої є назви об’єктів чи явищ. Наприклад, результати опитування у тесті Люшера вимірюються шкалою, елементами якої є назви кольорів.

Особливим видом номінативної шкали є дихотомічна шкала, яка складається лише з двох значень. Наприклад, стать — чоловіча або жіноча; відповідь на запитання — так або ні.

Як бачимо, елементи номінативної шкали не є числами. Для проведення математичної обробки результатів спостережень необхідно спочатку прокласифікувати їх, тобто визначити, скільки раз у експерименті зустрічається кожне із значень шкали. Частоти появи цих значень вже можна піддавати статистичній обробці.

Порядкова шкала класифікує дані за впорядкованими класами. Якщо у номінативній шкалі не мав значення порядок запису елементів шкали, то елементи порядкової шкали утворюють послідовність класів. Для кожних двох класів порядкової шкали можна вказати, який з них більший від іншого. Порядкова шкала повинна містити не менше трьох класів, наприклад, темп реакції — повільний, середній, швидкий.

Від класів порядкової шкали можна перейти до чисел, якщо кожному класу поставити у відповідність його ранг — номер у послідовності класів. Побудована таким чином шкала на жаль не відображає реальних відмінностей між класами. Так клас з рангом 3 може значно більше відрізнятись від класу з рангом 2, ніж, наприклад, клас з рангом 8 від класу з рангом 7. Але навіть виміряні за такою шкалою дані можуть дати істотну інформацію після статистичної обробки.

Інтервальна шкала утворюється розбиттям області значень досліджуваної ознаки на рівні інтервали. Такою шкалою є, наприклад, шкала лінійки, шкала секундоміра, шкала динамометра, тощо. Однак вимірювання психологічних явищ фізичними одиницями не завжди є вимірюванням у психологічній інтервальній шкалі. Так відмінність на 1 с у тривалості розв’язування задачі, яку можна розв’язати за 5 с, істотно відрізняється від такої ж відмінності для задачі, яку розв’язують за 5 хв.

Шкала рівних відношень — це шкала, яка класифікує об’єкти пропорційно до вираженості вимірюваної властивості. Наприклад, якщо при виборі однієї з трьох альтернатив, альтернативу А обрали 8 досліджуваних, альтернативу Б — 16 досліджуваних, а альтернативу В — 32 досліджуваних, то можемо стверджувати, що альтернативу Б вибирають удвічі частіше, ніж альтернативу А, а альтернативу В — у 4 рази частіше.

критерій Пірсона

критерій Пірсона застосовується як для перевірки узгодженості емпіричного розподілу із заданим теоретичним, так і для перевірки узгодженості емпіричних розподілів. Критерій є непараметричним.

У першому випадку критерій служить для перевірки наступних гіпотез:

Н 0: розподіл ознаки збігається із заданим теоретичним;

Н 1: ознака розподілена за відмінним від заданого законом.

Якщо — емпірична частота варіанти , а , де — ймовірність , а — об’єм вибірки, то величину

називають емпіричним значенням критерію Пірсона. Критичну точку для заданого рівня значущості α і ν ступенів вільності визначають з таблиць критичних значень розподілу (таблиця 4 додатка) або в EXCEL за формулою =ХИ2ОБР(α; ν)).

Кількість ступенів вільності ν визначають за формулою

,

де k — кількість варіант, l — кількість незалежних параметрів розподілу, які визначаються за вибіркою.

Якщо для рівня значущості , то приймається гіпотеза Н 0, у випадку, коли для рівня значущості , приймається альтернативна гіпотеза Н 1.

Критерій Колмогорова

Критерій Колмогорова застосовують для перевірки узгодженості емпіричного розподілу деякої випадкової величини із заданим неперервним теоретичним розподілом, тобто для перевірки гіпотез:

розподіл ознаки збігається з даним теоретичним;

ознака розподілена за відмінним від заданого законом.

Критерій ґрунтується на зіставленні нагромаджених емпіричних і теоретичних частот (кумулянт). Статистикою виступає величина

,

де — гіпотетична функція розподілу досліджуваної випадкової величини, — емпірична функція розподілу. Критична область — правостороння. Статистика виражає максимальну розбіжність між емпіричною і теоретичною функціями розподілу, що дозволяє оцінити узгодженість розподілів поточково.

Якщо справджується нульова гіпотеза, то для достатньо малих проміжків інтервального варіаційного ряду і для достатньо великого обсягу вибірки статистика D має граничний розподіл, який не залежить від функції F, а саме

,

що дозволяє визначати критичні значення (а відповідно і ) для заданого рівня значущості з наближеного рівняння

.

Зокрема для , а для .

Якщо емпіричне значення статистики , то з надійністю приймається гіпотеза , в іншому випадку приймається альтернативна гіпотеза .

Критерій Смирнова

Критерій Смирнова дозволяє на підставі двох серій незалежних спостережень та перевірити гіпотезу про те, що результати спостережень в обох серіях отримані з випробувань над величинами з однаковою функцією розподілу (порівняти два емпіричні розподіли). Статистичні гіпотези формулюються так:

задані емпіричні розподіли збігаються;

задані емпіричні розподіли істотно відрізняються.

Для перевірки гіпотез використовують статистику Смирнова

,

де і — емпіричні функції розподілу першої і другої серій спостережень відповідно.

Розподіл статистики Смирнова не залежить від виду функції розподілу і є протабульованим для малих т і п. Критична область визначається нерівністю

,

де — квантиль розподілу статистики Смирнова, що відповідає рівню значущості . Для досить великих т і п критичне значення знаходимо із співвідношення .

Перевірка гіпотези про рівність двох дисперсій

Перевірку гіпотези про рівність дисперсій двох нормально розподілених генеральних сукупностей на основі вибірок з них здійснюють за допомогою критерію Фішера. Оцінками дисперсій генеральних сукупностей слугують обчислені за вибірками з них незміщені оцінки . В цьому випадку статистичні гіпотези формулюються так.

Н 0: Дисперсії нормально розподілених генеральних сукупностей рівні.

Н 1: Дисперсія генеральної сукупності з більшою незміщеною оцінкою дисперсії більша від дисперсії генеральної сукупності, представленої іншою вибіркою.

Статистика Фішера

,

де — більша, а — менша з незміщених оцінок дисперсій генеральних сукупностей за вибірками, при виконанні нульової гіпотези має розподіл Фішера-Снедекора з , ступенями вільності. Критичну точку правосторонньої критичної області для рівня значущості знаходять за таблицями критичних значень розподілу Фішера-Снедекора (таблиця 5 додатка) або в EXCEL за формулою =FОБР(α; k 1; k 2).

 

Виявлення відмінностей у рівні досліджуваної ознаки

Критерій Розенбаума

Критерій Розенбаума призначений для порівняння двох вибірок за рівнем досліджуваної ознаки виміряної в порядковій або інтервальній шкалі. Критерій непараметричний.

Статистичні гіпотези формулюються так.

Н 0: Рівні досліджуваної ознаки у вибірках статистично не відрізняються.

Н 1: У одній з вибірок рівень досліджуваної ознаки вищий, ніж в іншій.

Статистика Розенбаума

,

де — кількість елементів вибірки з максимальним елементом, що перевищують найбільший елемент іншої вибірки, — кількість елементів цієї вибірки, менших, ніж найменший елемент вибірки з максимальним елементом.

Критичні значення критерію Q наведено в таблиці 6 додатка. Критерій дозволяє констатувати наявність відмінності в рівнях досліджуваної ознаки, якщо обсяги вибірок приблизно однакові і більші десяти.

 

Критерій Манна-Уітні

Критерій Манна-Уітні також призначений для порівняння двох вибірок за рівнем досліджуваної ознаки виміряної в порядковій або інтервальній шкалі. Критерій непараметричний. За об’єднаною вибіркою формується варіаційний ряд. Для кожного значення варіанти визначається її ранг — порядковий номер (або середнє арифметичне порядкових номерів) цієї варіанти у ряді. Для кожної вибірки обчислюється сума рангів значень, що до неї входять.

Статистичні гіпотези формулюються так.

Н 0: Рівні досліджуваної ознаки у вибірках статистично не відрізняються.

Н 1: У одній з вибірок рівень досліджуваної ознаки вищий, ніж в іншій.

Статистика Манна-Уітні обчислюється за формулою

,

де — обсяги вибірок, — більша рангова сума, — обсяг вибірки з більшою ранговою сумою. Критерій має лівосторонню критичну область. Кри­тич­ні значення критерію U наведено в таблиці 7 додатка. Зауважимо, що для статистика має розподіл, близький до стандартного нормального.

 

Критерій Стьюдента

І. Вибірки взяті з однієї генеральної сукупності

У цьому випадку для дисперсій має виконуватись гіпотеза (перевіряємо на підставі критерію Фішера). Оцінкою дисперсії генеральної сукупності служитиме величина .

Статистика

де — вибіркове середн­є, — незміщена оцінка дисперсії, а — об’єм і -ої вибірки, має розподіл Стьюдента з ступенями вільності. Тому при перевірці гіпотези : “середні рівні досліджуваної ознаки в обох вибірках однакові” при конкуруючій гіпотезі : “середні рівні досліджуваної ознаки відрізняються” нульова гіпотеза на рівні значущості приймається, якщо (тут — квантиль рівня розподілу Стьюдента з ступенями вільності), і відхиляється в іншому випадку. При перевірці гіпотези : “середні рівні досліджуваної ознаки в обох вибірках однакові” при конкуруючій гіпотезі : “середній рівень досліджуваної ознаки більший у вибірці з більшим вибірковим середнім” нульова гіпотеза на рівні значущості приймається, якщо , і відхиляється в іншому ви­падку.

ІІ. Вибірки взяті з різних генеральних сукупностей

У цьому випадку гіпотеза про рівність дисперсій може не виконуватись. Статистика ,

де — вибіркове середн­є, — незміщена оцінка дисперсії, а — об’єм і -ої вибірки, має розподіл Стьюдента з ступенями вільності. Тому при перевірці гіпотези : “середні рівні досліджуваної ознаки в обох вибірках однакові” при конкуруючій гіпотезі : “середні рівні досліджуваної ознаки відрізняються” нульова гіпотеза на рівні значущості приймається, як­що , де — квантиль рівня розподілу Стьюдента з сту­пенями вільності, і відхиляється в іншому випадку. При перевірці гіпотези : “середні рівні досліджуваної ознаки в обох вибірках однакові” при конкуруючій гіпотезі : “середній рівень досліджуваної ознаки більший у вибірці з більшим вибірковим середнім” нульова гіпотеза на рівні значущості прийма-

ється, якщо , інакше — відхиляється.

В пакеті STATISTICA 6.0 порівняння середніх двох вибірок нормально розподілених ознак реалізовано в модулі Basic Statistics/Tables (рис.19). Якщо вибірки взято з однієї генеральної сукупності, то використовуємо субмодуль t-test, independent, by groups. Для двох різних генеральних сукупностей використовуємо субмодуль t-test, independent, by variable.

 

Критерій знаків

Критерій призначений для встановлення достовірності зсуву в значеннях досліджуваної ознаки, виміряної за порядковою, інтервальною чи шкалою рівних відношень. Критерій дає змогу встановити напрям зміщення, але не дозволяє оцінити абсолютну величину цих зміщень. Статистичні гіпотези, що перевіряють за цим критерієм формулюються так.

Н 0: Типовий зсув у значеннях досліджуваної ознаки в двох заданих умовах відсутній.

Н 1: Типовий зсув у значеннях досліджуваної ознаки в двох заданих умовах є закономірним.

Статистика G критерію обчислюється як відношення кількості зсувів нетипового напрямку до загальної кількості п наявних зсувів (нульові різниці не беруться до уваги). За умови, що нульова гіпотеза правильна, а пари спостережень незалежні, статистика G має біномний розподіл з параметрами п і . Критерій знаків лівосторонній. Його критичні значення для рівнів значущості 0, 05 та 0, 01 наведені в таблиці 8 додатку.

 

Критерій Вілкоксона

Як і критерій знаків призначений для перевірки таких самих статистичних гіпотез. Однак на відміну від критерію знаків критерій Вілкоксона враховує не тільки напрям, але й інтенсивність зсувів значень досліджуваної ознаки, тому критерій є більш надійним. Статистика Т критерію Вілкоксона дорівнює сумі рангів модулів нетипових зсувів значень досліджуваної ознаки (нульові різниці не беруться до уваги). Кри­терій має лівосторонню критичну область. Критичні значення для рівнів значущості 0, 05 та 0, 01 наведені в таблиці 9 додатку.

Обидва критерії в пакеті STATISTICA 6.0 реалізовані в модулі Nonparametrics / Comparing two dependent samples (variables). Дані тестувань необхідно вносити в окремі змінні.


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.026 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал