Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Оценивание, проверка статистических гипотез. Методические указания.
I. Из генеральной совокупности X сделана выборка объема n = 200. Требуется на основании этой выборки сделать аргументированное заключение о законе распределения генеральной совокупности и её основных числовых характеристиках. Для этого необходимо:
а) найти статистический ряд с числом интервалов, равным, например, 12;
б) построить гистограмму;
в) найти статистическую функцию распределения и построить ее график;
г) найти точечные оценки математического ожидания и дисперсии;
д) найти доверительный интервал для математического ожидания с заданной надёжностью (доверительной вероятностью);
е) на основании критерия согласия (Пирсона) проверить гипотезу о нормальном законе распределения генеральной совокупности.
II. По данным таблицы - группированной выборки двумерного вектора (X, Y), требуется найти выборочное уравнение прямой – линии линейной регрессии Y на X.
Каждому студенту преподаватель выдает для обработки выборку объема
n = 200 из таблицы нормально распределенных случайных чисел и группированную выборку двумерного вектора в виде таблицы.
Рассмотрим каждый этап выполнения работы.
1. Составление статистического ряда, гистограммы и нахождение точечных оценок математического ожидания и дисперсии.
В заданной выборке находим наименьший а и наибольший b элементы. Частное округляем до десятых, и полученное число берем в качестве шага разбиения h. Вводим отрезок , длина которого 12 h, причем числа и подобраны так, чтобы ; и, кроме того, чтобы и имели не более двух знаков после запятой для простоты дальнейших вычислений.
Отрезок разбиваем точкам , x 1, x 2, …, x 12 = , на 12 равных частичных интервалов затем определяем частоты ni, то есть число элементов выборки, попавших в каждый из частичных интервалов Δ i и относительные частоты , i= 1, …, 12.
Примечание. Если некоторые элементы выборки не попали на отрезок , то их условимся относить к ближайшему крайнему интервалу. Числа, совпадающие с границами частичных интервалов, условимся относить к левому интервалу. В качестве членов статистического ряда берем числа, являющиеся серединами частичных интервалов: 
Результаты оформляются в виде таблицы (табл. 1).
Таблица 1
Номера интервалов
|
|
|
|
…
|
| Примечания
| Границы
Интервалов
|
|
|
|
…
|
|
|
|
|
|
|
…
|
|
|
|
|
|
|
…
|
|
|
|
|
|
|
…
|
|
|
Пример. Пусть нам дана следующая выборка
-0, 669
0, 392
-0, 337
0, 369
-1.694
| 0, 035
0, 106
0, 199
-1, 990
0, 710
| -2, 077
1, 430
-0, 160
-1, 190
-0, 655
| 1, 077
-0, 204
0, 625
0, 666
-0, 546
| 0, 525
-0, 326
-0, 891
-1, 614
1, 654
| -0, 154
0, 825
-1, 464
0, 082
0, 134
| -0, 537
1, 214
1, 353
-0, 184
-0, 529
| -1, 036
0, 091
0, 466
-1, 324
-0, 915
| 0, 882
-0, 032
1, 000
0, 741
-0, 898
| -0, 402
-1, 264
1, 511
-0, 264
0, 799
| 0, 985
-1, 063
0, 033
0, 597
-1.601
| 0, 340
-0, 594
-1, 527
0, 362
-0, 570
| 0, 276
-1, 526
1, 422
-3, 760
0, 133
| 0, 911
-0, 787
0, 308
1, 159
-0, 660
| -0, 170
0, 873
0, 845
0, 874
1, 485
| -0, 551
-0, 405
-0, 151
-0, 794
0, 682
| -0, 036
1, 469
1, 642
-0, 358
0, 104
| 0, 679
-0, 318
0, 033
0, 162
1, 215
| -0, 432
0, 922
-0, 838
0, 064
0, 686
| 0, 678
0, 522
-0, 872
1, 594
0, 676
| -0266
0, 901
-1, 433
1, 327
-0, 248
| -1, 309
1, 531
-1, 008
0, 703
0, 788
| 0, 597
-0, 889
-0, 990
-1, 724
0, 577
| 0, 989
-1, 019
0, 090
-0, 709
0, 122
| 0, 934
0, 084
0, 940
-1, 100
-0, 536
| 1, 079
1, 531
0, 207
-1, 346
0, 293
| -0, 999
0, 638
-2, 243
0, 183
-0, 126
| 0, 015
1, 297
-0, 039
-0, 163
1, 627
| -0, 094
-0, 139
0, 276
1, 212
0, 658
| -1, 920
-0, 157
-0, 551
-0, 452
1, 348
| -0, 401
0, 344
0, 441
0, 824
1, 385
| -0, 679
0, 324
-0, 372
0, 040
1, 320
| 0, 921
0, 686
-1, 336
-1, 734
-0, 509
| 0, 476
-1, 487
0, 062
0, 261
-0, 381
| 1, 121
-0, 136
1, 506
0, 054
-1, 671
| -0, 864
0, 803
-0, 315
-0, 379
-0, 524
| -0, 656
-0, 745
1, 207
-0, 961
1, 298
| -0, 220
0, 932
0, 838
-2, 716
-1, 248
| -1, 566
-0, 833
-0, 304
0, 823
0, 346
| -0, 144
-0, 946
0, 128
-0, 112
-0, 805
|
| |  |
Составляем статистический ряд с 12 интервалами. Наименьший элемент выборки a = -3, 760, наибольший b = 1, 654. Частное = = 0, 451. Округляя, получаем h= 0, 5.
12 h= 12 . 0, 5 = 6. Поэтому удобно взять 
Составляем табл.2.
Построим гистограмму (рис. 1). Гистограмма представляет собой ступенчатую фигуру, составленную из прямоугольников, основания которых - частичные интервалыΔ i = ; расположенные на оси абсцисс, высоты пропорциональны, а площади равны соответствующим частотам (см. пособие с. 122-126). В нашем примере все эти данные берем из таблицы 2.
Гистограмма Рис. 1
Далее строим эмпирическую функцию распределения (см. пособие с. 86-89). Она имеет вид где - число элементов выборки, меньших х; здесь х - любое вещественное число. График эмпирической функции распределения представ-ляет собой ступенчатую линию, определенную на всей числовой оси (рис.2). Значения этой функции заключены в промежутке [0, 1]. Из таблицы 2 находим

Отсюда график эмпирической функции распределения имеет вид
График эмпирической функции распределения
рис.2
Замечание. Для наглядности, при построении гистограммы и эмпирической функции распределения масштаб по оси абсцисс и оси ординат может быть выбран различным.
Найдем точечные оценки математического ожидания и дисперсии. В качест-ве таких оценок выбирают среднее выборочное значение и выбо-рочную дисперсию , где (см. пособие с.96-99).
Результаты заносим в таблицу вида 3.
Таблица 3
Номер интервала
|
|
|
| ...
|
| Некоторые результаты
|
|
|
|
| ...
|
|
|
|
|
|
| ...
|
|
|
|
|
|
| ...
|
|
|
|
|
|
| ...
|
|
| Таблица 3 строится по данным табл.2, затем вычисляются и S 2. В нашем примере результаты приведены в табл.4, после ее создания найдены и S 2.
2. Построение доверительного интервала.
Интервал называется доверительным интервалом для неизвестного параметра θ, если, с заданной доверительной вероятностью g (надежностью) можно утверждать, что неизвестный параметр находится внутри этого интервала (накрывается интервалом). В данной работе будем искать доверительный интервал для математического ожидания m с заданной доверительной вероят-ностью g = 0, 95 (см. пособие с. 108-109).
Ввиду большого объема выборки доверительный интервал имеет вид . Параметр t определяется из равенства
,
где , .
Замечание. Для определения t при использовании функции Лапласа
будем иметь следующее уравнение .
Таблица 4
Номер интер-вала
|
|
|
|
|
|
|
|
|
|
|
|
| Неко-торые результаты
|
| -3, 75
| -3, 25
| -2, 75
| -2, 25
| -1, 75
| -1, 25
| -0, 75
| -0, 25
| 0, 25
| 0, 75
| 1, 25
| 1, 75
|
|
| 0, 005
|
| 0, 005
| 0, 01
| 0, 055
| 0, 08
| 0, 17
| 0, 17
| 0, 185
| 0, 19
| 0, 09
| 0, 040
|
|
| -0, 019
|
| -0, 014
| -0, 023
| -0, 096
| -0, 1
| -0, 128
| -0, 043
| 0, 046
| 0, 143
| 0, 113
| 0, 07
| =
- 0, 052
|
| 0, 070
|
| 0, 038
| 0, 051
| 0, 168
| 1/8
| 0, 096
| 0, 011
| 0, 012
| 0, 107
| 0, 141
| 0, 123
| =
0, 942
|
= 0, 052; S 2 = = 0, 942 - 0, 003 = 0, 939
Округляя полученные результаты, принимаем = 0, 05; S 2 = 0, 94.
Для рассматриваемого примера будем иметь при g = 0, 95, 0, 975,
откуда t =1, 95, поэтому в нашем примере имеем
, 
Таким образом, доверительный интервал для математического ожидания имеет вид .
3. Проверка статистических гипотез.
Проверим гипотезу о том, что генеральная совокупность, из которой произ-ведена выборка, имеет нормальный закон распределения (такое предположение может быть сделано по виду гистограммы). Применим критерий согласия (Пирсона). Так как математическое ожидание m и дисперсия генеральной совокупности нам неизвестны, то вместо них возьмем ихвыборочные характеристики: выборочное среднее и выборочную дисперсию S 2.
Проверка гипотезы сводится к следующему алгоритму.
Объединим в один интервал интервалы с малыми частотами так, чтобы в каждом из интервалов было не менее 6-8 элементов выборки. Обозначим полученное число интервалов буквой k ( ). Вычислим статистику
,
где n i - число элементов выборки в каждом из k интервалов; pi – теоретичес-кая вероятность попадания случайной величины в i -й интервал, которая опре-деляется по формуле

где вместо m берем , а вместо = S 2, т. е. .
Устанавливаем число степеней свободы r, которое для нормального закона вычисляем по формуле r = k- 3. Назначаем уровень значимости = 0, 05.
Для заданного уровня значимости р и найденного числа степеней свободы r по таблицам -распределения Пирсона находим значение и сравниваем между собой это значение и вычисленное значение статистики . Если окажется, что < , то гипотеза о нормальном распределении не отвергается, то есть экспериментальные данные не противоречат гипотезе о нормальном распределении генеральной совокупности (см. пособие с. 126-129).
Замечание. При вычислении теоретических вероятностей крайние интервалы и заменяются интервалами и .
Применим критерий к рассматриваемому примеру при уровне значимости p = 0, 05. Результаты вычислений помещены в таблице 5. Из этой таблицы имеем = 209, 16; = 209, 16 - 200 = 9, 16. По таблице -распределения находим: = 11, 07. Так как полученное нами значение = 9, 16 < 11, 07, то ги-потеза о нормальном распределении генеральной совокупности не отвергается.
Тема 2
|