Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Приложение 2. Пример выполнения задания.
ЛАБОРАТОРНАЯ РАБОТА 1
Представление выборочных данных в виде статистического ряда, вычисление выборочных характеристик, графическая иллюстрация статистических рядов
Цель работы:
Ознакомиться с методикой построения статистических рядов.
Задание.
Имеется выборка из значений непрерывной случайной величины (Приложение 3, N - номер варианта). Требуется представить выборку в виде интервального ряда, построить полигон частот, гистограмму и эмпирическую функцию распределения. Найти выборочные среднее и дисперсию. Сравнить гистограмму с кривой плотности нормального распределения, положив параметры распределения (математическое ожидание и дисперсию) равными, соответственно, выборочным среднему и дисперсии. Высказать предположение о возможной нормальности распределения (или отличия распределения от нормального) генеральной совокупности.
Приложение 1. Основные понятия и соотношения.
Множество всех возможных значений случайной величины , распределенной по закону , называется генеральной совокупностью .
Множество отдельных значений случайной величины , полученных в серии из независимых экспериментов (наблюдений), называется выборочной совокупностью или выборкой объема из генеральной совокупности.
Выборка , в которой элементы упорядочены по возрастанию, называется вариационным рядом.
Совокупность пар чисел , где , - наблюдаемые, неповторяющиеся в выборке значения, а - число этих значений в выборке, называется статистическим рядом абсолютных частот. Совокупность пар чисел , где называется статистическим рядом относительных частот. Совокупность пар чисел называется статистическим рядом накопленных частот. Статистические ряды отображают в виде таблицы:
Подобного вида статистический ряд используют обычно для описания выборки из генеральной совокупности с дискретным распределением. В этом случае статистический ряд относительных частот приближенно оценивает ряд распределения дискретной случайной величины.
Ломаная, отрезки которой соединяют точки , называется полигоном частот. Для дискретной случайной величины полигон частот является оценкой многоугольника распределения.

Для описания выборки из совокупности с непрерывным распределением используют группированные (или интервальные) статистические ряды. Для этого интервал, в котором содержатся все элементы выборки, делится на равных (или неравных) последовательных, непересекающихся интервалов , где , , и подсчитывают частоты - число элементов выборки, попавших в -ый интервал. Число интервалов группирования определяют, например, по формуле Стерджесса: . При разбиении на интервалы следует следить за тем, чтобы частоты для всех интервалов были одного порядка, в противном случае следует изменять длины интервалов, добиваясь относительного равномерного распределения частот по интервалам. В результате получаем следующий статистический ряд:
Здесь - середины интервалов группирования, - плотность частоты.
В качестве оценки кривой плотности непрерывного распределения используется гистограмма частот - ступенчатая фигура, состоящая из прямоугольников, опирающихся на частичные интервалы (см. рисунок). Высота -го прямоугольника полагается равной плотности частоты . Соответственно площадь каждого прямоугольника равна - относительной частоте.
Эмпирической функцией распределения, полученной по выборке , называется функция, при каждом равная:
.
есть ступенчатая функция. Эмпирическая функция распределения является оценкой функции распределения. Для генеральной совокупности с дискретным распределением для построения обычно используют все наблюдаемые точки , (рис 3).

Для генеральной совокупности с непрерывным распределением, при большом объеме выборки, для построения проще найти значения ее в точках , заданных с некоторым малым шагом, в пределах наблюдаемого , или предполагаемого интервала варьирования значений случайной величины. Затем точки с координатами можно соединить плавной линией, получив тем самым оценку кривой теоретической функции распределения.
В качестве числовых характеристик выборки используются:
1. Выборочное среднее: .
2. Выборочная дисперсия .
3. Несмещенная выборочная дисперсия .
4. Выборочные начальные и центральные моменты
, .
По статистическому ряду значения этих величин могут быть найдены по формулам:
, , ,
, .
(в случае интервального ряда данные формулы являются приближенными).
Выборочные характеристики являются приближенными значениями соответствующих числовых характеристик случайной величины .
Приложение 2. Пример выполнения задания.
Выборка объемом :
4, 81
| 7, 03
| 4, 95
| 0, 25
| 13, 00
| 26, 52
| 1, 40
| 3, 19
| 0, 07
| 1, 99
| 11, 48
| 15, 45
| 5, 17
| 14, 65
| 8, 09
| 0, 38
| 2, 34
| 1, 14
| 0, 39
| 1, 56
| 2, 58
| 17, 15
| 0, 47
| 1, 75
| 13, 74
| 11, 50
| 8, 75
| 1, 08
| 0, 51
| 2, 68
| 0, 53
| 9, 04
| 3, 82
| 1, 01
| 5, 13
| 6, 80
| 4, 52
| 6, 69
| 3, 04
| 9, 41
| 0, 61
| 7, 58
| 4, 26
| 0, 14
| 3, 60
| 1, 27
| 2, 97
| 8, 63
| 3, 46
| 0, 57
| 0, 21
| 20, 35
| 5, 96
| 3, 81
| 3, 35
| 1, 93
| 1, 70
| 0, 71
| 1, 97
| 4, 87
| 21, 17
| 6, 28
| 0, 12
| 6, 02
| 4, 92
| 1, 06
| 2, 94
| 10, 82
| 3, 57
| 8, 04
| 4, 49
| 5, 35
| 1, 07
| 1, 44
| 0, 07
| 1, 61
| 8, 54
| 14, 11
| 9, 63
| 7, 90
| 0, 74
| 2, 96
| 0, 04
| 5, 23
| 16, 01
| 12, 32
| 0, 15
| 1, 36
| 16, 36
| 5, 48
| 9, 88
| 5, 14
| 6, 81
| 1, 27
| 7, 33
| 10, 11
| 1, 88
| 1, 52
| 1, 14
| 5, 62
|
Построим статистический ряд, осуществив группировку данных. Находим , . Число интервалов группирования определяем по формуле Стерджесса: . Для удобства возьмем в качестве нижней границы первого интервала значение , а в качестве верхней границы последнего интервала значение , тогда, если выбрать интервалы равной длины, длина каждого интервала группирования будет равна . Подсчитывая частоты, получаем следующий ряд:
Интервал
| 0 - 4
| 4 - 8
| 8 - 12
| 12 - 16
| 16 - 20
| 20 - 24
| 24 - 28
| Частота
|
|
|
|
|
|
|
|
Видим, что частоты распределены по интервалам крайне неравномерно, поэтому делаем перегруппировку данных, изменяя длины интервалов, добиваясь более равномерного распределения частот по интервалам. В результате получаем следующий ряд:
Интервал
| 0 - 1, 5
| 1, 5 - 3
| 3 - 5
| 5 - 7
| 7 - 10
| 10 - 16
| 16 - 27
| Середина
| 0, 75
| 2, 25
|
|
| 8, 5
|
| 21, 5
| Частота
|
|
|
|
|
|
|
| Относительная частота
| 0, 28
| 0, 15
| 0, 15
| 0, 13
| 0, 13
| 0, 1
| 0, 06
| Плотность
частоты
| 0, 1867
| 0, 1000
| 0, 0750
| 0, 0650
| 0, 0433
| 0, 0250
| 0, 0055
|
Соответствующие полигон частот и гистограмма, построенная в Excel, приведена на рисунке.

Основные числовые характеристики выборки:
Выборочное среднее: .
Несмещенная выборочная дисперсия .
Анализируя гистограмму, видим, что распределение экспериментальных данных похоже на показательное распределение. Сравним для наглядности гистограмму с кривой плотности показательного распределения. В качестве неизвестного параметра , этого распределения возьмем оценку, полученную по методу моментов: . Вычислим значения плотности показательного распределения в точках, соответствующих серединам интервалов группирования, и сравним гистограмму с графиком плотности:
Интервал
| 0 - 1, 5
| 1, 5 - 3
| 3 - 5
| 5 - 7
| 7 - 10
| 10 - 16
| 16 - 27
| Середина
| 0, 75
| 2, 25
|
|
| 8, 5
|
| 21, 5
| Плотность частоты
| 0, 1867
| 0, 1000
| 0, 0750
| 0, 0650
| 0, 0433
| 0, 0250
| 0, 0055
| Теоретическая плотность
| 0, 1605
| 0, 1218
| 0, 0882
| 0, 0610
| 0, 0385
| 0, 0168
| 0, 0035
|

Видим, что вполне возможно, что генеральная совокупность распределена по показательному закону.
Построим также эмпирическую функцию распределения (значения функции вычисляем на отрезке [0; 28] с шагом 0, 5):

|