Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Приложение 2. Пример выполнения задания.






ЛАБОРАТОРНАЯ РАБОТА 1

Представление выборочных данных в виде статистического ряда, вычисление выборочных характеристик, графическая иллюстрация статистических рядов

Цель работы:

Ознакомиться с методикой построения статистических рядов.

Задание.

Имеется выборка из значений непрерывной случайной величины (Приложение 3, N - номер варианта). Требуется представить выборку в виде интервального ряда, построить полигон частот, гистограмму и эмпирическую функцию распределения. Найти выборочные среднее и дисперсию. Сравнить гистограмму с кривой плотности нормального распределения, положив параметры распределения (математическое ожидание и дисперсию) равными, соответственно, выборочным среднему и дисперсии. Высказать предположение о возможной нормальности распределения (или отличия распределения от нормального) генеральной совокупности.

Приложение 1. Основные понятия и соотношения.

Множество всех возможных значений случайной величины , распределенной по закону , называется генеральной совокупностью .

Множество отдельных значений случайной величины , полученных в серии из независимых экспериментов (наблюдений), называется выборочной совокупностью или выборкой объема из генеральной совокупности.

Выборка , в которой элементы упорядочены по возрастанию, называется вариационным рядом.

Совокупность пар чисел , где , - наблюдаемые, неповторяющиеся в выборке значения, а - число этих значений в выборке, называется статистическим рядом абсолютных частот. Совокупность пар чисел , где называется статистическим рядом относительных частот. Совокупность пар чисел называется статистическим рядом накопленных частот. Статистические ряды отображают в виде таблицы:

 

 

Подобного вида статистический ряд используют обычно для описания выборки из генеральной совокупности с дискретным распределением. В этом случае статистический ряд относительных частот приближенно оценивает ряд распределения дискретной случайной величины.

Ломаная, отрезки которой соединяют точки , называется полигоном частот. Для дискретной случайной величины полигон частот является оценкой многоугольника распределения.

 

Для описания выборки из совокупности с непрерывным распределением используют группированные (или интервальные) статистические ряды. Для этого интервал, в котором содержатся все элементы выборки, делится на равных (или неравных) последовательных, непересекающихся интервалов , где , , и подсчитывают частоты - число элементов выборки, попавших в -ый интервал. Число интервалов группирования определяют, например, по формуле Стерджесса: . При разбиении на интервалы следует следить за тем, чтобы частоты для всех интервалов были одного порядка, в противном случае следует изменять длины интервалов, добиваясь относительного равномерного распределения частот по интервалам. В результате получаем следующий статистический ряд:

интервал  

Здесь - середины интервалов группирования, - плотность частоты.

 
 

В качестве оценки кривой плотности непрерывного распределения используется гистограмма частот - ступенчатая фигура, состоящая из прямоугольников, опирающихся на частичные интервалы (см. рисунок). Высота -го прямоугольника полагается равной плотности частоты . Соответственно площадь каждого прямоугольника равна - относительной частоте.

Эмпирической функцией распределения, полученной по выборке , называется функция, при каждом равная:

.

есть ступенчатая функция. Эмпирическая функция распределения является оценкой функции распределения. Для генеральной совокупности с дискретным распределением для построения обычно используют все наблюдаемые точки , (рис 3).

Для генеральной совокупности с непрерывным распределением, при большом объеме выборки, для построения проще найти значения ее в точках , заданных с некоторым малым шагом, в пределах наблюдаемого , или предполагаемого интервала варьирования значений случайной величины. Затем точки с координатами можно соединить плавной линией, получив тем самым оценку кривой теоретической функции распределения.

В качестве числовых характеристик выборки используются:

1. Выборочное среднее: .

2. Выборочная дисперсия .

3. Несмещенная выборочная дисперсия .

4. Выборочные начальные и центральные моменты

, .

По статистическому ряду значения этих величин могут быть найдены по формулам:

, , ,

, .

(в случае интервального ряда данные формулы являются приближенными).

Выборочные характеристики являются приближенными значениями соответствующих числовых характеристик случайной величины .

 

Приложение 2. Пример выполнения задания.

Выборка объемом :

 

4, 81 7, 03 4, 95 0, 25 13, 00 26, 52 1, 40 3, 19 0, 07 1, 99
11, 48 15, 45 5, 17 14, 65 8, 09 0, 38 2, 34 1, 14 0, 39 1, 56
2, 58 17, 15 0, 47 1, 75 13, 74 11, 50 8, 75 1, 08 0, 51 2, 68
0, 53 9, 04 3, 82 1, 01 5, 13 6, 80 4, 52 6, 69 3, 04 9, 41
0, 61 7, 58 4, 26 0, 14 3, 60 1, 27 2, 97 8, 63 3, 46 0, 57
0, 21 20, 35 5, 96 3, 81 3, 35 1, 93 1, 70 0, 71 1, 97 4, 87
21, 17 6, 28 0, 12 6, 02 4, 92 1, 06 2, 94 10, 82 3, 57 8, 04
4, 49 5, 35 1, 07 1, 44 0, 07 1, 61 8, 54 14, 11 9, 63 7, 90
0, 74 2, 96 0, 04 5, 23 16, 01 12, 32 0, 15 1, 36 16, 36 5, 48
9, 88 5, 14 6, 81 1, 27 7, 33 10, 11 1, 88 1, 52 1, 14 5, 62

 

Построим статистический ряд, осуществив группировку данных. Находим , . Число интервалов группирования определяем по формуле Стерджесса: . Для удобства возьмем в качестве нижней границы первого интервала значение , а в качестве верхней границы последнего интервала значение , тогда, если выбрать интервалы равной длины, длина каждого интервала группирования будет равна . Подсчитывая частоты, получаем следующий ряд:

 

Интервал 0 - 4 4 - 8 8 - 12 12 - 16 16 - 20 20 - 24 24 - 28
Частота              

 

Видим, что частоты распределены по интервалам крайне неравномерно, поэтому делаем перегруппировку данных, изменяя длины интервалов, добиваясь более равномерного распределения частот по интервалам. В результате получаем следующий ряд:

 

Интервал 0 - 1, 5 1, 5 - 3 3 - 5 5 - 7 7 - 10 10 - 16 16 - 27
Середина 0, 75 2, 25     8, 5   21, 5
Частота              
Относительная частота 0, 28 0, 15 0, 15 0, 13 0, 13 0, 1 0, 06
Плотность частоты 0, 1867 0, 1000 0, 0750 0, 0650 0, 0433 0, 0250 0, 0055

 

Соответствующие полигон частот и гистограмма, построенная в Excel, приведена на рисунке.

Основные числовые характеристики выборки:

Выборочное среднее: .

Несмещенная выборочная дисперсия .

Анализируя гистограмму, видим, что распределение экспериментальных данных похоже на показательное распределение. Сравним для наглядности гистограмму с кривой плотности показательного распределения. В качестве неизвестного параметра , этого распределения возьмем оценку, полученную по методу моментов: . Вычислим значения плотности показательного распределения в точках, соответствующих серединам интервалов группирования, и сравним гистограмму с графиком плотности:

 

Интервал 0 - 1, 5 1, 5 - 3 3 - 5 5 - 7 7 - 10 10 - 16 16 - 27
Середина 0, 75 2, 25     8, 5   21, 5
Плотность частоты 0, 1867 0, 1000 0, 0750 0, 0650 0, 0433 0, 0250 0, 0055
Теоретическая плотность 0, 1605 0, 1218 0, 0882 0, 0610 0, 0385 0, 0168 0, 0035

 

Видим, что вполне возможно, что генеральная совокупность распределена по показательному закону.

Построим также эмпирическую функцию распределения (значения функции вычисляем на отрезке [0; 28] с шагом 0, 5):

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.016 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал