Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Приложение 2. Пример выполнения задания.Стр 1 из 2Следующая ⇒
ЛАБОРАТОРНАЯ РАБОТА 1 Представление выборочных данных в виде статистического ряда, вычисление выборочных характеристик, графическая иллюстрация статистических рядов Цель работы: Ознакомиться с методикой построения статистических рядов. Задание. Имеется выборка из значений непрерывной случайной величины (Приложение 3, N - номер варианта). Требуется представить выборку в виде интервального ряда, построить полигон частот, гистограмму и эмпирическую функцию распределения. Найти выборочные среднее и дисперсию. Сравнить гистограмму с кривой плотности нормального распределения, положив параметры распределения (математическое ожидание и дисперсию) равными, соответственно, выборочным среднему и дисперсии. Высказать предположение о возможной нормальности распределения (или отличия распределения от нормального) генеральной совокупности. Приложение 1. Основные понятия и соотношения. Множество всех возможных значений случайной величины , распределенной по закону , называется генеральной совокупностью . Множество отдельных значений случайной величины , полученных в серии из независимых экспериментов (наблюдений), называется выборочной совокупностью или выборкой объема из генеральной совокупности. Выборка , в которой элементы упорядочены по возрастанию, называется вариационным рядом. Совокупность пар чисел , где , - наблюдаемые, неповторяющиеся в выборке значения, а - число этих значений в выборке, называется статистическим рядом абсолютных частот. Совокупность пар чисел , где называется статистическим рядом относительных частот. Совокупность пар чисел называется статистическим рядом накопленных частот. Статистические ряды отображают в виде таблицы:
Подобного вида статистический ряд используют обычно для описания выборки из генеральной совокупности с дискретным распределением. В этом случае статистический ряд относительных частот приближенно оценивает ряд распределения дискретной случайной величины. Ломаная, отрезки которой соединяют точки , называется полигоном частот. Для дискретной случайной величины полигон частот является оценкой многоугольника распределения.
Для описания выборки из совокупности с непрерывным распределением используют группированные (или интервальные) статистические ряды. Для этого интервал, в котором содержатся все элементы выборки, делится на равных (или неравных) последовательных, непересекающихся интервалов , где , , и подсчитывают частоты - число элементов выборки, попавших в -ый интервал. Число интервалов группирования определяют, например, по формуле Стерджесса: . При разбиении на интервалы следует следить за тем, чтобы частоты для всех интервалов были одного порядка, в противном случае следует изменять длины интервалов, добиваясь относительного равномерного распределения частот по интервалам. В результате получаем следующий статистический ряд:
Здесь - середины интервалов группирования, - плотность частоты. В качестве оценки кривой плотности непрерывного распределения используется гистограмма частот - ступенчатая фигура, состоящая из прямоугольников, опирающихся на частичные интервалы (см. рисунок). Высота -го прямоугольника полагается равной плотности частоты . Соответственно площадь каждого прямоугольника равна - относительной частоте. Эмпирической функцией распределения, полученной по выборке , называется функция, при каждом равная: . есть ступенчатая функция. Эмпирическая функция распределения является оценкой функции распределения. Для генеральной совокупности с дискретным распределением для построения обычно используют все наблюдаемые точки , (рис 3). Для генеральной совокупности с непрерывным распределением, при большом объеме выборки, для построения проще найти значения ее в точках , заданных с некоторым малым шагом, в пределах наблюдаемого , или предполагаемого интервала варьирования значений случайной величины. Затем точки с координатами можно соединить плавной линией, получив тем самым оценку кривой теоретической функции распределения. В качестве числовых характеристик выборки используются: 1. Выборочное среднее: . 2. Выборочная дисперсия . 3. Несмещенная выборочная дисперсия . 4. Выборочные начальные и центральные моменты , . По статистическому ряду значения этих величин могут быть найдены по формулам: , , , , . (в случае интервального ряда данные формулы являются приближенными). Выборочные характеристики являются приближенными значениями соответствующих числовых характеристик случайной величины .
Приложение 2. Пример выполнения задания. Выборка объемом :
Построим статистический ряд, осуществив группировку данных. Находим , . Число интервалов группирования определяем по формуле Стерджесса: . Для удобства возьмем в качестве нижней границы первого интервала значение , а в качестве верхней границы последнего интервала значение , тогда, если выбрать интервалы равной длины, длина каждого интервала группирования будет равна . Подсчитывая частоты, получаем следующий ряд:
Видим, что частоты распределены по интервалам крайне неравномерно, поэтому делаем перегруппировку данных, изменяя длины интервалов, добиваясь более равномерного распределения частот по интервалам. В результате получаем следующий ряд:
Соответствующие полигон частот и гистограмма, построенная в Excel, приведена на рисунке. Основные числовые характеристики выборки: Выборочное среднее: . Несмещенная выборочная дисперсия . Анализируя гистограмму, видим, что распределение экспериментальных данных похоже на показательное распределение. Сравним для наглядности гистограмму с кривой плотности показательного распределения. В качестве неизвестного параметра , этого распределения возьмем оценку, полученную по методу моментов: . Вычислим значения плотности показательного распределения в точках, соответствующих серединам интервалов группирования, и сравним гистограмму с графиком плотности:
Видим, что вполне возможно, что генеральная совокупность распределена по показательному закону. Построим также эмпирическую функцию распределения (значения функции вычисляем на отрезке [0; 28] с шагом 0, 5):
|