Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Показатели формы распределения
На практике приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинным распределением. Многовершинность свидетельствует о неоднородности изучаемой совокупности. При изучении распределений, отличных от нормального, возникнет необходимость количественно оценить это различие. С этой целью вводят такие характеристики, как асимметрия и коэффициент эксцесса. Для нормального распределения эти характеристики равны нулю. Поэтому, если для изучаемого распределения асимметрия и эксцесс имеют небольшие значения, то можно предположить близость этого распределения к нормальному. 1) Коэффициент асимметрии определяется по формуле: . Если =0, то ряд симметричен относительно моды. При > 0 скошенность вправо, средняя арифметическая правее моды, «длинная часть» кривой распределения расположена справа от моды. При правосторонней асимметрии . При < 0 скошенность влево, средняя арифметическая левее моды, «длинная часть» кривой распределения расположена слева от моды. При левосторонней асимметрии . Напомним, что мода – точка максимума дифференциальной функции распределения. В нашем случае: =–0, 3. Коэффициент асимметрии отрицательный, следовательно “длинная часть” кривой, полученной на основании опытных данных, расположена слева от моды и средняя арифметическая левее моды (рисунок 3). Заметим, что в нашем случае коэффициент асимметрии близок к нулю. Рисунок 3. – Левосторонняя асимметрия.
2) Коэффициент эксцесса определяется по формуле: . Если эксцесс положительный, то кривая имеет более высокую и острую вершину, чем нормальная кривая (островершинное распределение); если эксцесс отрицательный, то сравниваемая кривая имеет более низкую и " плоскую" вершину, чем нормальная кривая (плосковершинное распределение). Замечание: . Если близок к –2, то кривая двухвершинная. При кривая распадается на две островершинные кривые, что говорит о неоднородности статистического материала. В нашем случае: . Коэффициент эксцесса отрицательный, следовательно, вершина кривой ряда распределения ниже, чем у кривой нормального распределения.
Рисунок 4. – Плосковершинное распределение.
6. Точечные и интервальные оценки параметров
Задачи математической статистики практически сводятся к оценке свойств генеральной совокупности по результатам случайной выборки. Любую функцию от результатов выборочных наблюдений принято, называть статистикой (выборочной характеристикой). Статистики обычно и используются для построения статистических оценок параметров генеральной совокупности, когда точные значения этих параметров нам неизвестны. Статистику используемую как оценку параметра , называют точечной оценкой. Из точечных оценок в приложениях математической статистики наиболее часто используют среднюю арифметическую как оценку математического ожидания , выборочную дисперсию и среднее квадратическое отклонение , как оценки генеральной дисперсии и среднего квадратического отклонения . В математической статистике в зависимости от задачи статистику рассматривают либо как случайную величину, либо как число (конкретную реализацию случайной величины). Возникает вопрос, каким требованиям должны отвечать точечные оценки, чтобы их можно было считать в каком-то определенном смысле " хорошими". Эти требования характеризуют понятиями несмещенности, состоятельности и эффективности. Оценку называют несмещенной, если при любом объеме выборки n ее математическое ожидание равно оцениваемому параметру , то есть = . В случае большой выборки оценка параметра называется состоятельной, если по мере роста числа наблюдений n (то есть в случае конечной генеральной совокупности объемом N или при в случае бесконечной генеральной совокупности) она стремится к оцениваемому параметру . Несмещенная оценка параметра называется эффективной, если среди прочих несмещенных оценок того же параметра она обладает наименьшей дисперсией. Точечные оценки параметров генеральной совокупности в нашем примере: 9, 0548; 9, 115; 9, 097; 0, 89; Точечная оценка без указания степени точности и надежности малоинформативна, так как наблюдаемые значения статистики есть лишь значения случайной величины. Она может существенно отличаться от оцениваемого параметра при малом объеме выборки, что приводит к грубым ошибкам. Интервальной оценкой параметра называют такой интервал , относительно которого можно утверждать с определенной, близкой к единице вероятностью , что он содержит неизвестное значение . Величину называют доверительной вероятностью или надежностью оценки параметра , , – некоторые функции от результатов выборочных наблюдений . Разность 2 = – между верхней и нижней границами доверительного интервала называют длиной доверительного интервала, а величину – точностью оценки. Для построения интервальных оценок необходимо знать закон распределения статистики . На практике закон распределения генеральной совокупности неизвестен. В этом случае пользуются приближенным методом построения доверительных интервалов, суть которого в следующем: если считать, что распределение выборочных характеристик в больших выборках асимптотически нормалью (для дисперсии это справедливо при , а для средней арифметической при ), то доверительные интервалы строятся следующим образом . где – оцениваемый параметр; * – выборочная оценка параметра; – стандартные ошибки выборочной характеристики (главный член среднего квадратического отклонения); – найденное по таблице значений функций Лапласа , соответствующее доверительной вероятности : . Стандартные ошибки: а) выборочной средней : б) выборочной дисперсии : ; в) выборочного среднеквадратического отклонения : г) выборочного коэффициента асимметрии : д) выборочного коэффициента эксцесса : е) выборочного коэффициента вариации : ж) выборочной медианы : . В нашем примере при имеем следующие стандартные ошибки: а) выборочной средней : б) выборочной дисперсии : в) выборочного среднеквадратического отклонения : г) выборочного коэффициента асимметрии : д) выборочного коэффициента эксцесса : е) выборочного коэффициента вариации : ж) выборочной медианы : Построим доверительные интервалы для параметров генеральной совокупности нашего примера при . 1) Для математического ожидания: , 8, 879619 9, 229981. 2) Для дисперсии: , 0, 776699 0, 820985. 3) Для среднеквадратического отклонения: , 0, 769908 1, 017651. 4) Для коэффициента асимметрии: , -0, 78765 0, 172362. 5) Для коэффициента эксцесса: , -1, 25322 0, 666792. 6) Для коэффициента вариации: , 8, 489497 11, 25207. 7) Для медианы: , , 8, 87744 9, 31656.
|