Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Xi-Mx)2.
Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Величина дисперсии получается при усреднении всех квадратов отклонений: Dx=(∑ (xi-Mx)2)/N. (4.5) Следует отличать теоретическую (генеральную) дисперсию — меру изменчивости бесконечного числа измерений (в генеральной совокупности, популяции в целом) и эмпирическую, или выборочную, дисперсию — для реально измеренного множества значений признака. Выборочное значение в статистике используется для оценки дисперсии в генеральной совокупности. Выше указана формула для генеральной (теоретической) дисперсии (Dx), которая, понятно, не вычисляется. Для вычислений используется формула выборочной (эмпирической) дисперсии (Dx), отличающаяся знаменателем: Dx=(∑ (xi-Mx)2)/(N-1). (4.6) ПРИМЕР Вычислим дисперсию признака X для выборки N= 6:
? 18 0 12 Мх = 18/6 = 3; Dx = 12/(6-1) = 2, 4
Стандартное отклонение {Std. deviation) (сигма, среднеквадратическое отклонение) — положительное значение квадратного корня из дисперсии: (4.7) На практике чаще используется именно стандартное отклонение, а не дисперсия. Это связано с тем, что сигма выражает изменчивость в исходных единицах измерения признака, а дисперсия — вквадратах исходных единиц. Свойства дисперсии: 1.Если значения измеренного признака не отличаются друг от друга (равны между собой) — дисперсия равна нулю. Это соответствует отсутствию изменчивости в данных. 2.Прибавление одного и того же числа к каждому значению переменной Dx=c=Dx, так как ∑ [(xi+c)-(Mx+c)2]=∑ (xi-Mx)2. Рис. 4.1. Графики распределения частот: с разной дисперсией (D1< D2), одинаковой дисперсией (D2=D 3) и разными средними арифметическими (М2< М3) Прибавление константы к каждому значению переменной сдвигает график распределения этой переменной на эту константу (меняется среднее), но изменчивость (дисперсия) при этом остается неизменной. 3. Умножение каждого значения переменной на константу с изменяет дисперсию в с2 раз: Dx.c = Dx*c2, так как ∑ [(х, с) - (М2c)]2 = (c2∑ (x1 - Мх)2. При объединении двух выборок с одинаковой дисперсией, но с разными средними значениями дисперсия увеличивается. ПРИМЕР Если одна группа содержит значения: 1, 1, 1, 1, 1, а другая группа — значения 3, 3, 3, 3, 3, то дисперсии этих групп одинаковы и равны 0. Если же объединить эти две группы, то дисперсия будет равна не 0, а 1. Вообще говоря, справедливо утверждение: при объединении двух групп к внутригрупповой дисперсии каждой группы добавляется дисперсия, обусловленная различием между группами (их средними). И чем больше различие между средними значениями, тем больше увеличивается дисперсия объединенных групп. Стандартизация или z-преобразование данных — это перевод измерений в стандартную Z-шкалу (Z-scores) со средним Мг = 0 и Dz (или Q2)=1. Сначала для переменной, измеренной на выборке, вычисляют среднее Мх стандартное отклонение Qx. Затем все значения переменной х, пересчитываются по формуле:
(4.8)
В результате преобразованные значения (z-значения) непосредственно выражаются в единицах стандартного отклонения от среднего. Если для одной выборки несколько признаков переведены в z-значения, появляется возможность сравнения уровня выраженности разных признаков у того или иного испытуемого. Для того чтобы избавиться от неизбежных отрицательных и дробных значений, можно перейти к любой другой известной шкале: IQ (среднее 100, сигма 15); Т-оценок (среднее 50, сигма 10); 10-балльной стенов (среднее 5, 5, сигма 2) и др. Перевод в новую шкалу осуществляется путем умножения каждого г-значения на заданную сигму и прибавления среднего: St=asZi + Ms. (4.9) Асимметрия (Skewness) — степень отклонения графика распределения частот от симметричного вида относительно среднего значения. Если исходные данные переведены в z-значения, показатель асимметрии вычисляется по формуле:
As=(∑ zi3)/N. (4.10)
Рис. 4.2. Распределения частот с разными значениями асимметрии и эксцесса Для симметричного распределения асимметрия равна 0. Если чаще встречаются значения меньше среднего, то говорят о левосторонней, или положительной асимметрии (As > 0). Если же чаще встречаются значения больше среднего, то асимметрия — правосторонняя, или отрицательная (As< 0). Чем больше отклонение от нуля, тем больше асимметрия. Эксцесс (Kurtosis) — мера плосковершинности или остроконечности графика распределения измеренного признака. Если исходные данные переведены в z-значения, показатель эксцесса определяется формулой: (4.11) Островершинное распределение характеризуется положительным эксцессом (Ех> 0), а плосковершинное — отрицательным (-3 < Ех< 0). «Средневершинное» (нормальное) распределение имеет нулевой эксцесс (Ех= 0).
|