Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Xi-Mx)2.






Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Величина дисперсии получается при усреднении всех квадратов отклонений:

Dx=(∑ (xi-Mx)2)/N. (4.5)

Следует отличать теоретическую (генеральную) дисперсию — меру измен­чивости бесконечного числа измерений (в генеральной совокупности, попу­ляции в целом) и эмпирическую, или выборочную, дисперсию — для реально измеренного множества значений признака. Выборочное значение в стати­стике используется для оценки дисперсии в генеральной совокупности. Выше указана формула для генеральной (теоретической) дисперсии (Dx), которая, понятно, не вычисляется. Для вычислений используется формула выбороч­ной (эмпирической) дисперсии (Dx), отличающаяся знаменателем:

Dx=(∑ (xi-Mx)2)/(N-1). (4.6)

ПРИМЕР

Вычислим дисперсию признака X для выборки N= 6:

 

 

Хi (Xi-Mx) iх)2
    4-3  
    2-3  
    4-3  
    1-3  
    5-3  
    2-3  

? 18 0 12

Мх = 18/6 = 3; Dx = 12/(6-1) = 2, 4

 

Стандартное отклонение {Std. deviation) (сигма, среднеквадратическое от­клонение) — положительное значение квадратного корня из дисперсии:


(4.7)


На практике чаще используется именно стандартное отклонение, а не дис­персия. Это связано с тем, что сигма выражает изменчивость в исходных еди­ницах измерения признака, а дисперсия — вквадратах исходных единиц.

Свойства дисперсии:

1.Если значения измеренного признака не отличаются друг от друга (рав­ны между собой) — дисперсия равна нулю. Это соответствует отсутствию из­менчивости в данных.

2.Прибавление одного и того же числа к каждому значению переменной
не меняет дисперсию:


Dx=c=Dx, так как ∑ [(xi+c)-(Mx+c)2]=∑ (xi-Mx)2.


Рис. 4.1. Графики распределения частот: с разной дисперсией (D1< D2), одинаковой дисперсией (D2=D 3) и разными средними арифметическими 2< М3)

Прибавление константы к каждому значению переменной сдвигает график распределения этой переменной на эту константу (меняется среднее), но из­менчивость (дисперсия) при этом остается неизменной.

3. Умножение каждого значения переменной на константу с изменяет дис­персию в с2 раз:

Dx.c = Dx*c2, так как ∑ [(х, с) - (М2c)]2 = (c2∑ (x1 - Мх)2.

При объединении двух выборок с одинаковой дисперсией, но с разными средними значениями дисперсия увеличивается.

ПРИМЕР

Если одна группа содержит значения: 1, 1, 1, 1, 1, а другая группа — значения 3, 3, 3, 3, 3, то дисперсии этих групп одинаковы и равны 0. Если же объединить эти две группы, то дисперсия будет равна не 0, а 1.

Вообще говоря, справедливо утверждение: при объединении двух групп к внутригрупповой дисперсии каждой группы добавляется дисперсия, обуслов­ленная различием между группами (их средними). И чем больше различие между средними значениями, тем больше увеличивается дисперсия объеди­ненных групп.

Стандартизация или z-преобразование данных — это перевод измерений в стандартную Z-шкалу (Z-scores) со средним Мг = 0 и Dz (или Q2)=1. Сначала для переменной, измеренной на выборке, вычисляют среднее Мх стандарт­ное отклонение Qx. Затем все значения переменной х, пересчитываются по формуле:

 

(4.8)

 

 

В результате преобразованные значения (z-значения) непосредственно выражаются в единицах стандартного отклонения от среднего. Если для од­ной выборки несколько признаков переведены в z-значения, появляется воз­можность сравнения уровня выраженности разных признаков у того или иного испытуемого. Для того чтобы избавиться от неизбежных отрицательных и дробных значений, можно перейти к любой другой известной шкале: IQ (сред­нее 100, сигма 15); Т-оценок (среднее 50, сигма 10); 10-балльной стенов (среднее 5, 5, сигма 2) и др. Перевод в новую шкалу осуществляется путем умножения каждого г-значения на заданную сигму и прибавления среднего:

St=asZi + Ms. (4.9)

Асимметрия (Skewness) — степень отклонения графика распределения час­тот от симметричного вида относительно среднего значения. Если исходные данные переведены в z-значения, показатель асимметрии вычисляется по формуле:

 

As=(∑ zi3)/N. (4.10)


 

Рис. 4.2. Распределения частот с разными значениями асимметрии и эксцесса

Для симметричного распределения асимметрия равна 0. Если чаще встре­чаются значения меньше среднего, то говорят о левосторонней, или положи­тельной асимметрии (As > 0). Если же чаще встречаются значения больше сред­него, то асимметрия — правосторонняя, или отрицательная (As< 0). Чем больше отклонение от нуля, тем больше асимметрия.

Эксцесс (Kurtosis) — мера плосковершинности или остроконечности гра­фика распределения измеренного признака. Если исходные данные переве­дены в z-значения, показатель эксцесса определяется формулой:


(4.11)


Островершинное распределение характеризуется положительным эксцес­сом (Ех> 0), а плосковершинное — отрицательным (-3 < Ех< 0). «Средневершинное» (нормальное) распределение имеет нулевой эксцесс (Ех= 0).


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.008 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал