Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Проверка нормальности распределения






Для проверки нормальности используются различные процедуры, позво­ляющие выяснить, отличается ли от нормального выборочное распределение измеренной переменной. Необходимость такого сопоставления возникает, когда мы сомневаемся в том, в какой шкале представлен признак — в поряд­ковой или метрической. А сомнения такие возникают очень часто, так как заранее нам, как правило, не известно, в какой шкале удастся измерить изу­чаемое свойство (исключая, конечно, случаи явно номинативного измерения).

Важность определения того, в какой шкале измерен признак, трудно пе­реоценить; по крайней мере, по двум причинам. От этого зависит, во-первых, полнота учета исходной эмпирической информации (в частности, об инди­видуальных различиях), во-вторых, доступность многих методов анализа дан­ных. Если исследователь принимает решение об измерении в порядковой шкале, то неизбежное последующее ранжирование ведет к потере части ис­ходной информации о различиях между испытуемыми, изучаемыми группа­ми, о взаимосвязях между признаками и т. д. Кроме того, метрические дан­ные позволяют использовать значительно более широкий набор методов Анализа и, как следствие, сделать выводы исследования более глубокими и содержательными.

Наиболее весомым аргументом в пользу того, что признак измерен в мет­рической шкале, является соответствие выборочного распределения нормаль­ному. Это является следствием закона нормального распределения. Если вы­борочное распределение не отличается от нормального, то это значит, что измеряемое свойство удалось отразить в метрической шкале (обычно — интер­вальной).

Существует множество различных способов проверки нормальности, из которых мы кратко опишем лишь некоторые, предполагая, что эти проверки читатель будет производить при помощи компьютерных программ.

Графический способ (Q-Q Plots, Р-Р Plots). Строят либо квантильные гра­фики, либо графики накопленных частот. Квантильные графики (Q-Q Plots)
строятся следующим образом. Сначала определяются эмпирические значе­ния изучаемого признака, соответствующие 5, 10, …95-процентилю. Затем по таблице нормального распределения для каждого из этих процентилей определяются z-значения (теоретические). Два полученных ряда чисел за­дают координаты точек на графике: эмпирические значения признака от-

кладываются на оси абсцисс, а соответствующие им теоретические значе­ния — на оси ординат. Для нормального распределения все точки будут ле­жать на одной прямой или рядом с ней. Чем больше расстояние от точек до
прямой линии, тем меньше распределение соответствует нормальному. Гра­фики накопленных частот (Р-Р Plots) строятся подобным образом. На оси
абсцисс через равные интервалы откладываются значения накопленных относительных частот, например 0, 05; 0, 1;...; 0, 95. Далее определяются эмпирические значения изучаемого признака, соответствующие каждому значе­нию накопленной частоты, которые пересчитываются в г-значения. По
таблице нормального распределения определяются теоретические накоп­ленные частоты (площадь под кривой) для каждого из вычисленных z-значений, которые откладываются на оси ординат. Если распределение со­ответствует нормальному, полученные на графике точки лежат на одной прямой.

Критерии асимметрии и эксцесса. Эти критерии определяют допустимую степень отклонения эмпирических значений асимметрии и эксцесса от нуле­вых значений, соответствующих нормальному распределению. Допустимая степень отклонения — та, которая позволяет считать, что эти статистики су­щественно не отличаются от нормальных параметров. Величина допустимых отклонений определяется так называемыми стандартными ошибками асим­метрии и эксцесса. Для формулы асимметрии (4.10) стандартная ошибка оп­ределяются по формуле:

Assd=3*√ (6(N-1))/((N+1)*(N+3))

Для формулы эксцесса (4.11) стандартная ошибка эксцесса:

Exsd= 5*√ (24N(N-2)(N-3))/((N+1)2(N+3)(N+5))

где N— объем выборки.

Выборочные значения асимметрии и эксцесса не отличаются от нуля, если они не превышают (по абсолютной величине) значения своих стандартных ошибок. Это можно считать признаком соответствия выборочного распреде­ления нормальному закону. Следует отметить, что компьютерные программы вычисляют показатели асимметрии, эксцесса и соответствующие им стандар­тные ошибки по другим, более сложным формулам.

Статистический критерий нормальности Колмогорова-Смирнова считается наиболее состоятельным для определения степени соответствия эмпиричес­кого распределения нормальному. Он позволяет оценить вероятность того, что данная выборка принадлежит генеральной совокупности с нормальным распределением. Если эта вероятность р< 0, 05, то данное эмпирическое распределение существенно отличается от нормального, а если р > 0, 05, то делают вывод о приблизительном соответствии данного эмпирического рас­пределения нормальному.

Причины отклонения от нормальности. Общей причиной отклонения фор­мы выборочного распределения признака от нормального вида чаще всего является особенность процедуры измерения: используемая шкала может об­ладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости.

ПРИМЕР

Предположим, выраженность некоторой способности определяется количеством выполненных заданий за отведенное время. Если задания простые или время слиш­ком велико, то данная измерительная процедура будет обладать достаточной чув­ствительностью лишь в отношении части испытуемых, для которых эти задания достаточно трудны. И слишком большая доля испытуемых будет решать все или почти все задания. В итоге мы получим распределение с выраженной правосторон­ней асимметрией. Можно, конечно, впоследствии повысить Качество измерения путем эмпирической нормализации, добавив более сложные задания или сократив время выполнения данного набора заданий. Если же мы чрезмерно усложним из­мерительную процедуру, то возникнет обратная ситуация, когда большая часть ис­пытуемых будет решать малое количество заданий и эмпирическое распределение приобретет левостороннюю асимметрию.

Таким образом, такие отклонения от нормального вида, как право- или левосторонняя асимметрия или слишком большой эксцесс (больше 0), связа­ны с относительно низкой чувствительностью измерительной процедуры в области моды (вершины графика распределения частот).

Другой причиной отклонения от нормальности может являться наличие «выбросов» — экстремально больших или малых значений переменной. «Выб­росами» можно считать значения переменной, отличающиеся от среднего значения на 2q и более (если N< 50) или на Зq и более (если N> 50). Если таких значений не очень много, их можно исключить из выборки, тем самым несколько уменьшив ее объем. Если исследователь не желает избавляться от таких значений, то следует отказаться от предположения о нормальности рас­пределения данной переменной.

Последствия отклонения от нормальности. Следует отметить, что задача по­лучения эмпирического распределения, строго соответствующего нормально­му закону, нечасто встречается в практике исследования. Обычно такие случаи ограничиваются разработкой новой из­мерительной процедуры или тестовой шкалы, когда применяется эмпириче­ская или нелинейная нормализация для •«исправления» эмпирического распре­деления. В большинстве случаев соот­ветствие или несоответствие нормаль­ности является тем свойством измерен­ного признака, который исследователь должен учитывать при выборе статис­тических процедур анализа данных.


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.007 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал