Корреляция ранговых переменных

⇐ ПредыдущаяСтр 61 из 135Следующая ⇒

Если к количественным данным неприменим коэффициент корреляции r-Пирсона, то для проверки гипотезы о связи двух переменных после предварительного ранжирования могут быть применены корреляции r-Спирмена или τ -Кендалла.

r-Спирмена. Этот коэффициент корреляции вычисляется либо путем применения формулы г-Пирсона к предварительно ранжированным двум переменным, либо, при отсутствии повторяющихся рангов, по упрощенной формуле:

Поскольку этот коэффициент — аналог r-Пирсона, то и применение r-Спирмена для проверки гипотез аналогично применению г-Пирсона, изложенному ранее.

Преимущество r-Спирмена по сравнению с r-Пирсона — в большей чувствительности к связи в случае:

- существенного отклонения распределения хотя бы одной переменной от нормального вида (асимметрия, выбросы);

- криволинейной (монотонной) связи.

Недостаток r-Спирмена по сравнению с r-Пирсона — 8 меньшей чувствительности к связи в случае несущественного отклонения распределения обеих переменных от нормального вида.

Частная корреляция и сравнение корреляций применимы и к r-Спирмена,

τ -Кепдалла, Применяется к предварительно ранжированным данным как альтернатива r-Спирмена. τ -Кендалла, как отмечалось в главе 6, имеет более выгодную, вероятностную интерпретацию. Общая формула для вычисления τ -Кендалла, вне зависимости от наличия или отсутствия повторяющихся рангов (связей):

где Р— число совпадений, Q — число инверсий, К_х и К_у - поправки на связи в рангах (см. главу 6: Проблема связанных (одинаковых) рангов). Если связей в рангах нет, то знаменатель формулы равен Р+ Q=N(N-1)/2.

Поскольку природа τ -Кендалла иная, чем у r-Спирмена и r-Пирсона, то р-уровень определяется по-другому: применяется z-критерий и единичное нормальное распределение. Эмпирическое значение вычисляется по формуле:

При вычислениях «вручную» p-уровень определяется по следующему алгоритму:

а) вычисляется эмпирическое значение z_э

б) по таблице «Стандартные нормальные вероятности» (приложение 1) определяется теоретическое значение z, ближайшее меньшее к эмпирическому значению z_э

в) определяется площадь Р под кривой справа от z_т;

г) вычисляется p-уровень по формуле р < 2Р.

Проверяемая статистическая гипотеза, порядок принятия статистического решения и формулировка содержательного вывода те же, что и для случая r-Пирсона или r-Спирмена.

При вычислениях на компьютере статистическая программа (SРSS, Statistica) сопровождает вычисленный коэффициент корреляции более точным значением p-уровня.

⇐ Предыдущая 56 57 58 59 606162 63 64 65 Следующая ⇒

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2026 год. (0.08 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал