![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корреляция ранговых переменных
Если к количественным данным неприменим коэффициент корреляции r-Пирсона, то для проверки гипотезы о связи двух переменных после предварительного ранжирования могут быть применены корреляции r-Спирмена или τ -Кендалла. r-Спирмена. Этот коэффициент корреляции вычисляется либо путем применения формулы г-Пирсона к предварительно ранжированным двум переменным, либо, при отсутствии повторяющихся рангов, по упрощенной формуле:
Поскольку этот коэффициент — аналог r-Пирсона, то и применение r-Спирмена для проверки гипотез аналогично применению г-Пирсона, изложенному ранее. Преимущество r-Спирмена по сравнению с r-Пирсона — в большей чувствительности к связи в случае: - существенного отклонения распределения хотя бы одной переменной от нормального вида (асимметрия, выбросы); - криволинейной (монотонной) связи. Недостаток r-Спирмена по сравнению с r-Пирсона — 8 меньшей чувствительности к связи в случае несущественного отклонения распределения обеих переменных от нормального вида. Частная корреляция и сравнение корреляций применимы и к r-Спирмена, τ -Кепдалла, Применяется к предварительно ранжированным данным как альтернатива r-Спирмена. τ -Кендалла, как отмечалось в главе 6, имеет более выгодную, вероятностную интерпретацию. Общая формула для вычисления τ -Кендалла, вне зависимости от наличия или отсутствия повторяющихся рангов (связей): где Р— число совпадений, Q — число инверсий, Кх и Ку - поправки на связи в рангах (см. главу 6: Проблема связанных (одинаковых) рангов). Если связей в рангах нет, то знаменатель формулы равен Р+ Q=N(N-1)/2. Поскольку природа τ -Кендалла иная, чем у r-Спирмена и r-Пирсона, то р-уровень определяется по-другому: применяется z-критерий и единичное нормальное распределение. Эмпирическое значение вычисляется по формуле: При вычислениях «вручную» p-уровень определяется по следующему алгоритму: а) вычисляется эмпирическое значение zэ б) по таблице «Стандартные нормальные вероятности» (приложение 1) определяется теоретическое значение z, ближайшее меньшее к эмпирическому значению zэ в) определяется площадь Р под кривой справа от zт; г) вычисляется p-уровень по формуле р < 2Р. Проверяемая статистическая гипотеза, порядок принятия статистического решения и формулировка содержательного вывода те же, что и для случая r-Пирсона или r-Спирмена. При вычислениях на компьютере статистическая программа (SРSS, Statistica) сопровождает вычисленный коэффициент корреляции более точным значением p-уровня.
|