![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Коэффициент корреляции т-Кендалла
Альтернативу корреляции Спирмена для рангов представляет корреляция х-Кендалла. В основе корреляции, предложенной М. Кендаллом, лежит идея о том, что о направлении связи можно судить, попарно сравнивая между собой испытуемых: если у пары испытуемых изменение по ^совпадает по направлению с изменением по Y, то это свидетельствует о положительной связи, если не совпадает — то об отрицательной связи. В примере 6.3 данные испытуемых 1 и 2 свидетельствуют об отрицательной связи — мы видим инверсию; по переменной Л'у второго испытуемого ранг больше, а по переменной. Y— меньше. Данные испытуемых 2 и 3, напротив, демонстрируют совпадение направления изменения переменных. . Корреляция т-Кендалла есть разность относительных частот совпадений и инверсий при переборе всех пар испытуемых в выборке: ГЛАВА 6. КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ где Р(р) и P{q) — относительные частоты, соответственно, совпадений и инверсий. Всего в выборке численностью N существует N(N— 1)/2 всех возможных пар испытуемых. Следовательно, - ^ (6.7, N(N- где Р — число совпадений, Q — число инверсий, а (Р+ Q) Формулу 6.7 можно представить и в ином виде: —1. (6.8) _ f-Q _1 4Q _ 4? Х P+Q~ N(N-l) N{N-\) При подсчете т-Кендалла «вручную» данные сначала упорядочиваются по переменной X. Затем для каждого испытуемого подсчитывается, сколько раз его ранг по доказывается меньше, чем ранг испытуемых, находящихся ниже. Результат записывается в столбец «Совпадения». Сумма всех значений столб-, ца «Совпадения» и есть Р — общее число совпадений, подставляется в формулу 6.8. для вычисления т-Кендалла. ПРИМЕР 6.5 Вычислим т-Кендалла для данных из примера 6.4. Сначала предварительно упорядочиваем испытуемых по переменной X. Затем подсчитываем число совпадений и инверсий для каждого испытуемого, сравнивая по Y его ранг с рангами испытуемых, находящихся под ним. Так, для первого испытуемого ранг по Y равен 6, и 6 испытуемых, находящихся ниже него, имеют по У более высокий ранг: в столбец «Совпадения» записываем 6. Для третьего по счету испытуемого ранг по Y равен 8, трое испытуемых ниже него имеют более высокий ранг, значит, в столбец «Совпадения» записываем 3, и т. д.
12x11/2 = 66. Проверяем правильность подсчета PnQ.P+Q = 66; N(N-\)/2 > т=- ■ ■ -0, 455. 18-48 ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ Для более полной интерпретации полезны соотношения между величиной т-Кендалла и вероятностью отдельно совпадений и инверсий: вероятность совпадений Р(р) = —г~; Х вероятность инверсий P(q) = 1 - Р(р) * —г— • j* Так, т = 0, 5 значит, что вероятность совпадений равна 0, 75, а вероятность инверсий — 0, 25, то есть при сравнении объектов друг с другом прямо пропорциональное соотношение (например, роста и веса) встречается в 3 раза чаше, чем обратно пропорциональное соотношение. Такая интерпретация кажется более понятной, чем, например, интерпретация корреляции Пирсона г— 0, 5: «25% изменчивости в весе могут быть объяснены различиями в росте». т-Кендалла кажется более простым в вычислительном отношении. Однако при возрастании численности выборки, в отличие от r-Спирмена, объём вычислений т-Кендалла возрастает не пропорционально, а в геометрической прогрессии. Так, при N=* 12 необходимо перебрать 66 пар испытуемых, а при N** 48 — уже 1128 пар, т. е. объем вычислений вбзрастает более, чем в 17 раз. Отметим важную особенность ранговых коэффициентов корреляции. Для метрической корреляции г-Пирсона значениям +1 или -1 соответствует прямая или обратная пропорция между переменными, что графически представляет собой прямую линию. Максимальным по модулю ранговым корреляциям (+1, —1) вовсе не обязательно соответствуют строгие прямо или обратно пропорциональные связи между исходными переменными Хи Y: достаточна лишь монотонная функциональная связь между ними. Иными словами, ранговые корреляции достигают своего максимального по модулю значения, если большему значению одной переменной всегда соответствует большее значение другой переменной (+1) или большему значению одной переменной всегда соответствует меньшее значение другой переменной и наоборот (—1).
|