Ранговый коэффициент корреляции Кендалла
Выборочное значение рангового коэффициента корреляции Кендалла между ранжировками и рассчитывается по формуле:
, (3.7)
где – минимальное число обменов соседних элементов ранжировки , необходимых для приведения ее к виду ранжировки .
В основе построения коэффициента Кендалла лежит понятие инверсии. Сравним ранги i -го и s -го объектов: и .
Пары и согласованы, если или . Пары и не согласованы, т.е. ранги образуют инверсию, если или .
Пусть – количество согласованных пар, – количество несогласованных пар. Количество пар, которое можно построить из n объектов равно числу сочетаний .
Определим меру согласия двух ранжировок . Тогда , когда все пары не согласованы ( ), и , когда все пары согласованы ( ). Таким образом . Чтобы получить меру связи, которая не зависит от n, разделим M на его максимально возможное значение:
.
Получили формулу для расчета рангового коэффициента корреляции Кендалла (3.7).
Существуют рекомендации, упрощающие подсчет рангового коэффициента корреляции Кендалла. Величина совпадает с числом инверсий. Для подсчета числа инверсий ранжировки и преобразуются к виду , , где , . Очевидно, что число инверсий в ранжировках и совпадает с числом инверсий в ранжировках , :
, где 
Формула (3.7) используется для расчета выборочного значения рангового коэффициента корреляции Кендалла только в случае отсутствия объединенных рангов в ранжировках и . В противном случае используется формула:
, (3.8)
где – поправочные величины, .
Значения ранговый корреляционных характеристик и связаны друг с другом. При и при условии, что абсолютные значения этих коэффициентов не слишком близки к 1, их связывает следующее приближенное соотношение: .
При большом объеме выборки n и независимости и оценка рангового коэффициента корреляции Кендалла подчиняется нормальному закону распределения с математическим ожиданием равным нулю и дисперсией равной .
После расчета выборочного значения рангового коэффициента корреляции Кендалла необходимо проверить значимость коэффициента. Для этого выдвигаются гипотезы:
(ранговый коэффициент корреляции Кендалла незначим);
(ранговый коэффициент корреляции Кендалла значим).
Для проверки гипотезы используется статистика , имеющая при условии справедливости нулевой гипотезы и объеме выборки стандартный нормальный закон распределения.
При проверка гипотезы осуществляется с помощью специальной таблицы, позволяющей вычислить критическое значение коэффициента Кендалла [12].
Для значимого рангового коэффициента корреляции Кендалла можно построить доверительный интервал. При этом используется тот факт, что при и значении коэффициента Кендалла не слишком близком по абсолютной величине к 1, . Доверительный интервал для , построенный с вероятностью , имеет вид:
,
где – квартиль уровня стандартного нормального закона распределения.
|