![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Коэффициент конкордации.
По-другому коэффициент множественной ранговой корреляции называют коэффициентом конкордации. Задача, решаемая с помощью этого коэффициента, больше всего напоминает однофакторный дисперсионный анализ, но шкала измеряемого признака может быть не интервальной, а порядковой.
Предположим, у нас есть N объектов, характеризующихся некоторым количеством признаков (обозначим число признаков буквой К). Например, это могут быть 7 хозяйств, различающихся по трем экономическим показателям (N=7, К=3). По этим показателям хозяйства должно быть возможным ранжировать, т.е. расположить в порядке возрастания. Это указывает на то, что показатели должны измеряться по порядковым или интервальным шкалам.
Требуется проверить, сходный ли смысл имеют экономические показатели, выбранные нами для анализа. Если все показатели либо одновременно велики, либо одновременно малы, то можно считать, что система показателей внутренне согласована (отсюда и название: «конкордация» обозначает «согласование»). По-другому это можно сказать так: в среднем все показатели коррелируют между собой. Однако для проверки мы традиционно используем более нейтральный факт и проверяем гипотезу, что все признаки независимы (одновременно). Альтернативной гипотезой будет согласованность признаков.
Конечно, можно попарно вычислять и проверять значимость коэффициентов ранговой корреляции (Спирмена или Кендалла). Но благодаря наличию статистического разброса и большому числу этих сравнений мы все равно иногда будем получать значимые коэффициенты ранговой корреляции даже в случае абсолютной несогласованности (все коэффициенты измеряют не связанные факторы).
На первом этапе вычисления коэффициента множественной ранговой корреляции мы должны проделать такое ранжирование по каждому включенному в анализ показателю, т.е. присвоить объектам ранги. Как это делается, уже было рассказано ранее. Для нашего примера в результате ранжирования мы получим данные примерно следующего вида:
Для удобства дальнейших рассуждений мы расположили хозяйства по возрастанию рангов первого показателя (зерновые). В этих же целях по третьему показателю мы взяли в качестве примера обратное расположение рангов по. Данный пример учебный, в действительности так, скорее всего, не будет.
Переход к рангам автоматически выравнивает значимость показателей, даже если шкалы для их измерения были несопоставимы (например, средние значения 1000 километров и 5 килограммов). Попытка вычислить коэффициент, используя не ранги, а сами значения, приведет к ошибке.
Следующий шаг вычисления – суммирование рангов по всем (трем) показателям для каждого хозяйства. Результаты приведены в 5-м столбце таблицы:
Поставим вопрос: как будут выглядеть наши данные, если гипотеза верна и показатели действительно независимы. Если например, ранг по первому признаку будет большой, то по второму он может оказаться с равной вероятностью как большим, так и маленьким. По третьему признаку – тоже, и т. д. Если признаков много, то среднее значение суммы рангов у всех объектов (в нашем случае – хозяйств) будет примерно одинаково. Это среднее значение легко найти, если просуммировать все ранги в таблице и разделить на число признаков К. Поскольку все ранги известны заранее (порядковые номера от 1 до N, встречаются каждый по одному разу), то значение среднего ранга суммы зависит только от К и N и не зависит от того, какие конкретно ранги получили объекты. Оно всегда равно
В 6-м столбце таблицы расположены разности Δ i между конкретным значением суммы рангов и средним значением
Сумма квадратов разностей равна
На основании данной суммы вычисляем коэффициент множественной ранговой корреляции по следующей формуле:
Смысл этой формулы – отношение суммы квадратов разностей к максимально возможному значению этой суммы, равному
Осталось проверить гипотезу о том, значима ли такая величина коэффициента множественной ранговой корреляции. Проверять будем с помощью распределения хи-квадрат. Для этого выбираем уровень значимости α. Выберем, например, α =0, 01. По таблице распределения хи-квадрат с N-1 степенями свободы (в нашем примере N-1=6) смотрим критическое значение хи-квадрат для этого уровня значимости. (в нашем примере χ 2крит=16, 81.
Экспериментальное значение хи-квадрат вычисляем по формуле Вычисления для нашего примера дают Сравниваем экспериментальное значение χ 2крит =2, 0 с критическим χ 2крит=16, 81. Поскольку экспериментальное значение меньше критического, можно считать, что признаки (в нашем случае это экономические показатели) можно считать в среднем независимыми.
Обратите внимание, что этот критерий предполагает только проверку наличие согласованности всех признаков одновременно. В нашем примере четко прослеживается отрицательная связь первого и третьего фактора: чем больше ранг по зерновым, тем меньше ранг по молоку. Однако за счет присутствия третьего фактора эта связь может оказаться недостаточно существенной. Для более подробного анализа можно использовать коэффициенты ранговой корреляции.
27. Шкалы качественных и количественных признаков. Свойства шкал. Шкалы количественных признаков: интервальная, отношений, разностей, абсолютная Шкалы качественных признаков: порядковая, наименований.
|