Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Коэффициент конкордации






 

Коэффициент конкордации является характеристикой связи между несколькими порядковыми признаками. Выборочное значение коэффициента конкордации между p ранжировками рассчитывается по формуле:

 

. (3.9)

 

Коэффициент конкордации часто используется для оценки согласованности мнений экспертов. Пусть p – количество экспертов, n – количество объектов, – ранг, присвоенный i -му объекту j -ым экспертом, , . Тогда – сумма рангов всех объектов, проставленных j -ым экспертом, ; – сумма рангов всех объектов, проставленных всеми p экспертами; – средний ранг объекта у p экспертов.

Пусть мнения экспертов полностью согласованы, причем первому объекту все эксперты дают ранг 1, второму – ранг 2, … n -му объекту – ранг n. Тогда – сумма рангов, проставленных p экспертами i -му объекту, . Вычислим сумму квадратов отклонений мнений экспертов от среднего ранга объекта при полной согласованности мнений экспертов:

 

 

Для того чтобы коэффициент конкордации принимал значение 1 при полной согласованности мнений экспертов, разделим на величину Получаем формулу (3.9).

Свойства коэффициента конкордации:

1. коэффициент конкордации принимает значения от 0 до 1 (ранжировки могут полностью совпадать, но не могут полностью не совпадать в том смысле, который вкладывается в это понятие при );

2. коэффициент конкордации равен 1 тогда и только тогда, когда все p ранжировок совпадают;

3. если и анализируемые ранжировки генерируются подобно случайному независимому p -кратному извлечению из множества всех возможных упорядочений n объектов, то связи между ними нет и ;

4. пусть – среднее значение коэффициента Спирмена, рассчитанное по значениям коэффициентов, характеризующих связь между всеми возможными парами ранжировок, тогда . В частности, при , т.е. коэффициент конкордации, вычисленный для двух ранжировок, пропорционален ранговому коэффициенту корреляции Спирмена.

Формула (3.9) используется для расчета выборочного значения коэффициента конкордации только в случае отсутствия объединенных рангов в рассматриваемых ранжировках. Если же таковые имеются, то используется следующая формула:

 

, (3.10)

 

где – поправочные величины, ;

– число групп неразличимых рангов в ранжировке ;

– число элементов, входящих в группу t неразличимых рангов.

После расчета выборочного значения коэффициента конкордации необходимо проверить значимость коэффициента. Для этого выдвигаются гипотезы:

(коэффициент конкордации между p порядковыми признаками незначим);

(коэффициент конкордации между p порядковыми признаками значим).

Для проверки нулевой гипотезы используется статистика , имеющая при справедливости гипотезы и объеме выборки распределение Хи-квадрат с числом степеней свободы .

Существуют и другие способы проверки значимости коэффициента конкордации [12].

 

3.3 Корреляционный анализ номинальных признаков: анализ двухфакторных таблиц сопряженности

 

Рассмотрим два категоризованных номинальных признака X и Y. Признак X может принимать значения ; признак Y. Закон распределения случайного вектора можно представить в виде таблицы распределения вида:

 

\
 

 

где – вероятность того, что случайная величина Х примет значение , а случайная величина Y примет значение , , ;

– вероятность того, что случайная величина Х примет значение , , ;

– вероятность того, что случайная величина Y примет значение , , ;

.

Вероятности , , задают распределение вероятностей случайной величины Х; вероятности , , задают распределение вероятностей случайной величины Y. Ряд распределения случайной величины Х имеет вид:

 

 

Ряд распределения случайной величины Y имеет вид:

 

 

В силу случайности рассматриваемых признаков исход наблюдения имеет некоторую неопределенность. Возникает вопрос: можно ли предсказать значение, которое примет случайная величина при очередном наблюдении? Зная закон распределения случайной величины, можно в некоторой мере оценить надежность прогноза.

Например, две случайные величины X и Y имеют следующие законы распределения:

 

0, 5 0, 5

 

0, 9 0, 1

 

Из этих таблиц видно, что закон распределения случайной величины Y имеет значительно меньшую неопределенность и позволяет с высокой вероятностью предсказать, что результатом наблюдения будет значение .

Числовой характеристикой распределения дискретной случайной величины, которая может служить мерой его неопределенности, является энтропия закона распределения, определяемая формулой:

 

, где .

 

Энтропия зависит не от значений случайной величины, а только от их вероятностей и количества r возможных значений. Основание логарифмов может быть произвольным. Однако для сравнения энтропий различных распределений они должны вычисляться при одном и том же основании. В теории информации в качестве основания логарифмов принято брать 2.

Энтропии приведенных выше распределений при натуральных логарифмах принимают следующие значения: , .

Свойства энтропии:

1) , равенство достигается, когда случайная величина X принимает одно значение;

2) не меняется при взаимно-однозначных преобразованиях;

3) максимально, когда все возможные значения Х равновероятны.

По аналогии с одномерной случайной величиной энтропия пары случайных величин определяется следующим образом:

.

Свойства энтропии двумерного распределения:

1) ;

2) , причем равенство достигается, когда Х и Y независимы.

Пусть имеется выборка объема n из генеральной совокупности (Х, Y). Тогда эмпирическое распределение генеральной совокупности (Х, Y) может быть представлено в виде двухфакторной таблицы сопряженности признаков Х и Y размерности , имеющей вид [12, 15, 50, 42]:

 

\
n

 

где – наблюдаемая частота, т.е. число объектов в выборочной совокупности, характеризующихся i -ой категорией признака X и j -ой категорией признака Y, , ;

– маргинальная частота, характеризующая сколько объектов в выборочной совокупности обладают i -ой категорией признака X, , ;

– маргинальная частота, характеризующая сколько объектов в выборочной совокупности обладают j -ой категорией признака Y, , ;

.

Замечание: признаки X и/или Y могут быть измерены в порядковой или количественной шкале. В последнем случае для построения выборочной таблицы сопряженности наблюдаемые значения признаков должны быть сгруппированы в форме интервального вариационного ряда.

На практике применяют три метода отбора объектов в выборку.

1) Перекрестный отбор

Предполагается, что величины , , , имеют полиномиальное распределение с вероятностями и с фиксированным числом наблюдений . До сбора данных назначается только объем выборки. Многие выборочные обследования проводятся именно таким образом. Например, при изучении структуры потребительского спроса всех опрошенных можно классифицировать в зависимости от пола и потребительского предпочтения. Целью исследования является выяснение, зависимы признаки или нет.

2) Целевой отбор

Распределения строк , , …, , , рассматриваются как независимые выборки из полиномиальных распределений с вероятностями и фиксированным числом наблюдений . Такая организация данных возникает в том случае, когда сравниваются несколько одномерных распределений, представленных выборками фиксированного объема . Аналогично можно представить распределение столбцов , , …, , , с фиксированным числом наблюдений . Например, производится опрос разновозрастных групп населения об их отношении к проводимой в стране реформе пенсионного обеспечения. Ответ имеет три значения (категории): «поддерживаю», «не поддерживаю», «затрудняюсь ответить». Число опрашиваемых в группа фиксированного: – в возрасте от 20 до 40 лет, – от 40 до 60 лет, – от 60 до 80 лет.

3) Третья схема отбора объектов получается из первой схемы, когда число n является не фиксированной, а случайной величиной, подчиненной заданному закону распределения. В этом случае являются независимыми случайными величинами с заданным законом распределения.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.015 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал