![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Измерение связи
Из школьного курса математики известно понятие функциональной связи, когда каждому значению независимой перемен- ной (аргумента х) ставится определенное значение зависимой переменной (функции у): Функция может быть однозначной и многозначной. Так, дли- на окружности есть однозначная функция радиуса: 1=2
ратный корень из действительного числа — двузначная функция этого числа: у= На графике, в случае однозначной функции, каждой паре значений х и у соответствует точка плоскости. Множество этих точек на плоскости представляет собой графическое изображение функциональной связи, или график функции у=1(х). Однако в природе существуют не только функциональные связи такого рода. Рассмотрим обычную игру в карты. При сдаче игрок получает некоторое множество карт. При следующей — другое множество карт и т.д. При каждой сдаче получается новая комбинация. Налицо — связь между сдачей и комбинацией карт игрока. В этом случае с изменением одной переменной происходит изменение распределения другой переменной. Связь этих переменных называется статистической. Если оказывается, что с изменением одной переменной изменяется среднее значение другой, то говорят, что между этими переменными существует корреляционная связь. Например, требуется определить зависимость между ростом жены и мужа. Для примера рассмотрим 100 супружеских пар. На плоскости дана прямоугольная система координат, по оси х откладывается рост мужа, по оси у — рост жены. Точкой на плоскости отмечается каждая супружеская пара. Полученное графическое изображение называется корреляционным полем (рис. 9). В нашем случае должно быть 100 точек, которые как-то заполняют плоскость этого корреляционного поля. Для каждого класс-интервала х отбираем все соответствующие ему точки. Находим их среднее значение
роста мужа от одного класс-интервала к другому. Эта линия называется эмпирической линией регрессии. Если рассмотреть 100 других пар, то получится несколько иная эмпирическая линия регрессии. Если уменьшить величину класс-интервала, то линия покажет увеличение числа звеньев, сохранив в целом контур. Можно убедиться, что все эмпирические линии регрессии каких-либо двух переменных всегда лежат около некоторой плавной линии, называемой теоретической линией регрессии, или просто линией регрессии[127]. Ее уравнение называется уравнением регрессии. Если мы рассматриваем изменение среднего у от х, то получится уравнение регрессии у на х: Если рассматриваем изменение среднего При Как найти коэффициенты уравнений регрессии? Предположим, что дано и объектов, характеризующихся двумя переменными: Линия ACDF — эмпирическая линия регрессии Коэффициенты теоретической линии регрессии находят по методу наименьших квадратов: ищут эту линию при том условии, чтобы сумма квадратов расстояний эмпирической линии регрессии от теоретической была бы минимальной. Иначе говоря, теоретическая линия регрессии должна иметь наиближайшее расположение ко всем точкам эмпирической линии регрессии. Если мы обозначили ординату теоретической линии регрессии
Это означает, что
Получаем нормальные уравнения для определения коэффициентов линии регрессии:
или
Поскольку средние то где Найденный коэффициент Аналогично можно построить линию регрессии где
Коэффициент корреляции определяют как среднее геометрическое из коэффициентов регрессии[128]: Дадим геометрическую интерпретацию коэффициенту корреляции[129] (рис. 11). OP — это линия регрессии у на х; OQ — линия регрессии х на у; Если корреляции нет, то или линия OP, или OQ или обе вместе совпадают с осями координат, так как: Еcли корреляционная связь переходит в функциональную, то обе линии регрессии совпадают. Тогда Чем теснее связь между переменными, тем меньше угол меж- ду обеими линиями регрессии. Рассмотренный коэффициент корреляции измеряет линейную связь между двумя количественными переменными. Этим, одна-
ко, не исчерпывается все возможное многообразие связей в социологии. Во-первых, переменные могут иметь криволинейную регрессию: линия регрессии может быть параболой, кубической параболой, экспонентой и т.п. В каждом случае надо находить пути измерения связи между данными переменными. Во-вторых, возможно наличие связи между более чем двумя переменными. Это проблема множественной корреляции, или многофакторного корреляционного анализа. В-третьих, возможно существование связи между не только количественными переменными. В этом случае в статистике и социологии используются специальные показатели связи. В случае криволинейной регрессии вместо коэффициента корреляции (иногда говорят «коэффициента линейной, или парной, корреляции») вводится корреляционное отношение[130]. где Следовательно, прежде чем определять связь между количественными переменными социального объекта, необходимо сначала построить их линии регрессии и оценить характер регрессии. В том случае, если эмпирическая линия регрессии находится близко от некоторой прямой, можно вычислить коэффициент линейной корреляции Пирсона. Если же эмпирическая линия регрессии — явный изгиб, то надо использовать корреляционное отношение. При наличии более двух количественных переменных применяют частные коэффициенты корреляции[131]. Если, например, рассматривают три переменные х, у, z, то вводят частные коэффициенты корреляции
где справа находятся обычные коэффициенты парной корреляции. Выражения для двух других коэффициентов получаются простой круговой перестановкой индексов в правой части. Можно также ввести понятия частых коэффициентов корреляции и сводный коэффициент для и переменных. Для измерения связи между качественными (номинальными) переменными используется таблица сопряженности.
Имеются два номинальных признака (переменные) А и В, которые принимают соответственно значения Рассмотрим N лиц и их распределение по признакам А и В. В каждой клетке первой строки пишется число лиц, которые одновременно обладают значением А, признака А и соответствующими значениями признака В, т.е. в левой клетке первой строки стоит и,, число лиц, обладающих признаками А, и В, одновременно, во второй клетке — Таблица сопряженности в данном случае очень сходна с корреляционной таблицей с той лишь разницей, что первая дает со-
вместные частоты качественных значений признаков, а вторая — совместные частоты класс-интервалов количественных признаков. Вместо Пирсон предложил следующий коэффициент связи признаков А и В: который сконструирован так, что квадраты отклонений взвешенны по отношению к ожидаемым частотам и нейтрализованно влияние значков (как, в случае диоперсии). При полной независимости переменных Иногда используют так называемый коэффициент сопряженности в виде где дает более прямое непосредственное указание на связь между признаками. Для определения связи между ранжированными переменными можно использовать так называемый ранговый коэффициент Спирмена: где n — число объектов; Рассмотрим числовой пример: даны 13 лиц, проранжированных по двум признакам. Результаты таковы:
И первом столбце — лица; во втором — их ранги по первой переменной (признаку); в третьем — их ранги по второй переменной (признаку); в четвертом — разность рангов этих лиц. В последнем столбце — квадраты разностей, которые используются в формуле. Можно произвести вычисления. Получим Большое значение для социологических исследований имеет бисериальный коэффициент корреляции, определяющий связь между, количественной переменной и дихотомической качественной переменной. Он вычисляется по формуле где N — общее число индивидов; Пример[132].
Вычисления дают: Представляет интерес для социологии группа коэффициентов для измерения корреляции в четырехклеточной таблице, которые измеряют связь между дихотомическими переменными.
Для таблицы в виде
имеют место коэффициенты При измерении связи в конкретном социологическом исследовании мы вычисляем коэффициент корреляции по выборке. По сути дела, мы всегда располагаем только некоторой оценкой коэффициента корреляции генеральной совокупности. Любая выборочная оценка, как мы уже отмечали, требует проверки. Без указания точности расчета и проверки статистической гипотезы выборочная оценка не имеет смысла, к ней неизвестно как подступиться. Остановимся на статистических оценках коэффициента парной корреляции r и рангового коэффициента корреляции Спирмена ρ.
Критические величины коэффициента корреляции Спирмена ρ
В случае нормального распределения для r дается выражение ошибки:
Это означает, что коэффициент корреляции Если использовать специальные таблицы, то можно построить доверительный интервал при данной доверительной вероятности и проверить нулевую гипотезу равенства выборочного и генерального коэффициентов корреляции. Для проверки ρ Спирмена используют таблицу критических величин. Если
Глава третья Психологические тесты и социологические шкалы
|