Коэффициент корреляции.
Теснота связи в корреляционной зависимости (5.11) характеризуется параметром . Однако его величина зависит от единиц измерения переменных, что очень неудобно. Разделим обе части равенства (5.11) на и представим уравнение в эквивалентном виде:
. (5.16)
Величина
(5.17)
называется коэффициентом корреляции Пирсона и показывает на сколько величин изменится в среднем , когда увеличится на одно .
Коэффициент корреляции характеризует близость к линейной зависимости между двумя переменными.
Учитывая (5.12), формулу (5.17) для представим в виде, удобном для практических расчетов:
, (5.18)
где выборочные стандартные отклонения.
находим по формуле (5.13), а по формуле:
. (5.19)
Коэффициент корреляции принимает значения (Рис. 5.2.). Чем ближе к единице, тем теснее связь. Если связь называется прямой (положительная корреляция), если обратной (отрицательная корреляция). При линейная корреляционная связь отсутствует.
• •
• • • • • • •
• • • • •
• •
Рис. 5.2.
|
Оценка значимости коэффициента корреляции.
Иногда требуется оценить значимость коэффициента корреляции (5.18). При этом исходят из того, что при отсутствии корреляционной связи статистика имеет распределение Стьюдента с степенями свободы.
Коэффициент корреляции значим на уровне (т.е. гипотеза о равенстве генерального коэффициента корреляции нулю отвергается), если
, (5.20)
где – квантиль распределения Стьюдента с степенями свободы и уровнем значимости .
Коэффициент детерминации.
Наиболее эффективной оценкой адекватности регрессионной модели является коэффициент детерминации . Его величина показывает, какая доля вариации зависимой переменной обусловлена вариацией факторной переменной. Пределы изменения коэффициента детерминации .
Критерий значимости уравнения парной регрессии или самого коэффициента детерминации может быть записан в виде
, (5.21)
где уровень значимости;
число наблюдений;
табличное значение критерия Фишера-Снедекора, определенное на уровне значимости при и степенях свободы.
Пример 5.2.По данным табл. 5.1 вычислить коэффициенты корреляции и детерминации между переменными и , оценить их значимость на уровне .
1) Ранее было вычислено ; следовательно .
По формуле (5.19) находим .
Подставляем полученные значения в (5.18): ,
то есть связь между переменными достаточно тесная.
Коэффициент детерминации .
Доля вариации 0, 8 обусловлена вариацией фактора.
2) Статистика (5.20) равна
По таблицам . Т.к. , то коэффициент корреляции значим.
Статистика (5.21) .
Табличное значение . Т.к. , то коэффициент детерминации и уравнение регрессии значимы.
|
|