Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Множественная корреляция
Практическая значимость уравнения регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.
где
Иначе, формула примет вид: Этот показатель характеризует тесноту связи рассматриваемого набора факторов с используемым признаком, т.е. оценивает тесноту связи совместного влияния факторов на результат. При линейной зависимости признаков формула индекса корреляции имеет вид:
где
В справедливости данной формулы можно убедиться, если обратиться к линейному уравнению множественной регрессии в стандартизованном масштабе и определить для него индекс множественной корреляции как
В числителе последней формулы мы имеем факторную сумму квадратов отклонений для стандартизованных переменных:
тогда Выведенная формула называется линейным коэффициентом множественной корреляции или совокупным коэффициентом корреляции. Возможен иной подход к определению параметров, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе
а среднее квадратичное отклонение Применяя МНК к уравнению множественной регрессии в стандартизованном масштабе, получим систему нормальных уравнений вида
Решая систему, найдем параметры. Стандартизованные параметры
Для МНК имеем формулы:
Таким образом, в системе вычисляется коэффициент корреляции по формуле:
так как Стандартизованные коэффициенты регрессии где β j – показывает, на сколько величин Э Пример: Сравнить раздельное влияние на сменную добычу углядвух факторов мощности пласта и уровня механизации работ
Э1=1, 180 Э2=0, 340 Таким образом, увеличение мощности пласта и уровня механизации работ на одно
Для построения уравнения регрессии используются функции:
в частности, производственная функция Кобба – Дугласа имеет вид:
Очевидно, перебирая различные функции и выбирая ту из них, для которой остаточная дисперсия и ошибка аппроксимации коэффициента детерминации минимальны. Параметры уравнения оцениваются МНК.
Отметим ещё одну формулу для коэффициента детерминации:
Вместе с тем использование только одного коэффициента детерминации для выбора наилучшего уравнения регрессии может оказаться недостаточным. На практике встречаются случаи, когда плохо определяется модель регрессии и может дать сравнительно высокий коэффициент
из этой формулы следует: чем больше число объясняющих переменных p, тем меньше Очевидно, скорректированный коэффициент может уменьшаться при введении в модель новых объясняющих переменных, не оказывающих существенного влияния на зависимую переменную. Если известен
Частные уравнения регрессии На основе линейного уравнения множественной регрессии
могут быть найдены частные уравнения регрессии:
…
то есть уравнения регрессии, которые связывают результативный признак y с соответствующими факторами x при закреплении других, учитываемых во множественной регрессии на среднем уровне:
…
При подстановке в эти уравнения средних значений соответствующих факторов, они принимают вид парных уравнений линейной регрессии:
…
…
Частные уравнения характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены. Это позволяет на основе частных уравнений определять частные коэффициенты эластичности.
Частные индексы корреляции. В случае, когда имеется одна независимая и одна зависимая переменные, естественной мерой зависимости (в рамках линейного подхода) является (выборочный) коэффициент корреляции между ними. Использование множественной регрессии позволяет обобщить это понятие на случай, когда имеется несколько независимых переменных. Корректировка здесь необходима по следующим очевидным соображениям. Высокое значение коэффициента корреляции между исследуемой зависимой и какой-либо независимой переменной может, как и раньше, означать высокую степень зависимости, но может быть обусловлено и другой причиной. А именно, есть третья переменная, которая оказывает сильное влияние на две первые, что и служит, в конечном счете, причиной их высокой коррелированности. Поэтому возникает естественная задача найти “чистую” корреляцию между двумя переменными, исключив (линейное) влияние других факторов. Рассуждения здесь могут быть такими. Обозначим
остаточную дисперсию. Включим в уравнение регрессии ещё один фактор
Чем меньше доля этого сокращения в остаточной вариации до введения дополнительного фактора, то есть в Следовательно, чистое влияние фактора
аналогично, чистое влияние на результат фактора
Если выразить остаточную дисперсию через показатель детерминации, аналогично,
Преобразуем полученную формулу:
Из приведённых формул частных коэффициентов корреляции, видна связь этих показателей с совокупным коэффициентом корреляции. Зная частные коэффициенты корреляции последовательного первого, второго, и так далее, порядка, совокупный коэффициент корреляции получается.
При полной зависимости результативного признака от исследуемых факторов корреляции, совокупного их влияния, коэффициент корреляции равен единице. Из единицы вычитается доля остаточной вариации результативного признака
Оценка надежности результатов. Так же как и для множественной регрессии, можно сформулировать гипотезы
… … …
В знаменателе В Если Если С помощью частного
|