Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Проверка качества уравнения регрессии. F-критерий Фишера
Как и в случае парной регрессии для оценки качества полученного множественной уравнения регрессии (3) можно использовать коэффициент детерминации, представляющий собой отношение объясненной части D(ŷ) дисперсии переменной у ко всей дисперсии D(y) или , (21) где . Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0 ≤ R2 ≤ 1 и показывает, какая часть дисперсии результативного признака y объяснена уравнением регрессии. Чем выше значение R2, тем лучше данная модель согласуется с данными наблюдений. Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации R2) осуществляется с помощью F-критерия Фишера , (22) где p - число независимых переменных в уравнении регрессии (3). Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза H0 о статистической незначимости уравнения регрессии отвергается при выполнении условия F > Fкрит, где Fкрит определяется по таблицам F-критерия Фишера по двум степеням свободы k1 = p, k2 = n - p - 1 и заданному уровню значимости α. Для оценки тесноты связи факторов с исследуемым признаком, задаваемой построенным уравнением регрессии используется коэффициент множественной корреляции R (23) Коэффициент множественной корреляции R принимает значения в диапазоне 0 ≤ R ≤ 1. Чем ближе величина R к единице, тем теснее данная связь, тем лучше зависимость согласуется с данными наблюдений. При R = 1 (R2 = 1) связь становится функциональной, т. е. соотношение точно выполняется для всех наблюдений. Коэффициент множественной корреляции может использоваться как характеристика качества построенного уравнения регрессии , точности построенной модели. Величина коэффициента множественной корреляции не может быть меньше максимального парного индекса корреляции . В случае линейной зависимости (3) коэффициент корреляции R связан с парными коэффициентами корреляции соотношением , (24) где b i – стандартизованные коэффициенты регрессии (13). Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2. Поэтому при большом количестве факторов предпочтительнее использовать, так называемый, скорректированный, улучшенный (adjusted) коэффициент множественной детерминации , определяемый соотношением , (25) где p – число факторов в уравнении регрессии, n – число наблюдений. Чем больше величина p, тем сильнее различия и R2. При использовании для оценки целесообразности включения фактора в уравнение регрессии следует однако учитывать, что увеличение при включении нового фактора не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t-статистика больше единицы (|t|> 1). При заданном объеме наблюдений и при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель. Отметим, что низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации R2 может быть обусловлено следующими причинами: – в регрессионную модель не включены существенные факторы; – неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель.
|