![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Матричная форма записи
В матричной форме модель парной регрессии имеет вид:
где Y - вектор-столбец размерности Х – матрица размерности
.Решение системы нормальных уравнений в матричной форме имеет вид:
Пример 1. Бюджетное обследование семи случайно выбранных семей дало следующие результаты (в тыс. $): Табл. 3.2..
Требуется: 1) построить однофакторную модель регрессии 2) отобразить на графике исходные данные, результаты моделирования.
Решение 1) Для вычисления параметров модели следует воспользоваться формулами (3.7) и (3.8). Промежуточные расчеты приведены в таблице 3.3. Табл. 3.3.
Построена модель зависимости накопления от дохода:
Рисунок 3.2 График модели парной регрессии.
Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков - После построения уравнения регрессии мы можем разбить значение у, в каждом наблюдении на две составляющих -
Остаток На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от теоретических ( При анализе качества модели регрессии используется основное положение дисперсионного анализа [6], согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения
где Разделив правую и левую часть (3.11) на
получим
Коэффициент детерминации определяется следующим образом:
Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т. е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции) R
R = Данный коэффициент является универсальным, так как он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. При построении однофакторной модели он равен коэффициенту линейной корреляции Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным. Также для оценки точности регрессионных моделей целесообразно использовать среднюю относительную ошибку аппроксимации:
Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше средняя ошибка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели. После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров. Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипотезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несмещенной дисперсии остаточной компоненты. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой. Для модели парной регрессии:
В качестве меры точности применяют несмещенную оценку дисперсии остаточной компоненты, которая представляет собой отношение суммы квадратов уровней остаточной компоненты к величине (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины (
Для модели парной регрессии
Анализ статистической значимости параметров модели парной регрессии Значения Надежность получаемых оценок
где
Проверка значимости отдельных коэффициентов регрессии связана с определением расчетных значений t-критерия (t–статистики) для соответствующих коэффициентов регрессии:
Затем расчетные значения Если расчетное значение t-критерия с (n - 2) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).
Интервальная оценка параметров модели Для значимого уравнения регрессии представляет интерес построение интервальных оценок для параметра
свободного члена где t табл определяется по таблице распределения Стьюдента для уровня значимости a и числа степеней свободы k = n - 2;
n – число наблюдений.
Прогнозирование с применением уравнения регрессии Регрессионные модели могут быть использованы для прогнозирования возможных ожидаемых значений зависимой переменной. Прогнозируемое значение переменной
ожидаемой величины фактора Вероятность реализации точечного прогноза теоретически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надежностью. доверительные интервалы, зависят от стандартной ошибки (3.16), удаления
Пример 2. Используя данные примера 3.1, оценить накопления семьи, имеющей доход 42 тыс. $ и отобразить на графике исходные данные, результаты моделирования и прогнозирования. Решение В примере1. была построена модель зависимости накопления от дохода:
Для того, чтобы определить накопления семьи при доходе 42 тыс.$ необходимо подставить значение хпрогн в полученную модель. yпрогноз = - 2.184+0.143*42= 3.827 Величину отклонения от линии регрессии вычисляют по формуле
Табл. 3.4.
Коэффициент Стьюдента U(x=42, n=7, a=0.1) = = Таким образом, прогнозное значение График исходных данных и результаты моделирования приведены на рисунке 3.5 Рисунок 3.5. График модели парной регрессии зависимости накопления от дохода.
|