![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Линейная парная регрессия.
Наиболее простой с точки зрения понимания, интерпретации и техники расчетов является линейная форма регрессии. Уравнение линейной парной регрессии a0, a1– параметры модели, ε i – случайная величина (величина остатка). Параметры модели и их содержание: Ø a0 – свободный коэффициент (член) регрессионного уравнения. Не имеет экономическою смысла и показывает значение результативного признака y, если факторный признак x =0. Ø a1 - коэффициент регрессии показывает, на какую величину в среднем изменится результативный признак y, если переменную х увеличить на единицу измерения. Знак при коэффициенте регрессии показывает направление связи: при a1 > 0 – связь прямая; при a1 < 0 - связь обратная. Ø ε i- независимая, нормально распределенная случайная величина. Отражает тот факт, что изменение y будет неточно описываться изменением x, так как присутствуют другие факторы, не учтенные в данной модели.
Оценка параметров модели а0 и а, осуществляется методом наименьших квадратов. Система нормальных уравнений для нахождения параметра линейной парной регрессии методом наименьших квадратов Формулы для определения значения параметров a0 и a1
Ковариацияпризнаков характеризует сопряженность вариации двух признаков и представляет собой статистическую меру взаимодействия двух случайных переменных.
Дисперсия – характеристика случайной величины, определяемая как математическое ожидание квадрата отклонения случайной величины от ее математического ожидания. Математическое ожидание – сумма произведений значений случайной величины на соответствующие вероятности.
Уравнение регрессии дополняется показателем тесноты связи между признаками - линейным коэффициентом корреляции
Коэффициент корреляции принимает значение от -1 до +1. Положительное значение коэффициента свидетельствует о наличии прямой связи, отрицательное значение — обратной. Если rух = ±1, корреляционная связь представляется линейной функциональной зависимостью. При rух = 0 линейная корреляционная связь отсутствует. Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции
где
Соответственно величина
Оценка значимости уравнения регрессии в целом производится на основе В случае парной линейной регрессии значимость модели регрессии определяется по следующей формуле: Если при заданном уровне значимости расчетное значение F -критерия с γ 1=k, γ 2=(п – k – 1) степенями свободы больше табличного, то модель считается значимой, гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Для оценки статистической значимости коэффициентов регрессии и корреляции производят расчет Порядок расчетов: 1. Расчет случайных ошибок параметров линейной регрессии и коэффициента корреляции
2. Расчет фактических значений t-статистик
Расчетные значения t-критерия сравнивают с табличным значением критерия t α γ ,.которое определяется при (n — k — 1) степенях свободы и соответствующем уровне значимости α. Если расчетное значение t -критерия превосходит его табличное значение t α γ , то параметр признается значимым.
В качестве меры точности модели применяют точностные характеристики: Для определения меры точности модели рассчитывают: Ø максимальная ошибка - соответствует отклонению расчетному отклонению расчетных значений от фактических Ø средняя абсолютная ошибка – ошибка показывает, насколько в среднем отклоняются фактические значения от модели Ø дисперсия ряда остатков (остаточная дисперсия) Ø средняя квадратическая ошибка. Представляет собой корень квадратный из дисперсии, чем меньше значение ошибки, тем точнее модель Ø средняя относительная ошибка аппроксимации. Средняя ошибка аппроксимации не должна превышать 8–10%. Если модель регрессии признана адекватной, а параметры модели значимы, то переходят к построению прогноза. Прогнозируемое значение переменной у получается при подстановке в уравнение регрессии ожидаемой величины независимой переменной х прогн. Данный прогноз называется точечным. Вероятность реализации точечного прогноза практически равна нулю, поэтому рассчитывается доверительный интервал прогноза с большой надежностью. Доверительные интервалы прогноза зависят от стандартной ошибки, удаления х прогн от своего среднего значения
t табл – определяется по таблице распределения Стьюдента для уровня значимости α и числа степеней свободы γ =n-k-1. Пример13. По данным проведенного опроса восьми групп семей известны данные связи расходов населения на продукты питания с уровнем доходов семьи
Решение: Предположим, что связь между доходами семьи и расходами на продукты питания линейная. Для подтверждения нашего предположения построим поле корреляции. Для удобства дальнейших вычислений составим таблицу 37. Рассчитаем параметры линейного уравнения парной регрессии
Уравнение регрессии: Т.е. с увеличением дохода семьи на 1000 руб. расходы на питание увеличиваются на 168 руб. Расчет линейного коэффициента корреляции Близость коэффициента корреляции к 1 указывает на тесную линейную связь между признаками.
Расчет коэффициента детерминации Коэффициент детерминации Оценим качество уравнения регрессии в целом с помощью
Табличное значение ( Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитаем Фактические значения Табличное значение Рассчитываем среднюю ошибку аппроксимации:
Рассчитываем прогнозное значение результативного фактора
Значит, если доходы семьи составят 9, 845 тыс. руб., то расходы на питание будут 2, 490 тыс. руб. Рассчитываем доверительный интервал прогноза.
|