![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Модель парной линейной регрессии
Уравнение парной (простой) регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем в целом по совокупности наблюдений. В каждом отдельном случае величина y складывается из двух слагаемых:
где yi – фактическое значение i –го наблюдения результативного показателя,
Под простой регрессией мы понимаем одностороннюю стохастическую зависимость результативной переменной только от одного фактора:
Если исходя из соображений профессионально-теоретического характера в сочетании с исследованием расположения точек на диаграмме рассеяния предполагается линейный характер зависимости, то эту зависимость выражают с помощью функции линейной регрессии:
Это общее уравнение для простой линейной регрессии. Неизвестные параметры регрессии a и b подлежат оценке по определенной процедуре. Будем называть a – постоянная регрессии. Параметр a определяет точку пересечения прямой регрессии с осью ординат (рис. 4.1.1). Коэффициент b будем называть коэффициентом регрессии. Если через a обозначить угол, которая прямая регрессии образует с осью абсцисс, то b= tga (рис.4.1.1). Классический подход к оцениванию параметров линейной регрессии, как указывалось в разделе 4.1.2, основан на методе наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного показателя y от расчетных значений
Поскольку Аналитически условие (4.1.6) означает, что находится минимум функции
Преобразуя последнюю систему, получим следующую систему нормальных уравнений для оценки параметров a и b:
Решая данную систему, находим искомые оценки параметров:
Чтобы более четко представлять методику расчета коэффициентов регрессии, статистических характеристик и их интерпретацию, представляется целесообразным первоначально провести расчеты в ручном режиме с использованием приведенных в разделе формул. В этой связи может оказаться полезной рабочая таблица 4.1.2, где представлены расчеты на данных примера 4.1.1. Таблица 4.1.2 Схема рабочей таблицы вычисления оценок параметров уравнения регрессии
Применяя формулы (4.1.7) и (4.1.8) к примеру 4.1.1, получим:
Запишем уравнение регрессии:
Отсюда становится очевидной экономическая интерпретация расчетных значений Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции
где
Формула (4.1.11) часто используется в рабочих расчетах
Как известно, линейный коэффициент корреляции находится в границах: Для данных примера 4.1.1 величина линейного коэффициента корреляции составила: Коэффициент рассчитан с использованием рабочей таблицы 4.1.2. Полученный коэффициент больше 0, 7, что означает наличие зависимости объемов производства и инвестиций. О степени тесноты связи между показателями можно судить и по диаграмме рассеяния — по ширине разброса точек. Если точки расположены близко друг к другу в виде узкой полоски, то можно утверждать о наличии относительно тесной связи. Если точки разбросаны широко по диаграмме, то имеется слабая связь. Следует иметь ввиду, что величина линейного коэффициента корреляции оценивает тесноту связи рассматриваемых показателей в ее линейной форме. Поэтому близость абсолютной величины линейного коэффициента корреляции к нулю еще не означает отсутствие связи между показателями. При иной спецификации модели связь может оказаться достаточно тесной. Для оценки качества подбора линейной функции рассчитывается коэффициент детерминации, которыйхарактеризует долю дисперсии результативного показателя y, объясняемую регрессией, в общей дисперсии результативного показателя. В такой интерпретации коэффициент детерминации характеризует, в какой степени разброс значений y вокруг средней Среди различных формул расчета данного коэффициента выделим следующие формулы:
Формула (4.1.13) для расчета В примере 4.1.1:
Это означает, что рассмотрение только одного фактора — инвестиций, влияющего на объем производства, недостаточно: требуется введение в модель дополнительного фактора. Качество подбора функции регрессии в экономическом анализе обычно оценивают с помощью стандартных ошибок или дисперсий остатков Стандартная ошибка уравнения регрессии S характеризует остаточную сумму квадратов отклонений
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров a и b определяется его стандартная ошибка
Для нашего примера 4.1.1 величины стандартных ошибок составили соответственно: S=
Значения стандартных ошибок получены с использованием рабочей таблицы 4.1.2. Величина стандартных ошибок совместно с t-распределением Стьюдента при (n-2) степенях свободы применяется для проверки статистической значимости коэффициента регрессии. С этой целью формулируется гипотеза о статистической значимости коэффициента регрессии следующим образом: Нулевая гипотеза — Альтернативная гипотеза — В том случае, если H0 принимается, то есть основания считать, параметр регрессии b статистически незначим. При отклонении нулевой гипотезы коэффициент регрессии статистически значим. В данном случае рассматривается двусторонняя критическая область, т.к. важным является отличие от нуля коэффициента регрессии, а сам коэффициент может быть как положительным, так и отрицательным. Для оценки статистической значимости коэффициента регрессии b (a) его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t-статистики В рассматриваемом примере фактические значения t-критерия для коэффициентов регрессии составили:
При a=0, 05(для двустороннего критерия) и числе степеней свободы 10 табличное значение При оценке значимости коэффициента регрессии на начальном этапе можно использовать «грубое» правило, позволяющее не прибегать к таблицам: если Таким образом проверка гипотез о значимости коэффициентов регрессии равносильна проверке статистической значимости регрессора и, следовательно, желательности включения его в модель. Удобно уравнение регрессии с набором диагностических тестов записывать в следующем виде:
Оценивая построенную регрессию в целом, можно заключить, что введенный в модель фактор (инвестиции) является статистически значимым (т.к. t-статистика коэффициента регрессии больше 3), однако одного фактора недостаточно для объяснения колебаний результативного показателя – объем производства. Вполне возможно, что неадекватной является форма связи между показателями, т.к. по небольшому количеству точек на диаграмме рассеяния достаточно сложно установить наилучшую форму связи. Вначале попробуем улучшить характеристики модели (4.1.16) за счет изменения формы связи.
Пример 4.1.2. Для данных примера 4.1.1. построить регрессионные модели по нелинейным формам связи. Решение. 1) Рассчитаем параметры степенной функции Далее проводим логарифмическое преобразование исходных рядов наблюдений:
И к уже преобразованным данным применяем формулы (4.1.7)-(4.1.15) для расчета параметров регрессии и статистических характеристик. В результате расчетов получаем следующую регрессионную модель:
Выполнив потенцирование, находим вид искомой функции: 2) Построению показательной функции
После расчета характеристик и параметров для таким образом преобразованных рядов, получаем:
Выполнив потенцирование, находим вид искомой функции: 3) Уравнение равносторонней гиперболы
Используя формулы (4.1.7) – (4.1.15), получаем следующую регрессионную модель:
Сравнивая статистические характеристики нелинейных регрессий, заключаем, что за счет изменения формы связи нам не удалось увеличить коэффициент детерминации. Коэффициенты по всем формам связи ниже критического уровня 0, 7. В следующем параграфе мы попробуем улучшить характеристики модели за счет введения в нее дополнительного фактора. Оценивая линейное уравнение регрессии, мы предполагаем выполнимость предпосылок МНК. Для получения по МНК наилучших результатов необходимо, чтобы выполнялся ряд предпосылок относительно остатков ei. В параграфе 4.1.2 представлена математическая формулировка этих предпосылок. Исследование поведения остатков актуально при построении регрессии на временных рядах, где последовательность наблюдений имеет существенное значение и вероятность зависимости остатков наиболее высока. При построении регрессионной модели на пространственных данных последовательность наблюдений не имеет значения, поэтому в данном случае анализ остатков не проводится. Характерной особенностью линейной регрессии Несложно доказать, что коэффициент парной регрессии b указывает среднюю величину изменения переменной y при изменении фактора х на одну единицу. Параметр b представляет собой абсолютное усредненное на данных ретропериода изменение результативного показателя при изменении фактора на одну единицу, коэффициент парной регрессии имеет единицу измерения – отношение размерности зависимой переменной к размерности фактора. В представленной интерпретации прослеживается тесная зависимость коэффициента парной регрессии и среднего за наблюдаемый период коэффициента эластичности. Напомним, что последний характеризует на сколько процентов изменится результативный показатель y при изменении фактора х на 1% и рассчитывается по формуле:
При построении регрессионной модели для целей прогнозирования особое значение имеет знак коэффициента парной регрессии: знак «+» указывает на прямую зависимость y и x ( с увеличением значение факторавозрастает и значение результативного показателя), знак “-“ характеризует обратную зависимость показателей. Важным представляется обоснованность описанного уравнением характера связи с точки зрения экономической теории. Если полученная зависимость сомнительна, то от данного уравнения, даже несмотря на его удовлетворительные статистические характеристики, лучше отказаться: на прогнозный период имеет смысл распространять зависимости, не противоречащие основным положениям экономической теории. В примере 4.1.1 b =2, 16 указывает, что при увеличении инвестиций на 1 тыс. у.е. объем производства увеличивается на 2, 16 тыс.шт. С помощью уравнения регрессии можно решать не только задачи анализа, но и прогнозирования. При этом информация, представленная регрессионной моделью, может использоваться в разных способах прогноза. Представим эти способы на данных примера 4.1.1. Вообще говоря, использование модели (4.1.16) для прогноза не является корректным в силу низкого коэффициента детерминации. В данном случае использование модели носит в большей мере демонстративный характер. Пусть задача прогнозирования формулируется следующим образом.
Пример 4.1.3. По группе однородных предприятий исследована зависимость между объемами производства и инвестициями, которая описывается регрессионной моделью вида Решение задачи 4.1.3. (с пособ 1 — на основе уравнения регрессии). Самый простой способ прогноза предполагает подстановку значений фактора на прогнозный период в уравнение регрессии:
Ответ. Если условия производства на предприятии не изменятся, то при объеме инвестиций 20 тыс. у.е. объем производства составит 59, 4 тыс.шт.
Отметим, что при получении решения мы использовали постоянную регрессии, уровень статистической значимости которой неудовлетворительный. Поэтому имеет смысл воспользоваться способом прогнозирования, который не использует постоянную регрессии, а ориентируется на экономический смысл параметра регрессии.
Решение задачи 4.1.3. (способ 2 — с использованием экономического смысла параметра регрессии). Исходя из отчетных данных предприятия, можно найти ожидаемый прирост инвестиций в прогнозном периоде Решение задачи 4.1.3. (способ 3 — с использованием коэффициента эластичности). Рассчитаем средние значения инвестиций и объема производства в представленной выборке предприятий (см. рабочую табл.4.1.2):
Выбор способа прогнозирования в каждом конкретном случае определяется пользователем исходя из его опыта прогнозирования. Если конкретные соображения по поводу способа прогнозирования отсутствуют, то можно взять среднюю по всем способам прогнозирования. В нашем примере мы более склоняемся к выбору второго или третьего способа прогнозирования в силу статистической незначимости параметра а, тем более, что прогнозные значения по последним вариантам практически совпадают. Отметим, что в практике прогнозирования наиболее часто предпочтение отдается линейной регрессии в силу экономической интерпретируемости параметров регрессии и возможности, по этой причине, экспертной корректировке параметра в силу изменений в прогнозном периоде условий экономической конъюнктуры. Экономической интерпретации поддаются параметры некоторых нелинейных форм связи. Пусть экономическая зависимость моделируется степенной формой связи
Наиболее часто степенная форма связи используется при описании функций спроса на товары и услуги, а также при описании производственных функций. Поддаются экономической интерпретации параметры полулогарифмических функций. Функции вида Логлинейная модель
Отсюда ясен экономический смысл параметра регрессии b, который показывает относительное изменение зависимого показателя y при абсолютном приросте независимого показателя x на единицу. Линейнологарифмическая модель
Отсюда ясен экономический смысл параметра регрессии b, который показывает абсолютное изменение зависимого показателя y при приросте независимого показателя x на 1 %.
|