Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корреляционный и регрессионный анализ как метод изучения и прогнозирования экономических показателейСтр 1 из 3Следующая ⇒
ЦЕЛЬ: Усвоить основные идеи корреляционного анализа и расчета коэффициента корреляции, овладеть методом построения регрессионных уравнений экономических показателей.
Процесс прогнозирования экономических показателей носит вероятностный характер, поэтому при прогнозировании их наибольший эффект дают методы корреляционного и регрессионного анализов. Сначала проведем корреляционный анализ. Предположим, что произведена выборка n значений показателя в ретроспективном периоде (или имеются данные n выборочных наблюдений) и влияющего на него фактора. В результате получен ряд значений признака (y) y1, y2, …, yn и влияющего на него фактора (x) x1, x2, …, xn Корреляционный анализ позволяет количественно оценить тесноту связи между признаком и фактором. Наличие и количественную характеристику связи между признаком и фактором можно определить с помощью оценки коэффициента корреляции R, который вычисляется по формуле: (1) где средние значения х и у вычисляются по формулам: и xi, yi - фактические значения фактора и признака при наблюдении или в год ретроспективного периода; - среднее значение фактора и признака; n - число наблюдений или число лет в ретроспективном периоде. Коэффициент корреляции определяет тесноту связи между x и y и называется линейным коэффициентом корреляции. Величина коэффициента корреляции изменяется -1 _ R _ 1 При R = - 1 или R = 1 имеет место строгая пропорциональность в изменении y и x, при R =0 связь между y и x отсутствует, что обозначает их независимость. Коэффициент корреляции вычисляется по выборочным данным и, как любой другой статистический показатель, может быть определен с некоторой погрешностью. При отсутствии корреляционной связи между признаками коэффициент корреляции в генеральной совокупности равен нулю, однако из-за случайного характера отбора данных выборочный коэффициент корреляции может быть и отличен от нуля. В связи с этим возникает необходимость проверки значимости коэффициента корреляции вычисленного на основании отбора данных. Выборочный коэффициент корреляции считается значимым, если выводы относительно наличия и характера корреляционной связи, сделанные на основании выборки, справедливы и для генеральной совокупности. Рассмотрим способы оценки значимости коэффициента корреляции. Каждому значению коэффициента корреляции соответствует случайная величина t, подчиненная распределению Стьюдента с К = n - 2 степенями свободы,
Вычисленное по этой формуле значение t сравнивают с критическим значением tk, a, которое находят по таблице распределения Стьюдента при заданных уровне значимости и числе степеней свободы К. Если , то различие между выборочным коэффициентом корреляции и коэффициентом корреляции r, равным нулю, незначимо, а отличие от нуля r объясняется случайным характером отбора данных. В практических расчетах уровень значимости a принимают равным 0, 05. Значения статистики Стьюдента при a = 0, 05 в зависимости от числа степеней свободы К приведены в таблице 1.
Таблица 1 – Распределение Стьюдента при a = 0, 05
Затем производится регрессионный анализ. Он состоит из трех этапов: 1) логического анализа; 2) графического анализа; 3) определения уравнения теоретической линии регрессии, т.е. установления функциональной зависимости между признаком и фактором. При логическом анализе эмпирических данных экономического показателя и значений влияющего на него фактора в ретроспективном периоде можно сделать некоторые предположения относительно наличия и направления связи между признаком и фактором. На этапе графического анализа числовые значения фактора (xi) откладываются на оси абсцисс, а значение признака (yi)- на оси ординат. Точки на графике, соответствующие каждой паре значений xi и yi, образуют поле корреляции. По характеру расположения точек можно судить о направлении и форме связи. Соединив последовательно точки на плоскости, получим ломаную линию, называемую эмпирической линией регрессии. По ее виду можно предположить тип теоретической линии регрессии. Экономико-математические модели прогноза строятся в виде уравнений регрессии, в которых в качестве зависимой переменной величины (функции) выступает экономический показатель, в качестве независимых переменных (аргументов) - формирующие его факторы. Рассмотрим случай, когда экономический показатель зависит от одного фактора. Функция в таком случае называется однофакторной, а уравнение регрессии - парной регрессией. Процесс нахождения теоретической линии регрессии заключается в выборе и обосновании типа кривой и расчете параметров ее уравнения. Теоретическая линия регрессии представляется в виде прямой либо плавной кривой, выражающейся математическим уравнением того или иного типа. Наиболее распространенные математические формы связи результативного у и факторного х признаков следующие:
После выбора формы связи, рассчитываем параметры теоретического уравнения регрессии. Способ расчета параметров теоретического уравнения регрессии основан на требовании максимальной близости ее к эмпирической линии регрессии. Для отыскания параметров используем метод наименьших квадратов, который основан на том, что из множества зависимостей вида у = f(x) наилучшим образом приближающейся к эмпирической линии регрессии является та, для которой сумма квадратов отклонений фактических значений признака от вычисленных по этому уравнению является наименьшей. При линейной математической форме связи неизвестные коэффициенты и определяются из решения системы уравнений:
(2)
Решение этой системы: (3)
Для гиперболической зависимости система нормальных уравнений имеет вид:
(4)
Для параболической зависимости система из 3-х уравнений имеет вид:
(5)
Для показательной регрессии параметры находятся из решения системы из 2-х уравнений:
(6)
Для логарифмической регрессии решается система из следующих уравнений (7) для нахождения её параметров
(7)
Системы (2), (4-7) можно решать способом алгебраического сложения, подстановки, методом Гаусса, Жордана - Гаусса, Крамера. Если уравнение регрессии определяется в виде экспоненциальной или степенной зависимости, то путем замены и логарифмирования приводят ее к линейному виду и для линеаризованной функции используют систему нормальных уравнений вида (2) Параметры экспоненциальной регрессии находят по формулам:
(8) y
- степенной
(9)
Оценку степени близости полученной экономико-математической модели к фактическим данным можно определить по корреляционному отношению:
(10) Ошибка уравнения регрессии, показывающая в среднем отклонения фактических данных от теоретических, равна: (11) где n-m - число степеней свободы; m - число определяемых в уравнении регрессии параметров. Среднеквадратическое отклонение уравнения регрессии определяет меру близости эмпирических данных yi с ji теоретическими, найденным по уравнению регрессии. Оценивается значимость уравнения регрессии. В связи с этим высказывается гипотеза, что все коэффициенты регрессии, кроме равны нулю (эта гипотеза называется нулевой и обозначается H0)/ Проверка гипотезы H0 осуществляется с помощью статистики Фишера: (12) где Q, Qост - сумма квадратов отклонений результативного признака соответственно от среднего значения и от условного среднего (х1, х2,..., хn); K1 = m; K2=n-m-1. При заданном уровне значимости a для степеней свободы К1 и К2 по таблице F - распределения Фишера находят критическое значение F (К1, К2, a) и сравнивают его с расчетным, определенным по формуле (12). Если FVF (K!, K2, a) то гипотезу H0 об одновременном равенстве нулю всех коэффициентов регрессии отвергают и уравнение регрессии считают значимым. Если же F_F (K1, K2 a), то уравнение регрессии считают незначимым, т.е. отвергается влияние факторных признаков х1, х2,... хm на результативный. В практике статистических расчетов уровень значимости a принимают равным 0, 05. Это значит, что при F = F (К1, К2, a) вероятность того, что гипотеза Н0 справедлива, составляет 0, 05; при F> F (К1, К2, a) все коэффициенты регрессии могут иметь нулевые значения с вероятностью, меньшей 0, 05. Если же F< F (К1, К2, a), то вероятность справедливости нулевой гипотезы становится больше 0, 05 и ею уже нельзя пренебрегать. Значения F (К1, К2, a) при a= 0, 05 приведены в таблице 2. Таблица 2 – Распределение Фишера при a = 0, 05
Уравнение регрессии позволяет установить характер влияния факторных признаков на результативный. По знаку коэффициента регрессии определяется направление влияния признака на результативный признак: положительный знак указывает на возрастание исследуемой величины при увеличении фактора отрицательный - на ее уменьшение. Абсолютное значение коэффициента регрессии показывает, насколько единиц увеличится (уменьшится) результативный признак при увеличении факторного на единицу. С помощью полученного уравнения регрессии можно определить выровненные значения показателя в ретроспективном периоде, подставив фактические значения x в уравнение регрессии. Прогноз показателя осуществляется следующим образом: в найденную функцию подставляют задаваемые значения фактора в прогнозируемом периоде и получают планируемую величину показателя. Если имеется динамический ряд изменения экономического показателя, то процесс прогнозирования можно изобразить, как показано на рис.1. Пусть уравнение связи y = f(t) Y Аппроксимация Экстраполяция
0 1 2 n n+1 n+k t Рис. 1. Процесс прогнозирования
эмпирическая линия регресии; теоретическая линия регресии; k - длина планируемого периода.
|