Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Построение модели парной регрессии






Линейная регрессия находит широкое применение в эконометрике ввиду четкой экономической интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида:

или

Уравнение позволяет по заданным значениям фактора x иметь теоретические значения результативного признака подстановкой в него фактических значений фактора x.

Расчет параметров уравнения линейной регрессии.

Таблица 1. Исходные данные.

  t Уровень безработицы, % ВВП, в млрд.руб
    Y Х
    10, 6 7305, 6
    9, 0 8943, 6
    7, 9 10830, 5
    8, 2 13208, 2
    7, 8 17027, 2
    7, 1 21609, 8
    7, 1 26917, 2
    6, 0 33247, 5
    6, 2 41276, 8
    8, 3 38807, 2
    7, 3 46308, 5
    6, 5 55644, 0
    5, 5 61810, 8
    5, 5 66689, 1

Примечание: Данные граф 3, 4 взяты из статистики Госкомстат и Статинфо.

 

С помощью табличного процессора Excel, вычислим коэффициенты модели парной регрессии и проверим значимость уравнения регрессии (таблица 2).

 

Таблица 2. Уравнение регрессии y = a + bx

Регрессионная статистика
Множественный R 0, 79108027
R-квадрат 0, 85994365
Нормированный R-квадрат 0, 594625327
Стандартная ошибка 0, 904808628
Наблюдения  

 

 

Дисперсионный анализ          
  df SS MS F Значимость F
Регрессия   16, 43014187 16, 43014187 20, 06909769 0, 000752611
Остаток   9, 824143841 0, 818678653    
Итого   26, 25428571      

 

 

  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение 9, 146954439 0, 467008408 19, 586273552 0, 000000000178
Переменная X1 -0, 000055729 0, 000012440 -4, 479854651 0, 000752611

Примечание: режим регрессия, пакет анализа Microsoft Excel

 

С помощью СТЬЮДРАСПОБР tкр, tкр= 2, 144. Сравнивая значения t- статистики с рассчитанным критерием, получаем: значение всех переменных (X= -4, 48) по модулю больше чем tкр= 2, 144, а значит, фактор значим. Итоговое уравнение имеет вид:

Y= 9, 14695 – 0, 00006X.

Коэффициент этого уравнения показывает, что снижение ВВП способствует снижению уровня безработицы.

Далее следует выявить значимость выбранного фактора. Для этого следует определить адекватность построенной модели.

Рассмотрим коэффициент детерминации . Данный коэффициент показывает долю полной вариации объясняемой переменной, она детерминирована объясняющими переменными. Для полученной нами регрессии коэффициент детерминации это означает что модель примерно на 86% раскрывает степень влияния фактора, то есть модель имеет высокую значимость.

Коэффициент множественной регрессии R=0, 93, он показывает тесноту связи зависимой переменной (уровень безработицы) с объясняющим фактором, входящим в модель регрессии.

Далее оценим адекватность модели по F-критерию Фишера. Для этого воспользуемся функцией FРАСПОБР в программе Microsoft Excel. Получаем , =4, 75. Получаем что табличное значение меньше, следовательно, модель адекватна и пригодна для использования.

Найдем среднюю ошибку аппроксимации. Средняя ошибка аппроксимации – это среднее отклонение расчетных значений от фактических. Для этого воспользуемся остатками модели

Таблица 3. Вывод остатков

ВЫВОД ОСТАТКА      
       
Наблюдение Предсказанное Y Остатки Стандартные остатки
  8, 739815768 1, 860184232 2, 13983496
  8, 64853471 0, 35146529 0, 404302812
  8, 543376129 -0, 643376129 -0, 740098056
  8, 410868605 -0, 210868605 -0, 242569529
  8, 19804074 -0, 39804074 -0, 45788018
  7, 94265699 -0, 84265699 -0, 969337798
  7, 646877219 -0, 546877219 -0, 629091986
  7, 29409327 -1, 29409327 -1, 488640734
  6, 846623869 -0, 646623869 -0, 743834045
  6, 984254694 1, 315745306 1, 513547828
  6, 566211116 0, 733788884 0, 844103009
  6, 045951383 0, 454048617 0, 522307999
  5, 702278662 -0, 202278662 -0, 232688217
  5, 430416845 0, 069583155 0, 080043936

Примечание: режим регрессия, пакет анализа Microsoft Excel

 

 

Таблица 4. Расчетная таблица для вычисления средней ошибки аппроксимации.

t Уровень безработицы, % ВВП, в млрд.руб
  Y Х        
  10, 6 7305, 6 8, 739816 1, 9 1, 9 0, 179245
  9, 0 8943, 6 8, 648535 0, 4 0, 4 0, 044444
  7, 9 10830, 5 8, 543376 -0, 6 0, 6 0, 055949
  8, 2 13208, 2 8, 410869 0, 2 0, 2 0, 02439
  7, 8 17027, 2 8, 198041 -0, 4 0, 4 0, 051282
  7, 1 21609, 8 7, 942657 -0, 8 0, 8 0, 012676
  7, 1 26917, 2 7, 646877 -0, 5 0, 5 0, 070423
  6, 0 33247, 5 7, 294093 -1, 3 1, 3 0, 016667
  6, 2 41276, 8 6, 846624 -0, 6 0, 6 0, 096774
  8, 3 38807, 2 6, 984255 1, 3 1, 3 0, 156627
  7, 3 46308, 5 6, 566211 0, 7 0, 7 0, 09589
  6, 5 55644, 0 6, 045951 0, 5 0, 5 0, 076923
  5, 5 61810, 8 5, 702279 -0, 2 0, 2 0, 036364
  5, 5 66689, 1 5, 430417 0, 1 0, 1 0, 018182

Примечание: данные графы 2, 3 взяты из статистики Госкомстат и Статинфо; данные графы 4 предсказанное Y из таблицы 3; данные графы 5 получены путем вычитания из графы 2 графу 5; данные графы 6 это данные графы 5 по модулю; данные графы 7 получены путем деления графы 6 на графу 2.

 

Таким образом, по формуле (2.22), получаем

Поскольку ошибка меньше 10%, то можно говорить о хорошем подборе модели к исходным данным.

Проанализируем уравнение регрессии полностью, то есть проверим выполняются ли предпосылки метода наименьших квадратов (МНК).

Исследование остатков предполагает проверку присутствие следующих пяти предпосылок МНК:

§ случайный характер остатков;

§ нулевая средняя величина остатков, не зависящая от ;

§ гомоскедастичность – дисперсия каждого отклонения одинакова для всех значений

§ отсутствие автокорреляции остатков – значения распределены независимо друг от друга;

§ остатки подчинены нормальному распределению.

Для анализа используем таблицу 3.

Остатки исследуемого тренда образуют S= 5 серии, уровень значимости равен 0, 05. В таблице «Критерии значения для количества серий» находим критические значения (Таблицы, стр. 354). Получаем, что , следовательно, аналитическая форма модели выбрана удачно.

Определим случайный характер остатков. Построим график отклонений фактических значений от теоретических значений признака.

 

Рисунок 3.1. Фактические и теоретические значения уровня безработицы в Российской Федерации с 2000 по 2013 гг.

На рис. 3.1 показано как построенная модель парной регрессии аппроксимирует уровень безработицы в Российской Федерации с 2000 по 2013 года.

Рисунок 3.2 График остатков.

На рисунке 3.2 показан график остатков, получена горизонтальная полоса, которая показывает, что остатки представляют собой случайные величины и применение МНК оправдано.

Далее нужно определить присутствие зависимости остатков от . Рассмотрим нулевую величину остатков, которая не зависит от . В качестве критерия рассмотрим статистику:

где – среднее арифметическое остатков – стандартное отклонение.

Рассчитаем критерий t-теста Стьюдента для m=n-1, m=14-1=13 степеней свободы и для уровня значимости 0, 05. Определим с помощью функции СТЬЮДРАСПОБР в Microsoft Excel. Если I* I, то математическое ожидание случайных отклонений несущественно отличается от 0, то есть отклонение признается несмещенным. В противно случае мат ожидание отличается от 0, значит отклонение признается смещенным. Так как модель линейная и построена по МНК, то значит и I тоже равно 0. Получились такие результаты: I*= 2, 160, значит I* является критическим значением. Получается, что I* I, то есть отклонение несмещенное.

Далее проверим отсутствие автокорреляции остатков с помощью критерия Дарбина – Уотсона в нашем случае.

 

Таблица 5. Вспомогательная таблица для вычисления критерия Дарбина-Уотсона

t Y
  10, 6 8, 739815768 1, 860184 - - 3, 460285
  9, 0 8, 64853471 0, 351465 -1, 50872 2, 2762328 0, 123528
  7, 9 8, 543376129 -0, 64338 -0, 99484 0, 9897094 0, 413933
  8, 2 8, 410868605 -0, 21087 0, 432508 0, 1870628 0, 044466
  7, 8 8, 19804074 -0, 39804 -0, 18717 0, 0350334 0, 158436
  7, 1 7, 94265699 -0, 84266 -0, 44462 0, 1976836 0, 710071
  7, 1 7, 646877219 -0, 54688 0, 29578 0, 0874857 0, 299075
  6, 0 7, 29409327 -1, 29409 -0, 74722 0, 5583318 1, 674677
  6, 2 6, 846623869 -0, 64662 0, 647469 0, 4192166 0, 418122
  8, 3 6, 984254694 1, 315745 1, 962369 3, 8508928 1, 731186
  7, 3 6, 566211116 0, 733789 -0, 58196 0, 3386733 0, 538446
  6, 5 6, 045951383 0, 454049 -0, 27974 0, 0782546 0, 20616
  5, 5 5, 702278662 -0, 20228 -0, 65633 0, 4307655 0, 040917
  5, 5 5, 430416845 0, 069583 0, 271862 0, 0739088 0, 004842
Итого         9, 5232512 9, 824144

Примечание: данные графы 2 взяты из статистики Госкомстат и Статинфо; данные графы 2 это предсказанное Y взяты из таблицы 3; данные графы 4 остатки взяты из таблицы 3; данные графы 5 получены путем вычитания из последующего значения предыдущего; данные графы 6 получены путем возведения в квадрат графы 5; данные графы 7 получены путем возведения в квадрат графы 4.

Таким образом, получаем из (2.27), что .

Из таблицы «Значения статистики Дарбина-Уотсона» [Елисеева стр. 566] определим критические значения критерия Дарбина-Уотсона 1, 05 и для заданного числа наблюдений 14 и числа независимых переменных модели равного 1, уровня значимости α =0, 05.

Получаем, что 1, 34< 0, 97< -0, 34, это говорит о том, что нет оснований отклонять гипотезу об отсутствии автокорреляции в остатках.

Проверим наличие гетероскедастичности в остатках регрессии с помощью рангового коэффициента Спирмена. Суть этой проверки заключается в том, что в случае гетероскедастичности абсолютные остатки коррелированы со значением фактора . В таблице 6 показан расчет рангового коэффициента Спирмена.

 

 

Таблица 6. Расчет рангового коэффициента корреляции Спирмена.

     
     
     
     
     
     
     
     
     
     
     
     
     
     
Итого    

Примечание: данные графы 2 получены путем ранжирования от большего к меньшему графы 4 таблицы 1; данные графы 3 получены путем ранжирования значений, взятых по модулю от меньшего к большему графы 4 таблицы 2.

 

После присвоения х рангов (табл. 6), нужно найти абсолютные разности между ними, возвести их в квадрат и просуммировать, затем полученные значения подставить в формулу (2.25) для расчета коэффициента ранговой корреляции Спирмена по каждому фактору.

 

 

Таблица 7. Расчет коэффициента ранговой корреляции Спирмена.

     
     
     
  -2  
     
     
     
  -5  
  -1  
     
  -5  
  -4  
  -3  
  -13  
Итого    

Примечание: данные графы 2 получены путем вычитания из графы 3 таблицы 6 графы 2 таблицы 6; данные графы 3 получены путем возведения в квадрат графы 2.

 

Коэффициент ранговой корреляции Спирмена для Х равен:

Статистическую значимость коэффициента можно определить с помощью t-критерия (2.26).

Таким образом, получаем:

Далее сравним эту величину с табличной величиной, рассчитанной с помощью функции в Microsoft Exel СТЬЮДРАСПОБР при α =0, 05 и числе степеней свободы n=2=14-2=12;

Получается что, , тогда принимается гипотеза об отсутствии гетероскедастичности остатков.

Далее исследуем остатки на наличие нормальности распределения с помощью теста Шапиро-Уилка.

Таблица 8. Расчетная таблица для вычисления статистики W

  1, 8602 -1, 2941 1, 6747 0, 7251 -1, 7906 2, 5157
  0, 3515 -0, 8427 0, 7101 1, 3318 -0, 5537 1, 8855
  -0, 6434 -0, 6466 0, 4181 0, 7460 1, 0974 -0, 3514
  -0, 2109 -0, 6434 0, 4139 0, 1802 1, 1318 -0, 9516
  -0, 3980 -0, 5469 0, 2991 0, 1240 1, 7138 -1, 5898
  -0, 8427 -0, 3980 0, 1584 0, 9727 0, 1960 0, 7767
  -0, 5469 -0, 2109 0, 0445 0, 0240 -0, 7472 0, 7712
  -1, 2941 -0, 2023 0, 0409      
  -0, 6466 0, 0696 0, 0048      
  1, 3157 0, 3515 0, 1235      
  0, 7338 0, 4540 0, 2062      
  0, 4540 0, 7338 0, 5384      
  -0, 2023 1, 3157 1, 7312      
  0, 0696 1, 8602 3, 4603      
Итого     9, 8241     3, 0563

Примечание: данные графы 2 - это остатки из табл.2, данные графы 3 получены путем ранжирования от меньшего к большему графы 2, данные графы 4 получены путем возведения квадрат графы 3, данные графы 5 взяты из табл. [https://www.machinelearning.ru/wiki/index.php? title], данные графы 6 получены путем вычитания соответствующего, но номеру значения из графы 3, данные графы 7 получены путем умножения графы5 на графу 6.

Так как

 

 

Из таблицы выбираем критическое значение W*, для n=14 и уровня значимости α = 0, 05, W*= 0, 874. Так как W> W*, то можно утверждать о том, что распределение случайных отклонений нормальное. Все предпосылки МНК выполнены, что говорит о качестве полученных оценок параметров эконометрической модели.

Рассчитаем средний коэффициент эластичности по формуле (2.10):

Таким образом, ВВП является статистически значимым фактором, оказывающим влияние на уровень безработицы в Российской Федерации.


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.017 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал