Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






ВВЕДЕНИЕ. Эконометрика: Методические рекомендации по выполнению домашней контрольной работы / И.Ю.Коробейникова - Челябинск: ЧОУ ВПО «Южно-Уральский институт управления






Эконометрика: Методические рекомендации по выполнению домашней контрольной работы / И.Ю.Коробейникова - Челябинск: ЧОУ ВПО «Южно-Уральский институт управления и экономики», 2011.- 40с.

 

Эконометрика: Методические рекомендации по выполнению домашней контрольной работы: 080105.65 «Финансы и кредит», 080105.65 «Бухгалтерский учет, анализ и аудит», 080507.65 «Менеджмент организации».

 

 

Ó Издательство ЧОУ ВПО «Южно-Уральский институт управления и экономики», 2011

СОДЕРЖАНИЕ

 

Введение…………………………………………………………………...  
Методические рекомендации по выполнению контрольных заданий...  
Задания для домашней контрольной работы……………………………  
Рекомендуемый список литературы……………………………………..  

 

 

 

 

 

ВВЕДЕНИЕ

Дисциплина «Эконометрика» имеет целью ознакомить обучающихся с методами экономических измерений, методами оценки параметров моделей микро- и макроэкономики.

Основные задачи эконометрики: построение количественно определенных экономико-математических моделей, разработка методов оценки их параметров по статистическим данным и анализ их свойств.

Целью данной контрольной работы является закрепление и проверка знаний, полученных студентами в процессе самостоятельного изучения учебной литературы.

Вопросы и задания, включенные в контрольную работу, предусматривают знание студентами основных вопросов теории и умение применить их на практике решения задач.

 

МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ВЫПОЛНЕНИЮ КОНТРОЛЬНЫХ ЗАДАНИЙ

 

 

Эконометрика – наука, изучающая количественные закономерности и взаимозависимости в экономике методами математической статистики.

Цель эконометрики – эмпирический вывод экономических законов.

Задачи эконометрики – построение экономических моделей и оценивание их параметров, проверка гипотез о свойствах экономических показателей и формах их связи.

Эконометрический анализ служит основой для экономического анализа и прогнозирования, создавая возможность для принятия обоснованных экономических решений.

Типы данных

При моделировании экономических процессов оперируют двумя типами данных: пространственными и временными.

Пространственные данные – данные по какому-либо экономическому показателю, полученные от разных однотипных объектов, но относящиеся к одному и тому же времени.

Временные ряды – данные, характеризующие один и тот же объект в различные моменты времени.

Любые экономические данные представляют собой характеристики какого-либо экономического объекта и имеют статистическую природу. Для их анализа и обработки необходимо применять специальные методы.

 

Классы моделей и их оценка

Выделяют три основных класса экономических моделей: модели временных рядов, регрессионные модели с одним уравнением и системы одновременных уравнений.

К моделям временных рядов относятся модели тренда и модели сезонности.

В регрессионных моделях с одним уравнение объясняемая переменная представляется в виде функции от объясняющих переменных. По виду функции регрессионные модели делятся на линейные и нелинейные.

После построения модели необходимо проверить совместимость модели с реальными экономическими данными. Различают два уровня анализа: теоретический и эмпирический.

На теоретическом уровне предполагаем, что известны все возможные реализации экономических показателей, на основе которых можно теоретически определить параметры модели.

На эмпирическом уровне, располагая выборочными значениями экономических показателей, можно оценить значения параметров модели.

Цель оценивания – получить как можно более точно значения неизвестных параметров экономических показателей.

 

Типы зависимостей

В экономических исследованиях одной из основных задач является анализ зависимостей между переменными.

Функциональная зависимость задается в виде точной формулы, в которой каждому значению одной переменной соответствует строго определенное значение другой, воздействием случайных факторов при этом пренебрегают.

Статистической зависимостью называется связь переменных, на которую накладывается воздействие случайных факторов.

Уравнение регрессии – это формула статистической связи между переменными. Формула статистической связи двух переменных называется парной регрессией, зависимость от нескольких переменных – множественной регрессией.

 

Ковариация и корреляция

Выборочной ковариацией двух переменных x, y называется средняя величина произведения отклонений этих переменных от своих средних, т.е.

,

где - выборочные средние переменных x, y. Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Более точной мерой зависимости между величинами является коэффициент корреляции. Различают выборочный и теоретический коэффициенты корреляции.

Выборочный коэффициент корреляции определяется выражением

-1£ r £ 1,

он является безмерной величиной и показывает степень линейной связи двух переменных. Выборочный коэффициент корреляции является случайной величиной.

Теоретический коэффициент корреляции определяется выражением

,

где sX, sY – средние квадратичные отклонения случайных величин X, Y. Теоретический коэффициент корреляции показывает тесноту линейной связи двух случайных величин:

· r > 0 при положительной связи и r = 1 при строгой положительной линейной связи;

· r < 0 при отрицательной связи и r = -1 при строгой отрицательной линейной связи;

· r = 0 при отсутствии линейной связи.

В качестве критерия проверки гипотезы H0: r = 0 принимается случайная величина . Величина t при справедливости гипотезы H0 имеет распределение Стьюдента (t-статистика) с v = n – 2 степенями свободы. Сравнивая наблюдаемые значение критерия t с критическими значениями tкр, определяемым по таблице по заданному уровню значимости a и по числу степеней свободы, получают, что:

· если ½ t½ < tкр, то H0 принимается, т.е. нет линейной связи между переменными;

· если½ t½ > tкр, то H0 отвергается, т.е. имеется линейная связь между переменными.

Нелинейные регрессии

Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.

Уравнение линейной регрессии имеет вид: .

Уравнение степенной модели имеет вид: . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого нужно произвести логарифмирование обеих частей уравнения.

Уравнение показательной кривой: . Для построения этой модели необходимо произвести линеаризацию переменных. Для этого нужно произвести логарифмирование обеих частей уравнения.

Уравнение гиперболической функции: . Для построения этой модели нужно произвести линеаризацию путем замены X = 1/x.

 

Расчет средней относительной ошибки:

Прогнозирование с применением уравнения регрессии

Регрессионные модели могут быть использованы для прогнозирования возможных ожидаемых значений зависимой переменной.

Прогнозируемое значение переменной y получается при подстановке в уравнение регрессии

ожидаемой величины фактора x. Данный прогноз называется точечным.

Вероятность реализации точечного прогноза практически равна нулю. Поэтому рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надежностью.

Доверительные интервалы зависят от стандартной ошибки, удаления xпрогн от своего среднего значения , количества наблюдений n и уровня значимости прогноза a.

.

 

Модель парной регрессии

В модели парной регрессии зависимость между переменными в генеральной совокупности представляется в виде

Y = a+ bX + e,

где X – неслучайная величина, а Y и e - случайные величины.

Величина Y называется объясняемой (зависимой) переменной, а X – объясняющей (независимой) переменной. Постоянные a, b - параметры уравнения.

Не основе выборочного наблюдения оценивается выборочное уравнение регрессии:

,

где (a, b) – оценки параметров (a, b). Величина описывается как расчетное значение переменнойy, соответствующее xi.

Остаток ei в i-м наблюдении определяется как разность между фактическим и расчетным значениями зависимой переменной, т.е.

.

Неизвестные значения (a, b) определяются методом наименьших квадратов (МНК):

.

Коэффициент b есть угловой коэффициент регрессии, он показывает, на сколько единиц в среднем изменяется переменная y при увеличении независимой переменной x на единицу.

Постоянная a дает прогнозируемое значение зависимой переменной при x=0.

 

Выборочные дисперсии величин y, , e:

- дисперсия наблюдаемых значений y;

- дисперсия расчетных значений y;

- дисперсия остатков.

 

Коэффициентом детерминации R2 называется отношение

,

при чем 0 £ R2 £ 1, характеризующее долю вариации (разброса) зависимой переменной, объясненную с помощью уравнения регрессии.

Если R2 = 1, то подгонка точная, т.е. все точки наблюдения лежат на одной прямой. Если R2 = 0, регрессия ничего не дает, т.е. переменная x не улучшает качества предсказания y по сравнению с горизонтальной прямой . Чем ближе к единице R2, тем лучше качество подгонки, т.е. более точно аппроксимирует y.

 

F-тест на качество оценивания. Для определения статистической значимости коэффициента детерминации R2 проверяется гипотеза H0: F = 0 для F-статистики, рассчитываемой по формуле . Величина F имеет распределение Фишера с v1=1, v2=n – 2 степенями свободы. Вычисленный критерий F сравнивается с критическим значением Fкр:

· если F< Fкр, то H0 принимается, т.е. R2 незначим;

· если F > Fкр то H0 отклоняется, т.е. R2 значим.

 

В силу того, что случайные отклонения eI по выборке определены быть не могут, при анализе надежности оценок они заменяются наблюдаемыми остатками ei и их выборочной дисперсией.

Несмещенной оценкой дисперсии s2 является величина

, которая служит мерой разброса зависимой переменной вокруг линии регрессии. Величина S называется стандартной ошибкой регрессии.

Величины Sa, Sb называются стандартными ошибками коэффициентов регрессии и вычисляются по формулам:

.

 

Пример 1

По семи предприятиям легкой промышленности получена информация, характеризующая зависимость объема выпуска продукции (Y, млн руб.) от объема капиталовложений (X, млн руб.).

Y              
X              

Требуется:

1. Для характеристики Y от x построить следующие модели:

· линейную (для сравнения с нелинейными),

· степенную,

· показательную,

· гиперболическую.

2. Оценить каждую модель, определив:

· индекс корреляции,

· среднюю относительную ошибку, коэффициент детерминации,

· F-критерий Фишера.

3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.

4. Рассчитать прогнозные значения результативного признака по лучшей модели, если объем капиталовложений составит 89, 573 млн руб.

5. Результаты расчетов отобразить на графике.

Решение

1 Построение моделей регрессии

Построение линейной модели парной регрессии.

Определим линейный коэффициент парной корреляции по следующей формуле, используя данные таблицы 1.1:

Можно сказать, что связь между объемом капиталовложений X и объемом выпуска продукции Y обратная, достаточно сильная.

Уравнение линейной регрессии имеет вид: .

Значения параметров a и b линейной модели определим, используя данные таблицы 1.1.

Уравнение регрессии имеет вид: .

С увеличением объема капиталовложений на 1 млн руб. объем выпускаемой продукции уменьшится в среднем на 550 тыс. руб. Это свидетельствует о неэффективности работы предприятий, и необходимо принять меры для выяснения причин и устранения этого недостатка.

Таблица 1.1

t y x yx x 2
          13, 43 5, 43 1, 43 -2, 57 -0, 57 -4, 57 -12, 6 180, 36 29, 485 2, 0449 6, 6049 0, 3249 20, 885 158, 0 -17, 4 -13, 4 0, 57 -5, 43 2, 57 14, 57 18, 57 303, 8 180, 36 0, 3249 29, 485 6, 6049 212, 28 344, 84 60, 2 58, 0 50, 3 53, 6 49, 2 42, 6 40, 4 3, 84 -1, 96 1, 74 -5, 56 0, 84 3, 44 -2, 36 6, 000 -3, 500 3, 346 -11, 583 1, 680 7, 478 -6, 211
Итого   Ср. знач   354, 00     50, 57 570, 00     81, 43     4033, 14     6784, 57 0, 01 397, 71   1077, 7   -0, 02 39, 798     5, 685

 

Рассчитаем коэффициент детерминации:

Вариация результата Y (объема выпуска продукции) на 82, 2% объясняется вариацией фактора X (объемом капиталовложений).

Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера:

;

F> Fтабл = 6, 61 для a=0, 05; k1 = m = 1, k2 = n – m – 1 = 5/

Уравнение регрессии с вероятностью 0, 95 в целом статистически значимое, т.к. F > Fтабл.

Определим среднюю ошибку:

.

В среднем расчетные значения для линейной модели отличаются от фактических значений на 5, 685%.

Построение степенной модели парной регрессии

Уравнение степенной модели имеет вид: .

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого произведем логарифмирование обеих частей уравнения:

lg = lg a +b lg x. данные приведены в таблице 1.2.

Таблица 1.2

  Факт. Y(t) lg(y) Переменная X(t) lg(x)
å 28 64, 0 56, 0 52, 0 48, 0 50, 0 46, 0 38, 0 354, 0 1, 806 1, 748 1, 716 1, 681 1, 699 1, 633 1, 580 11, 893   1, 806 1, 833 1, 914 1, 881 1, 924 1, 982 2, 000 13, 340
Сред. знач 50, 5714 1, 699 81, 429 1, 906

 

Обозначим Y = lg , X = lg x, A = lg a. тогда уравнение примет вид: Y = A + bX – линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 1.3.

    y   Y   x   X   YX   X2   Ei
    1, 8062 1, 7482 1, 7160 1, 6812 1, 6990 1, 6628 1, 5798   1, 8062 1, 8325 1, 9138 1, 8808 1, 9243 1, 9823 2, 000 3, 2623 3, 2036 3, 2841 3, 1621 3, 2693 3, 2960 3, 1596 3, 2623 3, 3581 3, 6627 3, 5375 3, 7029 3, 9294 4, 0000 61, 294 58, 066 49, 133 52, 580 48, 088 42, 686 41, 159 2, 706 -2, 066 2, 867 -4, 580 1, 912 3, 314 -3, 159 4, 23 3, 69 5, 51 9, 54 3, 82 7, 20 8,.31 7, 322 4, 270 8, 220 20, 976 3, 657 10, 982 9, 980
итого   11, 8931   13, 3399 22, 6370 25, 4528   0, 51 42, 32 65, 407

Таблица 1.3

 

Уравнение регрессии будет иметь вид: Y = 3, 3991 – 0, 8921X.

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения.

Получим уравнение степенной модели регрессии: = 2506, 915 ´ x-0, 892.

Определим индекс корреляции:

связь между показателем y и фактором x можно считать достаточно сильной.

Коэффициент детерминации равен 0, 836:

Вариация результата Y (объем выпуска продукции) на 83, 6% объясняется вариацией фактора X (объемом капиталовложений).

Рассчитаем F-критерий Фишера:

F > Fтабл = 6, 61 для a = 0, 05; k1 = m = 1, k2 = n –m –1 = 5.

Уравнение регрессии с вероятностью 0, 95 в целом статистически значимое, т.к. F > Fтабл.

Средняя относительная ошибка

В среднем расчетные значения для степенной модели отличаются от фактических значений на 6, 04%.

 

Построение показательной функции

Уравнение показательной кривой: .

Для построения этой модели необходимо произвести линеаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения:

.

Обозначим: .

Получим линейное уравнение регрессии:

Y=A+Bx.

Рассчитаем его параметры, используя данные таблицы 1.4.

 

 

Таблица 1.4

t y Y x Yx x2 Ei
    1, 8062 1, 7482 1, 7160 1, 6812 1,.6990 1, 6628 1, 5798   115, 60 118, 88 140, 71 127, 77 142, 71 159, 62 157, 98   0, 1072 0, 0492 0, 0170 -0, 017 0, 0000 -0, 036 -0, 119 0, 0115 0, 0024 0, 0003 0, 0003 0, 0000 0, 0013 0, 0142 -17, 43 -13, 43 0, 57 -5, 43 2, 57 14, 57 18, 57 303, 76 180, 33 0, 33 29, 47 6, 61 212, 33 344, 90 60, 6 49, 7 53, 1 48, 6 42, 5 40, 7 11, 464 3, 9632 5, 4221 25, 804 2, 0031 11, 933 7, 3132 3, 3859 -1, 991 2, 3285 -5, 08 1, 4153 3, 4544 -2, 704  
итого     11, 8931     963, 28       0, 0300     1077, 7     67, 903   0, 8093  
сред знач   50, 57   1, 6990     81, 4   137, 61                  

Перейдем к исходным переменным x и y, выполнив потенцирование данного уравнения:

Определим индекс корреляции:

Связь между показателем y и фактором x можно считать достаточно сильной.

Индекс детерминации: R2 = = 0, 912 = 0, 828.

Вариация результата Y (объема выпуска продукции) на 82, 8% объясняется вариацией фактора X (объемом капиталовложений).

Рассчитаем F-критерий Фишера:

F> Fтабл = 6, 61 для a = 0, 05; k1=m=1, k2 = n – m – 1 = 5.

Уравнение регрессии с вероятностью 0, 95 в целом статистически значимое, т.к. F> Fтабл.

Средняя относительная ошибка:

В среднем расчетные значения для показательной функции отличаются от фактических на 5, 909%.

Построение гиперболической функции

Уравнение гиперболической функции:

Произведем линеаризацию модели путем замены X= . В результате получим линейное уравнение .

Рассчитаем его параметры по данным таблицы 1.5.

Получим следующее уравнение гиперболической модели: .

Определим индекс детерминации: R2 = = 0, 9142 = 0, 835.

Таблица 1. 5.

 

t y x X yX X2 Ei
      0, 0156 0, 0147 0, 0122 0, 0132 0, 0119 0, 0104 0, 0100 1, 0000 0, 8235 0, 6341 0, 6316 0, 5952 0, 4792 0, 3800 0, 0002441 0, 0002163 0, 0001487 0, 0001731 0, 0001417 0, 0001085 0, 0001000 13, 43 5, 43 1, 43 -2, 57 -0, 57 -4, 57 -12, 57 180, 33 29, 47 2, 04 6, 61 0, 32563 20, 90 158, 04 61, 5 58, 2 49, 3 52, 7 48, 2 42, 9 41, 4 6, 1954 4, 9637 7, 5089 22, 078 3, 1591 9, 5648 11, 69 2, 489 -2, 228 2, 740 -4, 699 1, 777 3, 093 -3, 419 3, 889 3, 978 5, 270 9, 789 3, 555 6, 723 8, 997
итого       0, 0880 4, 5437 0, 0011325       397, 71 354, 2 65, 159 -0, 246 42, 202
сред знач 50, 57     0, 0126 0, 6491 0, 0001618           6, 029

Вариация результата Y (объема выпуска продукции) на 83, 6% объясняется вариацией фактора X (объемом капиталовложений).

F-критерий Фишера:

F> Fтабл= 6, 61 для a = 0, 05; k1=m=1, k2 = n – m – 1 = 5.

Уравнение регрессии с вероятностью 0, 95 в целом статистически значимое, т.к. F> Fтабл.

Средняя относительная ошибка:

В среднем расчетные значения для гиперболической модели отличаются от фактических значений на 6, 029%.

 

Выбор лучшей модели

Для выбора лучшей модели построим сводную таблицу результатов.

Таблица 1.6.

Параметры   Модель Коэффициент детерминации R2 F-критерий Фишера Индекс корреляции rYX (ryx) Средняя относительная ошибка Eотн
Линейная 0, 822 23, 09 0, 907 5, 685
Степенная 0, 828 24, 06 0, 910 6, 054
Показательная 0, 828 24, 06 0, 910 5, 909
Гиперболичская 0, 835 25, 30 0, 914 6, 029

Все модели имеют примерно одинаковые характеристики, но большее значение F-критерия Фишера и большее значение коэффициента детерминации R2 имеет гиперболическая модель. Ее можно взять в качестве лучшей для построения прогноза.

 

Расчет прогнозного значения результативного показателя

Прогнозное значение результативного признака (объема выпуска продукции) определяется по уравнению гиперболической модели, подставив в него планируемую (заданную по условию) величину объема капиталовложений:

(млн руб.).

Фактические, расчетные и прогнозные значения по лучшей модели отображаются на графике.

рис. 1.1

 

Модель множественной регрессии

Линейная модель множественной регрессии имеет вид:

Yi = a0 + a1xi1 + a2xi2 + amxim + ei.

Коэффициент регрессии aj показывает, на какую величину в среднем измениться результативный признак Y, если переменную xj увеличить на единицу измерения, т.е. aj является нормативным коэффициентом.

Анализ уравнения множественной регрессии и методика определения параметров становиться более наглядными, а расчетные процедуры существенно упрощаются, если воспользоваться матричной формой записи уравнения

Y = Xa + e,

где Y – вектор зависимой переменной размерности n´ 1, представляющий собой n наблюдений значений yi,

X – матрица n наблюдений независимых переменных X1, X2, X3, …Xm, размерность матрицы X равна n´ (m + 1);

a - подлежащий оцениванию вектор неизвестных параметров размерности

(m + 1) ´ 1;

e - вектор случайных отклонений (возмущений) размерности n´ 1.

Таким образом,

.

Уравнение множественной регрессии содержит значения неизвестных параметров a0, a1, a2, …, am. Эти величины оцениваются на основе выборочных наблюдений, поэтому полученные расчетные показатели представляют собой статистические оценки. Модель линейной регрессии, в которой вместо истинных значений параметров подставлены их оценки, имеет вид:

,

где a - вектор оценок параметров;

e – вектор «оцененных» отклонений регрессии, остатки регрессии e = Y – Xa;

- оценка значений Y, равная Xa.

 

Оценка параметров модели множественной регрессии с помощью МНК.

Формула для вычисления параметров регрессионного уравнения:

A = (XTX)-1XTY.

Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных. Линейная или близкая к ней связь между факторами называется мультиколлинеарностью и приводит к линейной зависимости нормальных уравнений, что делает вычисление пераметров либо невозможным, либо затрудняет содержательную интерпретацию параметров модели. Чтобы избавиться от мультиколлинеарности, в модель включают лишь один из линейно связанных между собой факторов, причем тот, который в большей степени связан с зависимой переменной.

В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств: ryxi > rxixk, ryxk > rxixk, rxixk < 0, 8. если приведенные неравенства (или хотя бы одно из них) не выполняется, то в модель включают тот фактор, который наиболее тесно связан с Y.

 

Анализ статистической значимости параметров модели.

Значимость отдельных коэффициентов регрессии проверяется по t-статистике путем проверки гипотезы о равенстве нулю j-го параметра уравнения (кроме свободного члена): , где Saj – стандартное отклонение коэффициента уравнения регрессии aj.

Величина Saj вычисляется по формуле: , где bij – диагональный элемент матрицы (XTX)-1.

Если расчетное значение t-критерия с (n – k – 1) степенями свободы превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели.

 

Проверка значимости модели регрессии.

Для проверки значимости модели регрессии используется F-критерий Фишера.

 

Оценка качества модели регрессии.

Качество модели оценивается стандартным для математических моделей образом: по адекватности и точности на основе анализа остатков регрессии e. Расчетные значения получаются путем подстановки в модель фактических значений всех включенных факторов.

Анализ остатков позволяет получить представление, насколько хорошо подобрана сама модель и насколько правильно выбран метод оценки коэффициентов. Согласно общим предположениям регрессионного анализа остатки должны вести себя как независимые одинаково распределенные случайные величины. Независимость остатков проверяется с помощью критерия Дарбина – Уотсона. Исследование остатков полезно начинать с изучения их графика. Он может показать наличие какой-то зависимости, не учтенной в модели.

Выбросы. График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения – выбросы. Присутствие выбросов может грубо искажать значения оценок. Устранение эффектов выбросов может проводится либо с помощью удаления этих точек из анализируемых данных, либо с помощью применения методов оценивания параметров, устойчивых к подобным грубым отклонениям.

Для оценки качества модели множественной регрессии вычисляют коэффициент множественной корреляции R и коэффициент детерминации R2.

В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, он должен быть скорректирован с учетом числа независимых переменных. Скорректированный R2, или, рассчитывается так:

,

где n – число наблюдений;

k – число независимых переменных.

Важную роль при оценке влияния факторов играют коэффициенты регрессионного анализа. Однако непосредственно с их помощью нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Для устранения таких различий при интерпретации применяются средние частные коэффициенты эластичности Э(j) и бетта-коэффициенты b(j), которые рассчитываются по формулам:

где - среднестатистическое отклонение фактора j.

.

Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент, но не учитывает степень колеблемости факторов.

Бетта-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy измениться зависимая переменная Y с изменением соответствующей независимой переменной Xj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных.

Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.

Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта-коэффициентовD(j):

,

где - коэффициент парной корреляции между фактором j (J = 1, …, m) и зависимой переменной.

Одна из важнейших целей моделирования заключается в прогнозировании поведения исследуемого объекта. При использовании построенной модели для прогнозирования делается предположение о сохранении в период прогнозирования существования ранее взаимосвязей переменных.

Для прогнозирования зависимой переменной на l шагов вперед необходимо знать прогнозные значения всех входящих в нее факторов. Их оценки могут быть получены на основе временных экстраполяционных моделей или заданы пользователем. Эти оценки подставляются в модель и получаются прогнозные оценки.

Построение точечных и интервальных прогнозов

на основе регрессионной модели

Для того, чтобы определить область возможных значений результативного показателя, при рассчитанных значениях факторов следует учитывать два возможных источника ошибок: рассеивание наблюдений относительно линии регрессии и ошибки, обусловленные математическим аппаратом построения самой линии регрессии. Ошибки первого рода измеряются с помощью характеристик точности, в частности величиной Sy. Ошибки второго рода обусловлены фиксацией численного значения коэффициентов регрессии, в то время как они в действительности являются случайными, нормально распределенными.

Для линейной регрессии доверительный интервал рассчитывается следующим образом. Оценивается величина отклонения от линии регрессии U:

,

где .

Пример 2

Задача состоит в построении модели для предсказания объема реализации одного из продуктов фирмы.

Объем реализации – зависимая переменная Y (млн руб.). в качестве независимых, объясняющих переменных выбраны: время – X1, расходы на рекламу X2 (тыс. руб.), цена товара X3 (руб), средняя цена товара у конкурентов X4 (руб.), индекс потребительских расходов X5 (%).

Требуется:

1. Осуществить выбор факторных признаков для построения двухфакторной регрессионной модели.

2. Рассчитать параметры модели.

3. Для оценки качества модели определить

· линейный коэффициент множественной корреляции,

· коэффициент детерминации.

4. Осуществить оценку значимости уравнения регрессии.

5. Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии.

6. Оценить влияние факторов на зависимую переменную по модели.

7. Построить точечный и интервальный прогноз результирующего показателя.

Решение.

1. Построение системы показателей (факторов). Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели.

Статистические данные по всем переменным приведены в таблице 2.1. В этом примере n = 16, m = 5.

В таблице 2.2 приведены промежуточные результаты при вычислении коэффициента корреляции по формуле:

.


В таблице 2.3 приведены сводные результаты корреляционного анализа.

Таблица 2.1.

Y X1 X2 X3 X4 X5
Объем реализации Время Реклама Цена Цена конкурента Индекс потребительских расходов
    4, 0 4, 8 3, 8 8, 7 8, 2 9, 7 14, 7 18, 7 19, 8 10, 6 8, 6 6, 5 12, 6 6, 5 5, 8 5, 7 15, 0 14, 8 15, 2 15, 5 15, 5 16, 0 18, 1 13, 0 15, 8 16, 9 16, 3 16, 1 15.4 15, 7 16, 0 15, 1 17, 0 17, 3 16, 8 16, 2 16, 0 18, 0 20, 2 15, 8 18, 2 16, 8 17, 0 18, 3 16, 4 16, 2 17, 7 16, 2 100, 0 98, 4 101, 2 103, 5 104, 1 107, 0 107, 4 108, 5 108, 3 109, 2 110, 1 110, 7 110, 3 111, 8 112, 3 112, 9

Таблица 2.2.

t Y X2
    4, 0 4, 8 3, 8 8, 7 8, 2 9, 7 14, 7 18, 7 19, 8 10, 6 8, 6 6, 5 12, 6 6, 5 5, 8 5, 7 -180, 813 -169, 813 -158, 813 -115, 813 -32, 8125 63, 1875 125, 1875 138, 1875 60, 1875 60, 1875 14, 1875 0, 1875 24, 1875 38, 1875 57, 1875 77, 1875 32693, 16 28836, 29 25221, 41 13412, 54 1076, 66 3992, 66 15671, 91 19095, 79 3622, 535 3622, 535 201, 2852 0, 035156 585, 0352 1458, 258 3270, 41 5957, 91 -5, 29375 -4, 49375 -5, 49375 -0, 59375 -1, 09375 0, 40625 5, 40625 9, 40625 10, 50625 1, 30625 -0, 69375 -2, 79375 3, 30625 -2, 79375 -3, 49375 -3, 59375 28, 02379 20, 19379 30, 18129 0, 352539 1, 196289 0, 165039 29, 22754 88, 47754 110, 3813 1, 706289 0, 481289 7, 805039 10, 93129 7, 805039 12, 20629 12, 91504 957, 1762 763, 0949 872, 4762 68, 76367 35, 88867 25, 66992 676, 7949 1299, 826 632, 3449 78, 61992 -9, 84258 -0, 52383 79, 96992 -106, 686 -199, 799 -277, 393
å   148, 7   158718, 4   362, 0494 4896, 381
сред знач   9, 29375          

 

Таблица 2.3.

  Объем реализации Время Реклама Цена Цена конкурента Индекс потребительских расходов
  Столбец 1 Столбец 2 Столбец 3 Столбец 4 Столбец 5 Столбец 6
Объем реализации Время Реклама Цена Цена конкурента Индекс потребительских расходов 0, 678 0, 646 0, 233 0, 226 0, 816   0, 106 0, 174 -0, 051 0, 960     -0, 003 0, 204 0, 273   0, 698 0, 235     0, 03    

 

Анализ результатов коэффициентов парной корреляции показывает, что зависимая переменная, т.е. объем реализации имеет тесную связь с индексом потребительских расходов (), с расходами на рекламу () и со временем (). Однако факторы X2 и X5 тесно связаны между собой (), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели X5 – индекс потребительских расходов. В этом примере n=16, m = 5, после исключения незначимых факторов n = 16, k = 2.

 

2 Выбор вида модели и оценка ее параметров

Оценка параметров регрессии осуществляется по методу наименьших квадратов, используя данные, приведенные в таблице 2.4.

Таблица 2.4.

 

Y X0 X1 X2
Объем реализации   Реклама Индекс потребительских расходов
    4, 0 4, 8 3, 8 8, 7 8, 2 9, 7 14, 7 18, 7 19, 8 10, 6 8, 6 6, 5 12, 6 6, 5 5, 8 5, 7 100, 0 98, 4 101, 2 103, 5 104, 1 107, 0 107, 4 108, 5 108, 3 109, 2 110, 1 110, 7 110, 3 111, 8 112, 3 112, 9

 

.

Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекса потребительских расходов можно записать в следующем виде:

y = -1471, 314 + 9, 568x1 + 15, 754x2.

Расчетные значения Y определяются путем последовательной подстановки в эту модель значений факторов, взятых для каждого наблюдения.

 

Регрессионный анализ

Результат регрессионного анализа содержится в таблицах 2.5 – 2.7.

Таблица 2.5

Регрессионная статистика
Принятые наименования формула Результат
  Коэффициент множественной корреляции 0, 927
  Коэффициент детерминации, R2 0, 859
  Скорректированный R2 0, 837
  Стандартная ошибка 41, 473
  Количество наблюдений n  

 

Таблица 2.6.

  df – число степеней свободы SS – сумма квадратов MS F-критерий Фишера
Регрессия k=2
Остаток n – k – 1=13  
Итого N – 1 =15    

 

Таблица 2.7.

  Коэффициенты Стандартная ошибка t-статистика
Y – пересечение   Реклама   Индекс потребительских расходов -1471б31   9б568   15б753   259б766   2б266   2б467 -5б667   4б223   6б386  

 

Пояснения к таблице 2.7. Во втором столбце содержаться коэффициенты уравнения регрессии a0, a1, a3. В третьем столбце содержатся стандартные ошибки коэффициентов уравнения регрессии, а в четвертом – t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.

Уравнение регрессии зависимости объема реализации от затрат на рекламу и индекс потребительских расходов можно записать в виде:

Y = -1471, 314 + 9, 568x1 + 15, 754x2.

 

2 Оценка качества модели

В таблице 2.8 приведены вычисленные по модели значения Y и значения остаточной компоненты.

 

 

Таблица 2.8.

 

Вывод остатков
Наблюдение Предсказанное Остатки
  142, 25 124, 70 159, 24 242, 35 247, 02 307, 06 361, 20 416, 80 424, 18 350, 32 345, 37 334, 72 386, 79 352, 05 353, 23 361, 73 -16, 25 12, 30 -11, 24 -51, 35 26, 98 62, 94 70, 80 28, 20 -57, 18 16, 68 -24, 37 -27, 72 -55, 79 -7, 05 10, 77 22, 27

 

Проверку независимости проведем с помощью d-критерия Дарбина – Уотсона.

В качестве критических табличных уровней при N = 16 двух объясняющих факторов при уровне значимости в 5% возьмем величины d = 0, 98 и d = 1, 54.

Так как расчетное значение попало в интервал от d1 до d2, то нельзя сделать окончательный вывод по этому критерию. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки.

В качестве критических табличных уровней при N = 16, двух объясняющих факторах при уровне значимости в 5% возьмем величины d1 = 0, 98 и d2 = 1, 54.

Так как расчетное значение попало в интервал от d1 до d2, то нельзя сделать вывод по этому критерию. Для определения степени автокорреляции вычислим коэффициент автокорреляции и проверим его значимость при помощи критерия стандартной ошибки.

Стандартная ошибка коэффициента корреляции рассчитывается по формуле:

.

Коэффициенты автокорреляции случайных данных обладают выборочным распределением, приближающимся к нормальному с нулевым математическим ожиданием и средним квадратическим отклонением, равным .

Если r1 находится в интервале 1, 96´ 0, 25£ r1´ 1, 96 £ 0, 25, то можно считать, что данные не показывают наличие автокорреляции первого порядка, т.к.

–0, 49 £ r1 = 0, 309 £ 0, 49, и свойство независимости выполняется.

Вычислим для модели коэффициент детерминации.

.

Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 86% вариация зависимой переменной учтено в модели и обусловлено влиянием включенных факторов. Значение коэффициента детерминации находится в таблице 2.5.

Проверку значимости уравнения регрессии произведем на основе вычисления F-критерия Фишера: .

Значение F-критерия Фишера можно найти в таблице 2.6.

Так как Fрас > Fтабл, уравнение регрессии следует признать адекватным.

 

4 Оценить с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения множественной регрессии

Значимость коэффициентов уравнения регрессии a0, a1, a2 оценим с использованием t-критерия Стьюдента.

b11 = 39, 2314

b22 = 0, 00299

b33 = 0, 00354

расчетные значения t-критерия Стьюдента для коэффициентов уравнения регрессии a1, a2 приведены в четвертом столбце таблице 2.7.

Табличное значение t-критерия при 5% уровне значимости и степенях свободы (16 – 2 – 1 = 13) составляет 2, 16. так как , коэффициенты a1, a2 и существенны (значимы).

 

5 Проанализировать влияние факторов на зависимую переменную по модели (для каждого коэффициента регрессии вычислить коэффициент эластичности,

b-коэффициент)

Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки влияния факторов на зависимую переменную из-за различия единиц измерения, используем коэффициент эластичности (Э) и бета-коэффициент, которые рассчитываются по формулам:

Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.

Бетта-коэффициент с математической точки зрения показывает, на какую часть величины среднего квадратического отклонения меняется среднее значение зависимой переменной с изменением независимой переменной на одно среднеквадратическое отклонение при фиксированном на постоянном уровне значении остальных независимых переменных. Это означает, что при увеличении затрат на рекламу на 4, 91 тыс. руб. объем реализации увеличится на 47 тыс. руб.

 

6 Определить точечные и интервальные прогнозные оценки объема реализации на два квартала вперед (t0, 7=1, 12)

Прогнозные значения X1, 17, X2, 17 и X1, 18, X2, 18 можно определить с помощью методов экспертных оценок, с помощью средних абсолютных приростов или вычислить на основе экстраполяционных методов. Для фактора X1 Затраты на рекламу выбрана модель

X1 = 12, 83 – 11, 616t + 4, 319t2 – 0, 552t3 + 0, 020t4 – 0, 0006t5,

по которой получен прогноз на два месяца вперед.

Для временного ряда Индекс потребительских расходов в качестве аппроксимирующей функции выбран полином второй степени (парабола), по которой построен прогноз на два шага вперед:

X2 = 97, 008 + 1, 739t – 0, 0488t2.

Для получения прогнозных оценок зависимостей переменных по модели

Y = -1471, 438 + 9, 568X1 + 15, 754 X2.

Подставим в нее найденные прогнозные значения факторов X1 и X2.

Yt=17 = -1471, 438 + 9, 568´ 5, 75 + 15, 754´ 112, 468 = 355, 399

Yt=18 = -1471, 438 + 9, 568´ 4, 85 + 15, 754´ 112, 488 = 344, 179.

 

Доверительный интервал прогноза будет иметь следующие границы:

Верхняя граница прогноза: Yp (N+1) + U(1)

Нижняя граница прогноза: Yp (N+1) – U(1).

Результаты прогнозных оценок модели регрессии, представлены в таблице 2.9

Таблица 2.9

 

Таблица прогнозов (р=95%)
Упреждение Прогноз Нижняя граница Верхняя граница
  355, 399 312, 368 398, 367
  344, 179 298, 43 389, 928

 

Контрольная работа состоит из двух заданий.

Номер варианта заданий выбирается в соответствии с начальной буквы фамилии студента. Например:

 

Номер зачетной книжки Номер выполняемого варианта
А, Б, В Первый
Г, Д, Е Второй
Ж, З, И Третий
К, Л Четвертый
М, Н, О Пятый
П, Р, С Шестой
Т, У, Ф Седьмой
Х, Ц, Ч Восьмой
Ш, Щ Девятый
Э, Ю, Я Десятый

 

 

При выполнении заданий нужно привести полное решение каждого пункта задания с подробными комментариями к процессу его выполнения с указанием формул. В конце каждого пункта выполненного задания дать анализ ответа.

При выполнении заданий можно использовать пакет анализа данных Excel (программы «Корреляция» и «Регрессия»), а также программу «Олимп: СтатЭксперт».

 

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.096 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал