Корреляционно-регрессионный анализ

Стр 1 из 2Следующая ⇒

Практическая работа №3

ЗАДАНИЕ НА ПРАКТИЧЕСКУЮ РАБОТУ

1. Подготовить исходные данные для анализа

2. Построить уравнение парной линейной регрессии.

3. Измерить тесноту связи.

4. Проверить на значимость коэффициенты регрессии

5. Построить уравнение множественной регрессии.

6. Измерить тесноту связи.

7. Проверить на значимость коэффициенты множественной регрессии.

СОДЕРЖАНИЕ РАБОТЫ

1. Подготовка исходных данных

На основании данных Приложения А сформировать уточнённые исходные данные, сформировав таблицу 6:

Таблица 6

№ п/п	Субъект РФ	Региональное таможенное управление	Объём экспорта	Объём импорта	Сальдо

Далее следует провести двойную группировку по объемам экспорта и импорта и выделить наибольшую группу выборки. Эта группа и будет необходима для последующего анализа. Названия РТУ следует заменить соответствующим номером:

Таблица 7

Центральное
Северо-западное
Южное
Приволжское
Уральское
Сибирское
Дальневосточное
Северо-кавказское

Определите фактор, оказывающий влияние (x) и результативный признак (y). В данном случае фактором будет столбец «Региональное таможенное управление», а результативным признаком – Объём экспорта и импорта (по отдельности). Т.о. необходимо будет построить и проанализировать 2 уравнения регрессии.

Для построения уравнения регрессии воспользуемся Пакетом анализа: Данные – Анализ данных – Регрессия. Если строки Анализ данных в Данных нет, то надо предварительно выполнить следующие действия: Файл – Параметры – Надстройки – Пакет анализа – Перейти – Анализ данных (отметить флажком).

В окне Регрессия:

Входной интервал Х – это столбец данных, определенных вами как фактор (причина); Входной интервал Y – это столбец данных, определенных вами как результат. Выходной интервал – несколько чистых ячеек на том же листе, где находятся исходные данные, или на отдельном листе. В результате получаем таблицу расчетов (см. пример в таблице 8).

Таблица 8. «Вывод итогов»

Регрессионная статистика
Множественный R	0, 502621
R-квадрат	0, 252628
Нормированный R-квадрат	0, 159206
Стандартная ошибка	25, 16016
Наблюдения
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		1711, 83	1711, 83	2, 704169	0, 138707
Остаток		5064, 27	633, 0337
Итого		6776, 1
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение
Y-пересечение	18, 37277	19, 30663	0, 95163	0, 369146
Переменная x₁	0, 533713	0, 324557	1, 644436	0, 138707

2. Из таблицы берем значения коэффициентов регрессии и получаем уравнение: у = 18, 37277 + 0, 533713 х₁ (коэффициенты при y – пересечении и переменной x₁).

3. Проверка на значимость заключается в проверке гипотезы Н0: а₀ = 0, т.е. проверке гипотезы о статистической незначимости проверяемого параметра а₀, другими словами, проверки вывода о том, что проверяемый параметр сформировался под влиянием случайных причин, а не в результате достаточно сильного влияния, т.е. закономерности. При этом уровень значимости представляет собой вероятность ошибки отклонения правильной гипотезы. Договоримся, что допустимый уровень значимости при выполнении практической работы примем равным 0, 05 или 5%.

Проверку значимости коэффициентов уравнения можно сделать по таблице 8, где кроме значений t -статистики, дан уровень значимости t -статистики (графа «Р- Значение»). Если уровень значимости, приведенный в таблице, не превышает 0, 05 (5%), делаем вывод, что проверяемый коэффициент значим и наоборот. В таблице уровень значимости (Р -значение t -статистики при Y -пересечении) равен 0, 369146, что значительно превышает уровень 0, 05 или 5%. Делаем вывод о том, что гипотезу о незначимости коэффициента регрессии а₀ принимаем. Аналогично проверяем гипотезу о незначимости параметра b₁ (при переменной x₁).

Поскольку оба значения ошибки гораздо больше 5%, гипотеза о незначимости коэффициентов уравнения, следовательно и самого уравнения регрессии, принимается. Коэффициент a₀ может быть принят лишь с вероятностью (1–0, 369146) или 63%, коэффициент b₁ – с вероятностью (1-0, 138707) или 88%.

4. Оценку тесноты связи делаем по R – квадрат.

R – квадрат измеряет тесноту связи через отношение дисперсий результативного признака. Чем ближе R –квадрат к 0, тем слабее связь между x и y, чем ближе R –квадрат с 1, тем сильнее связь.

5. Определите факторы, оказывающие влияние и обозначьте их (x₁, x₂, …..x_k). Определите результативный признак (y). В данном случае факторами будут столбцы Региональное таможенное управление, Объем экспорта, Объём импорта, а результативным признаком – столбец Сальдо.

Для построения уравнения регрессии воспользуемся Пакетом анализа MS Ехсеl: Данные – Анализ данных – Регрессия. В окне Регрессия:

Входной интервал Х – это столбцы данных, определенных вами как факторы (выделяются единым массивом); Входной интервал Y – это столбец данных, определенных вами как результат. Выходной интервал – несколько чистых ячеек на том же листе, где находятся исходные данные, или на отдельном листе. В результате получаем таблицу расчетов (см. пример в таблице 9).

Таблица 9. «Вывод итогов »

Регрессионная статистика
Множественный R	0, 502621
R-квадрат	0, 252628
Нормированный R-квадрат	0, 159206
Стандартная ошибка	25, 16016
Наблюдения
Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		1711, 83	1711, 83	0, 455188	0, 769029
Остаток		5064, 27	633, 0337
Итого		6776, 1
	Коэффициенты	Стандартная ошибка	t-статистика	P-Значение
Y-пересечение	22, 80765	19, 30663	0, 351022	0, 739878
Переменная x₁	0, 469454	0, 324557	0, 812186	0, 453601
Переменная x₂	0, 119464	36, 14581	0, 226852	0, 829522
Переменная x₃	19, 47716	0, 023568	2, 692154	0, 017188
Переменная x₄	10, 17820	0, 014578	2, 811450	0, 005123

Из таблицы берем значения коэффициентов регрессии и получаем уравнение:

y =22, 80765+0, 469454 x₁ +0, 119464 x₂ +19, 47716 x₃ -10, 1782 x₄ (коэффициенты при y – пересечении и переменных x₁, x₂, x₃, x₄.

6. Проверка на значимость заключается в проверке гипотезы о статистической незначимости проверяемых параметров, или проверки вывода о том, что проверяемый параметр сформировался под влиянием случайных причин, а не в результате достаточно сильного влияния, т.е. закономерности. При этом уровень значимости представляет собой вероятность ошибки отклонения правильной гипотезы. Договоримся, что допустимый уровень значимости при выполнении практической работы примем равным 0, 05 или 5%.

Проверка значимости коэффициентов уравнения проводится аналогично шагу 3.

7. Оценку тесноты связи делаем аналогично шагу 4 по показателю R – квадрат.

Нормированный R –квадрат дает скорректированную оценку коэффициента детерминации, т.е. долю вариации результата за счет включенных в уравнение регресии факторов в общей вариации результата с учетом степеней свободы общей и остаточной дисперсии. R –квадрат представляет собой нескорректированную оценку тесноты связи (без учета числа степеней свободы).

Различия между скорректированной и нескорректированной оценкой становятся важными, если мы должны сравнивать между собой модели с различным числом факторов. Сопоставлять уравнения регрессии с различным числом факторных признаков можно только по скорректированным значениям (Нормированный R - квадрат).

Приложение А

12 Следующая ⇒

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2026 год. (0.653 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал