Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корреляционно-регрессионный анализСтр 1 из 2Следующая ⇒
Практическая работа №3 ЗАДАНИЕ НА ПРАКТИЧЕСКУЮ РАБОТУ 1. Подготовить исходные данные для анализа 2. Построить уравнение парной линейной регрессии. 3. Измерить тесноту связи. 4. Проверить на значимость коэффициенты регрессии 5. Построить уравнение множественной регрессии. 6. Измерить тесноту связи. 7. Проверить на значимость коэффициенты множественной регрессии.
СОДЕРЖАНИЕ РАБОТЫ 1. Подготовка исходных данных На основании данных Приложения А сформировать уточнённые исходные данные, сформировав таблицу 6: Таблица 6
Далее следует провести двойную группировку по объемам экспорта и импорта и выделить наибольшую группу выборки. Эта группа и будет необходима для последующего анализа. Названия РТУ следует заменить соответствующим номером: Таблица 7
Определите фактор, оказывающий влияние (x) и результативный признак (y). В данном случае фактором будет столбец «Региональное таможенное управление», а результативным признаком – Объём экспорта и импорта (по отдельности). Т.о. необходимо будет построить и проанализировать 2 уравнения регрессии. Для построения уравнения регрессии воспользуемся Пакетом анализа: Данные – Анализ данных – Регрессия. Если строки Анализ данных в Данных нет, то надо предварительно выполнить следующие действия: Файл – Параметры – Надстройки – Пакет анализа – Перейти – Анализ данных (отметить флажком). В окне Регрессия: Входной интервал Х – это столбец данных, определенных вами как фактор (причина); Входной интервал Y – это столбец данных, определенных вами как результат. Выходной интервал – несколько чистых ячеек на том же листе, где находятся исходные данные, или на отдельном листе. В результате получаем таблицу расчетов (см. пример в таблице 8). Таблица 8. «Вывод итогов»
2. Из таблицы берем значения коэффициентов регрессии и получаем уравнение: у = 18, 37277 + 0, 533713 х1 (коэффициенты при y – пересечении и переменной x1). 3. Проверка на значимость заключается в проверке гипотезы Н0: а0 = 0, т.е. проверке гипотезы о статистической незначимости проверяемого параметра а0, другими словами, проверки вывода о том, что проверяемый параметр сформировался под влиянием случайных причин, а не в результате достаточно сильного влияния, т.е. закономерности. При этом уровень значимости представляет собой вероятность ошибки отклонения правильной гипотезы. Договоримся, что допустимый уровень значимости при выполнении практической работы примем равным 0, 05 или 5%. Проверку значимости коэффициентов уравнения можно сделать по таблице 8, где кроме значений t -статистики, дан уровень значимости t -статистики (графа «Р- Значение»). Если уровень значимости, приведенный в таблице, не превышает 0, 05 (5%), делаем вывод, что проверяемый коэффициент значим и наоборот. В таблице уровень значимости (Р -значение t -статистики при Y -пересечении) равен 0, 369146, что значительно превышает уровень 0, 05 или 5%. Делаем вывод о том, что гипотезу о незначимости коэффициента регрессии а0 принимаем. Аналогично проверяем гипотезу о незначимости параметра b1 (при переменной x1). Поскольку оба значения ошибки гораздо больше 5%, гипотеза о незначимости коэффициентов уравнения, следовательно и самого уравнения регрессии, принимается. Коэффициент a0 может быть принят лишь с вероятностью (1–0, 369146) или 63%, коэффициент b1 – с вероятностью (1-0, 138707) или 88%.
4. Оценку тесноты связи делаем по R – квадрат. R – квадрат измеряет тесноту связи через отношение дисперсий результативного признака. Чем ближе R –квадрат к 0, тем слабее связь между x и y, чем ближе R –квадрат с 1, тем сильнее связь. 5. Определите факторы, оказывающие влияние и обозначьте их (x1, x2, …..xk). Определите результативный признак (y). В данном случае факторами будут столбцы Региональное таможенное управление, Объем экспорта, Объём импорта, а результативным признаком – столбец Сальдо. Для построения уравнения регрессии воспользуемся Пакетом анализа MS Ехсеl: Данные – Анализ данных – Регрессия. В окне Регрессия: Входной интервал Х – это столбцы данных, определенных вами как факторы (выделяются единым массивом); Входной интервал Y – это столбец данных, определенных вами как результат. Выходной интервал – несколько чистых ячеек на том же листе, где находятся исходные данные, или на отдельном листе. В результате получаем таблицу расчетов (см. пример в таблице 9). Таблица 9. «Вывод итогов »
Из таблицы берем значения коэффициентов регрессии и получаем уравнение: y =22, 80765+0, 469454 x1 +0, 119464 x2 +19, 47716 x3 -10, 1782 x4 (коэффициенты при y – пересечении и переменных x1, x2, x3, x4.
6. Проверка на значимость заключается в проверке гипотезы о статистической незначимости проверяемых параметров, или проверки вывода о том, что проверяемый параметр сформировался под влиянием случайных причин, а не в результате достаточно сильного влияния, т.е. закономерности. При этом уровень значимости представляет собой вероятность ошибки отклонения правильной гипотезы. Договоримся, что допустимый уровень значимости при выполнении практической работы примем равным 0, 05 или 5%. Проверка значимости коэффициентов уравнения проводится аналогично шагу 3.
7. Оценку тесноты связи делаем аналогично шагу 4 по показателю R – квадрат. Нормированный R –квадрат дает скорректированную оценку коэффициента детерминации, т.е. долю вариации результата за счет включенных в уравнение регресии факторов в общей вариации результата с учетом степеней свободы общей и остаточной дисперсии. R –квадрат представляет собой нескорректированную оценку тесноты связи (без учета числа степеней свободы). Различия между скорректированной и нескорректированной оценкой становятся важными, если мы должны сравнивать между собой модели с различным числом факторов. Сопоставлять уравнения регрессии с различным числом факторных признаков можно только по скорректированным значениям (Нормированный R - квадрат). Приложение А
|