![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Методика выполнения работы
По территориям региона приводятся данные за 199X г. (табл. 2.1).
Таблица 2.1 Данные по регионам
1. Для определения степени тесноты связи обычно используют линейный коэффициент корреляции:
где Соответствующие средние значения определяются по формулам:
Дисперсию также можно рассчитать по формуле
Для расчета коэффициента корреляции (2.12) строим расчетную таблицу (рис. 2.2). По данным таблицы находим:
Последние три столбца таблицы заполняются после получения уравнения регрессии!!!
Таким образом, между заработной платой (y) и среднедушевым прожиточным минимумом (x) существует прямая достаточно сильная корреляционная зависимость.
Для оценки статистической значимости коэффициента корреляции рассчитывают двухсторонний t-критерий Стьюдента:
который имеет распределение Стьюдента с k = n –2 и уровнем значимости a (приложение 1). Значения Т крит можно получить в Excel с помощью функции СТЬЮДРАСПОБР(вероятность; степени_свободы). В нашем случае
Поскольку Т набл > Т крит, то коэффициент корреляции существенно отличается от нуля. Таким образом, между переменными x и y имеет существенная корреляционная зависимость. Будем считать, что эта зависимость является линейной. Модель парной линейной регрессии имеет вид
где y – зависимая переменная (результативный признак); x – независимая (объясняющая) переменная; e – случайные отклонения, b0 и b1 – параметры уравнение регрессии. 2. По выборке ограниченного объема можно построить эмпирическое уравнение регрессии:
где b 0 и b 1 – эмпирические коэффициенты регрессии. Для оценки параметров регрессии обычно используют метод наименьших квадратов (2.8). Необходимым условием существования минимума функции двух переменных (2.8) является равенство нулю ее частных производных по неизвестным параметрам b 0 и b 1. В результате получаем систему нормальных уравнений:
Решая систему (2.20), найдем
По данным таблицы находим
Получено уравнение регрессии:
Величина параметра b 1 показывает среднее изменение результата с изменением фактора на одну единицу. В рассматриваемом случае, с увеличением среднедушевого минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0, 92 руб. По исходным данным также построен точечный график зависимости y(x) с выводом линейного уравнения тренда и коэффициентом R 2 (рис. 2.3).
Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки статистической значимости каждого коэффициента регрессии. Для этого вычислим сначала стандартную ошибку регрессии
В нашем случае Значимость коэффициентов регрессии осуществляется с помощью
где Для коэффициента b 1 оценку дисперсии можно получить по формуле
В нашем случае
Следовательно,
Отметим, что для парной линейной регрессии t -критерий для коэффициента корреляции rxy и коэффициента регрессии b 1 совпадают. Для коэффициента b 0 оценку дисперсии можно получить по формуле:
Тогда
Критическое значение критерия было уже найдено
Для проверки модели на адекватность также построим гистограмму распределения ее остатков. Сделаем это следующим образом. Составим диапазон изменения остатков, определим их минимальное и максимальное значения с помощью функций МАКС() и МИН(). Затем весь диапазон изменения остатков разобьем на 6-8 равных поддиапазонов и рассчитаем число попаданий ошибки (остатков) в каждый поддиапазон. Все границы интервалов необходимо записать в отдельную строку или столбец (рис. 2.4).
Далее для построения гистограммы распределения остатков выбираем команду Данные ® Анализ данных (если этой опции не будет, необходимо выбрать в Другие команды… команду Надстройки... и в появившемся диалоговом окне выбрать Пакет анализа и нажать кнопку Перейти…, отметить флажком опцию Пакет анализа). В появившемся диалоговом окне Анализ данных выбираем опцию Гистограмма. В диалоговом окне Гистограмма (рис. 2.5) в поле Входной интервал необходимо выбрать интервал, в котором находится диапазон ошибок (Н2: Н13), в поле Интервал карманов – диапазон значений отрезков поддиапазонов. Отметить флажком Вывод графика.
Результаты построения приведены на рис. 2.6. На автоматически построенном графике уберите Легенду и Боковые зазоры.
Для проверки модели на адекватность также построим график содержательного анализа остатков модели в зависимости от входной переменной Х. Для этого построим точечный график по диапазону ячеек в столбцах В2: В13 и Н2: Н13 (рис. 2.7).
По полученным результатам сделайте выводы об адекватности построения модели экспериментальным данным. Задачи регрессионного анализа можно решать с использованием ЭВМ. Например, в программе Excel достаточно ввести свои данные и использовать пакет Анализ данных. Опишем кратко последовательность действий: а) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа; б) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК; в) заполните диалоговое окно ввода данных и параметров вывода: - Входной интервал Y – диапазон, содержащий данные результативного признака; - Входной интервал X – диапазон столбцов, содержащие значения факторов независимых признаков. Результаты регрессионного анализа представлены на рисунке 2.4. Сравните стандартную ошибку регрессии и Т -статистики коэффициентов с полученными значениями, показанными на рисунке 2.8!!!
3. Оценку качества построенной модели дает коэффициент детерминации. Коэффициент детерминации для линейной модели равен квадрату коэффициента корреляции
Это означает, что 52% вариация заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума. Значимость уравнения регрессии проверяется при помощи F-критерия Фишера, для линейной парной регрессии он будет иметь вид
где F подчиняется распределению Фишера с уровнем значимости a и степенями свободы k 1= n –2 и k 2=1 (приложение 1). В нашем случае
Поскольку критическое значение критерия равно
и F набл > F крит, то признается статистическая значимость построенного уравнения регрессии. Отметим, что для линейной модели F - и t -критерии связаны равенством 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Прогнозное значение yp определяется путем подстановки в уравнение регрессии (2.23) соответствующего (прогнозного) значения х p. В нашем случае прогнозное значение прожиточного минимума составит:
Средняя стандартная ошибка прогноза вычисляется по формуле
В нашем случае
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза
или
Выполненный прогноз среднемесячной заработной платы оказался надежным (p=0, 95), но неточным, т.к. относительная точность прогноза составила
|