![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Программных средств Microsoft Excel
1. Для целей регрессионного анализа используется линейная модель множественной регрессии, имеющей вид:
где: а0 – свободный член уравнения (характеризует постоянную «нераспределенную» часть а1…аn – коэффициенты регрессии, характеризующие изменение выработки от изменения каждого факторного признака на единицу фиксированных значений остальных факторов; x1…xn – факторные признаки (независимые переменные). Построение корреляционной матрицы осуществляется с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Корреляция). При выполнении работы используются инструменты «Пакета анализа» Excel «Корреляция», «Регрессия». При этом, в учебных целях, в работе могут быть использованы не все показатели, рассчитанные с помощью названных инструментов. При использовании инструмента «Корреляция» в работе используются коэффициенты регрессии и прогнозные значения результирующего признака. Все остальные показатели, необходимые для достижения поставленных в работе целей, должны быть рассчитаны с помощью формул, которые приведены в методических указаниях к выполнению работы. 2. На основе расчетных значений коэффициентов корреляции корреляционной матрицы, полученных в ходе выполнения пункта 1, следует оценить их статическую значимость и проверку наличия мультиколлинеарности. Отбор независимых переменных для исключения их из дальнейшего анализа производится если: · теснота связи Rxx≥ 0, 85 (в этом случае одна из независимых переменных, связь которой с зависимой слабее, исключается); · знак коэффициента корреляции Ryx не отвечает известному экономическому содержанию связи между зависимой и независимой переменными (или студент испытывает затруднения с интерпретацией полученной связи); · теснота статистической связи Ryx статически несущественна. Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального. При линейной однофакторной связи t-критерий можно рассчитать по формуле:
где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n (число первоначальных наблюдений = 48). Полученное значение tрасч сравнивают с табличным (Приложение №4) значением t-критерия (для α = 0, 05 с n-2 степенями свободы). Если рассчитанное значение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (то есть отклоняется гипотеза о его случайности). После проведения корреляционного анализа, в соответствии с пунктами 1 – 2 количество факторных признаков, которые будут использоваться в дальнейшей работе может сократиться. 3. Построение множественной регрессии с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Регрессия). 4. В целях возможного отсева грубых погрешностей, в составе исходных данных массива наблюдений, определяются и анализируются отклонения фактических значений зависимой переменной Y от прогноза по регрессии. Если выявленное отклонение превышает тройное среднеквадратическое отклонение уравнения регрессии, то данное наблюдение необходимо исключить, после чего вновь выполняется построение регрессии. Среднеквадратическое отклонение необходимо рассчитать по формуле:
где n – количество наблюдений, y – значения результирующего признака в соответствии с исходными данными,
Исключение наблюдений производится до тех пор, пока фактическое значение переменной Y от прогноза по регрессии не будет превышать тройное среднеквадратическое отклонение по уравнению регрессии. 5. Окончательная проверка значимости всех факторов, включаемых в уравнение регрессии проводится в результате многошагового регрессионного анализа, в ходе которого проверяется значимость каждого фактора в отдельности при одновременном определении каждого коэффициента регрессии, путем вычисления отношения:
где ak – коэффициент множественной регрессии k-го фактора;
Среднеквадратическое отклонение каждого факторного признака множественной регрессии рассчитывается по формуле:
где x - значение факторного признака в соответствии с исходными данными;
Значение · если отношение · если отношение · процесс исключения повторяется до тех пор, пока для всех факторных признаков будет выполняться неравенство 6. Окончательная оценка статистической значимости полученного уравнения множественной регрессии в целом производится с учетом статистики F- распределения Фишера:
где B – исчисленный коэффициент детерминации множественной регрессии; n – количество наблюдений, оставшихся в ходе построения регрессии; m – количество учитываемых объясняющих переменных. Коэффициент детерминации рассчитывается по формуле:
Полученное значение F сравнивается с табличным значением F-распределения Фишера (Приложение №4). Если F≥ Fα, то с вероятностью 95 % связь по уравнению регрессии является статистически значимой и нулевая гипотеза отвергается. В результате многошагового корреляционно-регрессионного анализа необходимо получить статистически значимое уравнение множественной регрессии вида:
|