Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Программных средств Microsoft Excel
1. Для целей регрессионного анализа используется линейная модель множественной регрессии, имеющей вид:
= а0 + а1х1 + а2х2 + … аnxn,...........................(2)
где: – среднемесячная выработка одного рабочего, занятого на СМР; а0 – свободный член уравнения (характеризует постоянную «нераспределенную» часть вне зависимости от воздействия факторных признаков); а1…аn – коэффициенты регрессии, характеризующие изменение выработки от изменения каждого факторного признака на единицу фиксированных значений остальных факторов; x1…xn – факторные признаки (независимые переменные). Построение корреляционной матрицы осуществляется с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Корреляция). При выполнении работы используются инструменты «Пакета анализа» Excel «Корреляция», «Регрессия». При этом, в учебных целях, в работе могут быть использованы не все показатели, рассчитанные с помощью названных инструментов. При использовании инструмента «Корреляция» в работе используются коэффициенты регрессии и прогнозные значения результирующего признака. Все остальные показатели, необходимые для достижения поставленных в работе целей, должны быть рассчитаны с помощью формул, которые приведены в методических указаниях к выполнению работы. 2. На основе расчетных значений коэффициентов корреляции корреляционной матрицы, полученных в ходе выполнения пункта 1, следует оценить их статическую значимость и проверку наличия мультиколлинеарности. Отбор независимых переменных для исключения их из дальнейшего анализа производится если: · теснота связи Rxx≥ 0, 85 (в этом случае одна из независимых переменных, связь которой с зависимой слабее, исключается); · знак коэффициента корреляции Ryx не отвечает известному экономическому содержанию связи между зависимой и независимой переменными (или студент испытывает затруднения с интерпретацией полученной связи); · теснота статистической связи Ryx статически несущественна. Для оценки значимости коэффициента корреляции r используют t-критерий Стьюдента, который применяется при t-распределении, отличном от нормального. При линейной однофакторной связи t-критерий можно рассчитать по формуле: .......................................(3) где (n - 2) – число степеней свободы при заданном уровне значимости α и объеме выборки n (число первоначальных наблюдений = 48). Полученное значение tрасч сравнивают с табличным (Приложение №4) значением t-критерия (для α = 0, 05 с n-2 степенями свободы). Если рассчитанное значение tрасч превосходит табличное значение критерия tтабл, то практически невероятно, что найденное значение обусловлено только случайными колебаниями (то есть отклоняется гипотеза о его случайности). После проведения корреляционного анализа, в соответствии с пунктами 1 – 2 количество факторных признаков, которые будут использоваться в дальнейшей работе может сократиться. 3. Построение множественной регрессии с помощью средств пакета анализа программного продукта Excel (Сервис→ Анализ данных→ Регрессия). 4. В целях возможного отсева грубых погрешностей, в составе исходных данных массива наблюдений, определяются и анализируются отклонения фактических значений зависимой переменной Y от прогноза по регрессии. Если выявленное отклонение превышает тройное среднеквадратическое отклонение уравнения регрессии, то данное наблюдение необходимо исключить, после чего вновь выполняется построение регрессии. Среднеквадратическое отклонение необходимо рассчитать по формуле: ........................................(4)
где n – количество наблюдений, y – значения результирующего признака в соответствии с исходными данными, - прогнозное значения результирующего признака. Исключение наблюдений производится до тех пор, пока фактическое значение переменной Y от прогноза по регрессии не будет превышать тройное среднеквадратическое отклонение по уравнению регрессии. 5. Окончательная проверка значимости всех факторов, включаемых в уравнение регрессии проводится в результате многошагового регрессионного анализа, в ходе которого проверяется значимость каждого фактора в отдельности при одновременном определении каждого коэффициента регрессии, путем вычисления отношения:
................................................(5)
где ak – коэффициент множественной регрессии k-го фактора; - среднеквадратическое отклонение k-го фактора. Среднеквадратическое отклонение каждого факторного признака множественной регрессии рассчитывается по формуле:
...............................................................(6)
где x - значение факторного признака в соответствии с исходными данными; - среднеарифметическое значение факторного признака. Значение рассчитывается для всех факторов, входящих в состав уравнения множественной регрессии, за исключением тех факторов, которые были поочередно (по одному) исключены из уравнения регрессии на предыдущих этапах работы по разным причинам: · если отношение меньше табличного tα , ν , найденного по таблице t-распределения Стьюдента (Приложение №4) с α = 0, 05 и ν = n-m-1 (n – число наблюдений, m - число объясняющих переменных), то с вероятностью 95% рассматриваемый факторный признак является в уравнении регрессии незначимым с n-m-1 степенями свободы; · если отношение меньше табличного одновременно для нескольких факторов, то незначимые факторы исключаются из уравнения множественной регрессии поочередно по одному, начиная с того факторного признака у которого отношение минимальное. После исключения каждого факторного признака необходимо заново построить регрессию, поскольку ранее незначимые факторы могут стать значимыми после исключения одного из них; · процесс исключения повторяется до тех пор, пока для всех факторных признаков будет выполняться неравенство ≥ tα , ν , что свидетельствует о том, что все факторы значимы. 6. Окончательная оценка статистической значимости полученного уравнения множественной регрессии в целом производится с учетом статистики F- распределения Фишера: .............................................(7)
где B – исчисленный коэффициент детерминации множественной регрессии; n – количество наблюдений, оставшихся в ходе построения регрессии; m – количество учитываемых объясняющих переменных. Коэффициент детерминации рассчитывается по формуле:
...........................................................(8)
Полученное значение F сравнивается с табличным значением F-распределения Фишера (Приложение №4). Если F≥ Fα, то с вероятностью 95 % связь по уравнению регрессии является статистически значимой и нулевая гипотеза отвергается. В результате многошагового корреляционно-регрессионного анализа необходимо получить статистически значимое уравнение множественной регрессии вида:
= а0 + а1х1 + а2х2 + … аnxn....................................................(9)
|