![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Понятие стохастической связи и задачи корреляционно - регрессионного анализа
На практикечасто встречаются зависимости между показателями, которые носят вероятностный, не полностью определенный характер. При стохастической зависимостикаждой величине факторного показателя может соответствовать несколько значений результативного показателя (например, при изменении цены изделия объем реализации в натуральном выражении может снизиться, не изменится или увеличиться). Это объясняется комплексным воздействием большого числа факторов. Таким образом, стохастическая связь – неполная вероятностная зависимость между показателями, которая проявляется только при большом числе наблюдений. Для определения наличия и направления стохастической зависимости между показателями используются такие способы анализа, как аналитические группировки, сравнение параллельных временных рядов данных, аналитические группировки, построение корреляционных полей или диаграмм разброса. Все перечисленные методы позволяют визуально определить наличие связи. Для определения силы зависимости и степени влияния каждого фактора на уровень результативного показателя используют корреляционный анализ, т.е. исчисление различных коэффициентов корреляции. Применение корреляционного анализа позволяет решить следующие задачи: 1. определить наличие и направление зависимости между показателями; 2. оценить степень или силу зависимости между показателями. Различают парную и множественную зависимость (корреляцию) между показателями. Парная корреляция – это связь между двумя показателями, один из которых является факторным, другой – результативным. Множественная корреляция возникает от взаимодействия нескольких факторов с результативным показателем. Зная вид зависимости между показателями, можно предсказывать значения одной переменной на основании значений других переменных. Для этих целей используют регрессионный анализ. Цель регрессионного анализа – разработать статистическую модель, позволяющую предсказывать значения зависимой (результативной) переменной по значениям, по крайней мере, одной независимой (факторной) переменной. Такие модели называют регрессионными моделями или уравнениями регрессии:
где Основными задачами регрессионного анализа являются: - определение вида зависимости - определение оценок неизвестных параметров - оценка качества построенного уравнения регрессии (верификация модели). 1.6.2 Изучение стохастических зависимостей в случае парной корреляции Для достижения целей корреляционного анализа, прежде всего, выясняют наличие и силу зависимости между изучаемыми показателями. Для этого вычисляют коэффициенты корреляции. Коэффициент парной линейной корреляции характеризует тесноту и направление связи между двумя количественными признаками:
Если Значимость линейного коэффициента корреляции проверяется на основе t -статистики (критерий Стьюдента), при этом выдвигается и проверяется гипотеза о равенстве коэффициента корреляции нулю. Для проверки этой гипотезы используется статистика:
которая имеет распределение Стьюдента с числом степеней свободы ν = п- 2. Если установлено наличие статистически значимой зависимости между показателями, то проводят регрессионный анализ. Определение вида зависимости проводится по расположению точек наблюдений ( Модель парной линейной регрессии имеет вид:
Здесь Y – результативный показатель, Х – факторный показатель; Коэффициенты Суть метода наименьших квадратов состоит в минимизации суммы квадратов отклонений точек наблюдений от уравнения регрессии для определения оценок параметров уравнения
Здесь Значения
где
Подставляя найденные параметры Оценка качества построенного уравнения регрессии включает следующие пункты: - оценка адекватности модели или анализ общего качества регрессионной модели; - оценка статистической значимости коэффициентов уравнения регрессии. Мерой адекватности модели служит доля разброса зависимой переменной, которую можно объяснить с помощью уравнения регрессии. В качестве меры адекватности используют коэффициент детерминации
В случае парной корреляции квадрат линейного коэффициента корреляции равен коэффициенту детерминации В общем случае Возникает вопрос, какую величину Если справедлива гипотеза Для проверки используют статистику
Оценка статистической значимости коэффициентов уравнения регрессии Оценка статистической значимости коэффициентов уравнения регрессии заключается в проверке наличия статистически значимой зависимости между переменными зависимой переменной Y и факторной переменной Проверяемые гипотезы формулируются следующим образом: Если справедлива гипотеза Если справедлива гипотеза Для проверки используют статистику:
Статистика Для оценки степени влияния изменения факторного показателя на изменение результативного показателя в относительном выражении можно рассчитать коэффициент эластичности (Э), который показывает, на сколько процентов измениться результативный показатель, если факторный возрастет на один процент: Для оценивания прогнозных качеств построенного уравнения регрессии рассчитывают среднюю ошибку аппроксимации (А):
Чем меньше ошибка аппроксимации, тем выше прогнозные качества уравнения регрессии и точность построенных прогнозов с использованием регрессионный модели (таблица 1.13).
Таблица 1.13 - Зависимость точности уравнения регрессии от средней ошибки аппроксимации
1.6.3 Методика изучение стохастических зависимостей в случае множественной корреляции Методика проведения корреляционно – регрессионного анализа в случае множественной корреляции состоит из следующих этапов: спецификация, параметризация, верификация и практическое использование модели. Спецификация модели При построении регрессионных моделей важное значение имеет выбор независимых (факторных) переменных для предсказания значений результативного показателя. Общего алгоритма такого выбора не существует. При отборе следует придерживаться определенных правил: между факторными и результативным показателями должна существовать значимая причинно-следственная связь; не рекомендуется включать в расчет взаимосвязанные факторные показатели (если коэффициент парной линейной корреляции больше 0, 85, то один из факторов надо исключить). Для оценивания зависимости между показателями рассчитывают различные коэффициенты корреляции. В уравнение регрессии следует включать только те факторные переменные, связь которых с результативным признаком, является статистически значимой (проверяется по критерию Стьюденту). Для определения вида зависимости между факторными и результативным показателями следует использовать теоретические зависимости той отрасли знаний, к которой относятся исследуемые явления. В качестве вспомогательного инструмента при определении вида зависимости можно использовать попарные диаграммы разброса между результативной и факторной переменными. Параметризация модели Для оценивания параметров модели используют метод наименьших квадратов. На практике для определения коэффициентов используют специальные компьютерные программы (например, Пакет анализа MS Excel, EViews и другие). Верификация модели Оценка качества построенной модели аналогична случаю парной корреляции. Если коэффициент 1. Исходную модель, которая включает все переменные, назовем моделью без ограничений. Коэффициент детерминации данной модели обозначим 2. Оценивается модель, в которой исключены незначимые переменные. Назовем эту модель моделью с ограничениями. Для нее определяют коэффициент детерминации 3. Если коэффициент детерминации Для ответа на вопрос, какое различие между коэффициентами детерминации считать существенным, необходимо проверить гипотезы: Если справедлива гипотеза Для проверки используют статистику Интерпретация моделей регрессий осуществляется методами той отрасли знаний, к которой относятся исследуемые явления. Коэффициент С целью расширения возможностей анализа и интерпретации регрессионных моделей можно рассчитать коэффициенты эластичности, определяемые по формуле: Чтобы оценить какая из объясняющих переменных Стандартизованный коэффициент регрессии показывает, на сколько стандартных отклонений изменится переменная Y при изменении переменной Практическое применение уравнения регрессии. Уравнение регрессии можно использовать для следующих целей: · расчета влияния факторов на результативный показатель:
· подсчета резервов повышения (понижения) уровня исследуемого показателя:
· планирования и прогнозирования значений результативного показателя. С этой целью в конечное уравнение связи подставляют возможные значения факторных показателей. Вопросы для самопроверки по теме 1.6 1. Что представляет собой стохастическая (корреляционная) связь между показателями? 2. Каковы виды корреляций? 3. Какова последовательность изучения стохастических зависимостей? 4. Как оценить тесноту связи между показателями? 5. Какие значения может принимать коэффициент корреляции? 6. На что указывает знак коэффициента корреляции? 7. Что означают параметры в уравнении регрессии? 8. По значению какого параметра осуществляют интерпретацию уравнения? 9. Что показывает коэффициент детерминации? 10. Какой показатель следует рассчитать для определения прогнозных качеств уравнения регрессии? 11. Для чего определяется коэффициент эластичности? 12. Каковы этапы множественного корреляционного анализа? 13. Для каких целей можно использовать конечное уравнение регрессии?
Типовые вопросы-тесты по теме 1.6 1. Для каких целей можно использовать конечное уравнение связи при стохастической зависимости: а) для расчета влияния факторов на величину результата; б) для оценки результатов хозяйствования; в) для определения величины резервов; г) для прогнозирования величины результата; д) для всех выше названных целей. 2. Что является первым этапом методики множественного корреляционного анализа: а) статистическая обработка исходных данных; б) спецификация модели; в) верификация модели; г) параметризация модели; д) интерпретация модели. 3. Каков уровень коэффициента корреляции при усилении тесноты связи между показателями при стохастической зависимости: а) чем ближе к +1; б) чем ближе к -1; в) чем ближе к нулю; г) невозможно судить о тесноте связи по величине коэффициента корреляции; д) нет правильного ответа. 4. Какой показатель отражает тесноту связи при корреляционной зависимости: а) параметры уравнения связи; б) коэффициент детерминации; в) коэффициент корреляции; г) коэффициент вариации; д) среднеквадратическое отклонение. 5. Какой показатель характеризует общее качество уравнения регрессии: а) параметр уравнения регрессии; б) коэффициент детерминации; в) коэффициент корреляции; г) коэффициент вариации; д) среднеквадратическое отклонение. 6. Что обозначает параметр b в модели парной линейной регрессии: а) на сколько единиц изменится результативный показатель при увеличении факторного показателя на единицу собственного измерения; б) на сколько единиц изменится факторный показатель при увеличении результативного показателя на единицу собственного измерения; в) на сколько процентов изменится факторный показатель при увеличении результативного показателя на один процент; г) на сколько процентов изменится результативный показатель при увеличении факторного показателя на один процент; д) на сколько единиц изменится результативный показатель при увеличении и факторного показателя на один процент; 7. Что является последним этапом методики множественного корреляционного анализа: а) статистическая обработка исходных данных; б) спецификация модели; в) верификация модели; г) параметризация модели; д) практическое использование модели.
|