![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Линейный парный регрессионный анализСтр 1 из 3Следующая ⇒
Все существующие связи между признаками классифицируют по степени тесноты, направлению, форме, числу факторов. По степени тесноты связи делят на статистические и функциональные. Статистическая связь - это такая связь между признаками, при которой для каждого значения признака-фактора Xпризнак-результат Статистическая связь обусловлена тем, что: 1) на результативный признак оказывают влияние не только факторы, учтенные в модели (которые мы исследуем), но и неучтенные или неконтролируемые факторы; 2) неизбежностью ошибок измерения значений признаков. Модель статистической связи может быть представлена в общем виде уравнением: где Х – независимая переменная (регрессор);
U – случайная составляющая (случайный остаток). Противоположной статистической связи является функциональная. Функциональной называется такая связь, когда каждому возможному значению признака-фактора
По направлению изменений результативного и факторного признаков связи делят на прямые и обратные. По форме связи (виду функции f) связи делят на прямолинейные (линейные) и криволинейные (нелинейные). По количеству факторов в модели связи подразделяют на однофакторные (парные) и многофакторные. Одним из методов изучения стохастических связей между признаками является регрессионный анализ. Регрессионный анализ представляет собой установление аналитической зависимости между признаками. Он включает следующие этапы: 1) выбор формы связи (вида аналитического уравнения регрессии); 2) оценка параметров уравнения; 3) оценка качества аналитического уравнения регрессии. Наиболее часто для описания статистической связи признаков используется линейная форма. Внимание к линейной связи объясняется четкой экономической интерпретацией ее параметров, ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму. Линейная парная регрессия сводится к нахождению уравнения вида: где
Оценка параметров линейной регрессии проводиться по пространственной выборки (Yi Хi) Метод наименьших квадратов дает наилучшие (эффективные и несмещенные) оценки параметров уравнения регрессии. Но только в том случае, если выполняются определенные предпосылки относительно случайного члена МНК позволяет получить такие оценки параметров S=Σ (Y-Ŷ)2 → min. Проиллюстрируем суть данного метода графически. Для этого построим точечный график по данным наблюдений
Рисунок 1 - Корреляционное поле зависимости между X и Y.
В случае линейной парной зависимости:
Значения В результате получим систему из 2-ух нормальных линейных уравнений:
Решая данную систему, найдем искомые оценки параметров.
где В системе нормальных уравнений индексы опущены для облегчения запоминания. Правильность расчета параметров уравнения регрессии может быть проверена сравнением сумм Σ Y=Σ Ŷ (при этом возможно некоторое расхождение из-за округления расчетов). Знак коэффициента регрессии Формально значение параметра Оценка тесноты связи между признаками осуществляется с помощью коэффициента линейной парной корреляции - Для качественной оценки тесноты связи можно использовать следующую классификацию: 0.1- 0.3- слабая связь 0.3-0.5 – умеренная связь 0.5-0.7- заметная связь 0.7-0.9- тесная связь 0.9-0.99- весьма тесная где
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии Область допустимых значений линейного коэффициента парной корреляции от -1 до +1. Знак коэффициента корреляции указывает направление связи. Если Если данный коэффициент по модулю близок к единице, то связь между признаками может быть интерпретирована как довольно тесная линейная. Если его модуль равен единице Для оценки качества полученного уравнения регрессии рассчитывают теоретический коэффициент детерминации - δ 2 Σ (Ŷ - R2yx= ____ = _____________ σ 2y Σ (Y-
где
В силу теоремы о сложении дисперсий общая дисперсия результативного признака равна сумме объясненной уравнением регрессии
Поэтому коэффициент детерминации может быть рассчитан через остаточную и общую дисперсии:
ε 2 Σ (Y-Ŷ)2 R2=1- ____ = _____________ σ 2y Σ (Y-
где При парной линейной регрессии
|