Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Множественный регрессионный анализ. Модель множественной регрессии. Содержательный смысл стандартизованных и нестандартизованных коэффициентов регрессии. Предсказание по модели.






 

Множественный регрессионный анализ предназначен для изучения влияния двух и более независимых переменных (предикторов) на зависимую переменную. Все переменные должны быть измерены в количественной шкале.

МРА может применяться как для решения прикладных задач, так и в исследовательских целях. Обычно МРА применяется для изучения возможности предсказания некоторого результата по ряду предварительно измеренных характеристик. При этом предполагается, что связь между одной зависимой переменной (Y) и несколькими независимыми переменными (Х) можно выразить линейным уравнением:

Y = b + b1x1 + b2x2 + … + bpxp + e (модель множественной регрессии),

где Y – зависимая переменная, x1, …, xp – независимые переменные, b – свободный член, b1, …, bp – коэффициенты регрессии, e – ошибка предсказания.

Помимо предсказания и определения степени его точности МРА позволяет определить и то, какие показатели (независимые переменные) наиболее существенны, важны для предсказания, а какими можно пренебречь, исключив их из анализа.

Следует отметить родственность множественного регрессионного и дисперсионного анализа. В основе этих методов лежит одна и та же линейная модель. МРА можно рассматривать как аналог многофакторного дисперсионного анализа для случая, когда независимые переменные представляют собой не градации факторов, а измерены в количественной шкале.

Коэффициенты регрессии вычисляются методом наименьших квадратов при решении системы линейных уравнений, с минимизацией ошибки e. После вычисления регрессионных коэффициентов по значениям независимых переменных для каждого из объектов могут быть вычислены оценки зависимой переменной Y:

Ŷ = b + b1x1 + b2x2 + … + bpxp

Сопоставление значений зависимой переменной Y с их оценками Ŷ по выборке испытуемых, для которых значения Y известны, называется анализом остатков или ошибок и позволяет вычислить возможные погрешности предсказания.

Положительный коэффициент при независимой переменной говорит о том, что с возрастанием последней значение зависимой переменной также возрастает. Верно и противоположное утверждение: при отрицательном коэффициенте с возрастанием значения независимой переменной значение зависимой переменной убывает.

Если зависимая и независимые переменные представлены в z-значениях, уравнение регрессии принимает следующий вид:

Y = β 1x1 + β 2x2 + … + β pxp + e,

где β – стандартные (стандартизованные) коэффициенты регрессии.

Стандартные коэффициенты регрессии связаны с исходными корреляциями следующим уравнением (в матричной форме):

B = R-1A,

где В – вектор-столбец стандартных коэффициентов регрессии, R-1 – матрица, обратная корреляционной матрице независимых переменных, А – вектор-столбец корреляций независимых переменных с зависимой переменной. На практике регрессионный анализ начинается именно с вычисления стандартных коэффициентов регрессии. Знак β -коэффициента соответствует знаку коэффициента корреляции данной независимой и зависимой переменной. Абсолютная величина β -коэффициента является максимальной – она равна коэффициенту корреляции с зависимой переменной, если данная независимая переменная не коррелирует ни с одной из других независимых переменных. Чем сильнее данная независимая переменная связана с другими независимыми переменными, тем меньше β -коэффициент.

Статистическая значимость β -коэффициентов рассчитывается по критерию t-Стьюдента.

Множественный регрессионный анализ. Модель множественной регрессии. Содержательный смысл коэффициентов множественной детерминации (КМД) и множественной корреляции (КМК). Критерий определения статистической значимости КМК.

 

Множественный регрессионный анализ предназначен для изучения влияния двух и более независимых переменных (предикторов) на зависимую переменную. Все переменные должны быть измерены в количественной шкале.

МРА может применяться как для решения прикладных задач, так и в исследовательских целях. Обычно МРА применяется для изучения возможности предсказания некоторого результата по ряду предварительно измеренных характеристик. При этом предполагается, что связь между одной зависимой переменной (Y) и несколькими независимыми переменными (Х) можно выразить линейным уравнением:

Y = b + b1x1 + b2x2 + … + bpxp + e (модель множественной регрессии),

где Y – зависимая переменная, x1, …, xp – независимые переменные, b – свободный член, b1, …, bp – коэффициенты регрессии, e – ошибка предсказания.

Коэффициент множественной корреляции R является мерой связи всей совокупности независимых переменных и зависимой переменной; принимает положительные значения от 0 (отсутствие связи) до 1 (строгая прямая связь). КМК наряду с разностями между исходными и оцененными значениями зависимой переменной (ошибкой e) – основные показатели качества модели множественной регрессии.

Коэффициент множественной детерминации – это та часть дисперсии зависимой переменной, которая обуславливается влиянием независимых переменных. Как и КМК, принимает только положительные значения от 0 до 1. Произведение коэффициента β i на коэффициент парной корреляции riY этой переменной с зависимой переменной – это вклад данной переменной в дисперсию зависимой переменной. Ясно, что вклад переменной выше, если ее корреляция с зависимой переменной выше, а с другими независимыми переменными – ниже. Поэтому ценность независимой переменной для МРА определяется не только ее корреляцией с зависимой переменной, но и ее «уникальностью» - слабой связью с другими независимыми переменными.

Если зависимая переменная представлена в z-значениях (дисперсия равна 1), то эта единичная дисперсия зависимой переменной Dy может быть выражена формулой:

Dy = 1 = Σ β iriY + De,

где Dе – часть дисперсии, обусловленная влиянием неучтенных факторов, или дисперсия ошибки предсказания.

КМД, или R2, можно вычислить по формуле

R2 = Σ β iriY = 1 - De

Соответственно, КМК, или R – корень из R2. Статистическая значимость КМК определяется по критерию F-Фишера для соответствующих степеней свободы.

 

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.006 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал