![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Математико-статистические идеи метода. Исходным положением линейного МРА является возможность представления значений «зависимой» переменной y через значения «независимых» переменных х1
Исходным положением линейного МРА является возможность представления значений «зависимой» переменной Y через значения «независимых» переменных х1, х2,..., хР в виде линейного уравнения:
где b — свободный член (Intercept), bb..., bP — b — коэффициенты регрессии (Unstandardized Coefficients), e — ошибка оценки (Residual). Коэффициенты регрессии вычисляются методом наименьших квадратов при решении системы из линейных уравнений, с минимизацией ошибки е. После вычисления регрессионных коэффициентов по значениям независимых переменных для каждого из объектов могут быть вычислены оценки зависимой переменной Y (Predicted Values):
Сопоставление значений зависимой переменной Yi c их оценками Далее можно вычислить коэффициент корреляции Пирсона между известными значениями «зависимой» переменной и ее оценками. Это один из способов получения коэффициента множественной корреляции (КМК) между «зависимой» и «независимыми» переменными. Коэффициент множественной корреляции — это мера линейной связи одной переменной с множеством других переменных; принимает положительные значения от 0 (отсутствие связи) до 1 (строгая прямая связь). КМК наряду с разностями между исходными и оцененными значениями «зависимой» переменной (ошибки е) — основные показатели качества модели множественной регрессии. Если «зависимая» и «независимые» переменные представлены в z -значениях, то уравнение регрессии принимает вид:
где Стандартные коэффициенты регрессии связаны с исходными корреляциями следующим уравнением (в матричной форме):
где В — вектор-столбец стандартных коэффициентов регрессии, Напомним, что в случае двумерной регрессии — при наличии всего одной независимой переменной, уравнение 15.3 имеет вид:
то есть стандартный коэффициент регрессии равен коэффициенту корреляции зависимой и независимой переменных. Знак Следует отметить, что взаимовлияние (системный эффект) независимых переменных может как уменьшать, так и увеличивать абсолютную величину Произведение коэффициента Если зависимая переменная в z -значениях (дисперсия равна 1), то эта единичная дисперсия «зависимой» переменной DY может быть выражена формулой: где De — часть дисперсии, обусловленная влиянием неучтенных факторов, или дисперсия ошибки предсказания. Часть дисперсии «зависимой» переменной, обусловленная влиянием «независимых» переменных, — это коэффициент множественной детерминации (КМД), который равен коэффициенту множественной корреляции в квадрате или R2:
Соответственно, второй способ вычленить КМК:
Интерпретация КМДочевидна: это та часть дисперсии «зависимой» переменной, которая определяется «независимыми» переменными. Следовательно, (1 – КМД) — это дисперсия ошибки оценки. Например, если КМК= 0, 8, то КМД = (КМК)2 = 0, 64. Это означает, что 64% дисперсии «зависимой» переменной определяется исходными переменными, а 36% ее дисперсии относится к ошибке оценки. Основной показатель состоятельности МРА(модели множественной регрессии) — коэффициент множественной корреляции (R). Подобно корреляции Пирсона, он является мерой линейной взаимосвязи одной переменной с совокупностью других переменных, но в отличие от него, принимает только положительные значения (от 0 до 1). Статистическая значимость КМК определяется по критерию F -Фишера для соответствующих степеней свободы. Для полноценной интерпретации результатов МРАнеобходимо, чтобы статистически значимыми были КМК и все Таким образом, основными целями МРАявляются: 1. Определение того, в какой мере «зависимая» переменная связана с совокупностью «независимых» переменных, какова статистическая значимость этой взаимосвязи. Показатель — коэффициент множественной корреляции (КМК) и его статистическая значимость по критерию F -Фишера. 2. Определение существенности вклада каждой «независимой» переменной в оценку «зависимой» переменной, отсев несущественных для предсказания «независимых» переменных. Показатели — регрессионные коэффициенты 3. Анализ точности предсказания и вероятных ошибок оценки «зависимой» переменной. Показатель — квадрат КМК, интерпретируемый как доля дисперсии «зависимой» переменной, объясняемая совокупностью «независимых» переменных. Вероятные ошибки предсказания анализируются по расхождению (разности) действительных значений «зависимой» переменной и оцененных при помощи модели МРА. 4. Оценка (предсказание) неизвестных значений «зависимой» переменной по известным значениям «независимых» переменных. Осуществляется по вычисленным параметрам множественной регрессии.
|