Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Множественная корреляция
При множественной корреляции устанавливают зависимость результативного признака от двух или более независимых факторов. В отличие от парного анализа он позволяет учесть влияние на результативный показатель комплекса различных факторов, более полно оценить вариацию результативного показателя. При отборе факторов также необходимо учитывать корреляционную зависимость их между собой, поскольку факторы, влияющие на результативный показатель, должны быть независимыми друг от друга. В случае высокой корреляции факторов между собой возникает явление, называемое мультиколлинеарностью, которое искажает величину коэффициентов регрессии, затрудняет их интерпретацию. Для избежания мультиколлинеарности производят отсев факторов с помощью парных коэффициентов корреляции. Исключают один из двух факторов, если корреляция их между собой выше, чем корреляция каждого с результативным признаком Отсев факторов производят также и при оценке значимости коэффициентов регрессии. Об этом подробнее будет сказано ниже. Важное значение, как и при парной корреляции, имеет выбор формы связи. Однако это довольно сложная задача, поскольку факторы оказывают влияние не только на результативный показатель, но и взаимодействуют с собой. В настоящее время вопросы выбора формы связи при множественной корреляции разработаны еще недостаточно. В большинстве случаев для анализа используют уравнение множественной линейной регрессии: , где - результативный признак; х 1, х 2, …, х m – факторные признаки; а 0 – начало отсчета; а 1, а 2, …, аm – коэффициенты регрессии. Определение параметров уравнения, как и при парной корреляции, обычно осуществляется методом наименьших квадратов. Для этого решают систему нормальных уравнений:
Коэффициенты регрессии множественной связи показывают, на сколько изменится величина результативного показателя при изменении значения фактора на единицу при неизменном значении остальных факторов. Общая оценка полученного уравнения проводится с помощью индекса корреляции, который при множественной линейной связи называют коэффициентом множественной корреляции: или , где R – коэффициент множественной корреляции; - общая дисперсия результативного признака; - факторная дисперсия результативного признака; - остаточная дисперсия результативного признака. Коэффициент множественной корреляции показывает степень зависимости результативного признака от факторных признаков. Также как индекс корреляции при парной зависимости, он меняется в пределах от 0 до 1. Квадрат коэффициента множественной корреляции называют коэффициентом множественной детерминации R 2. Он показывает долю общей вариации результативного признака, определяемую всеми факторными признаками, их совокупным действием. При анализе силы влияния факторов на результативный показатель применяют также частные коэффициенты корреляции, которые показывают тесноту связи результативного показателя с одним из факторов при исключении влияния других: , где - частный коэффициент корреляции; - факторная дисперсия результативного признака при исключении влияния фактора хi. Квадраты коэффициентов частной корреляции называют коэффициентами частной детерминации. Они показывают, какую часть вариации можно объяснить, включив в уравнение регрессии новый фактор, то есть роль фактора в сокращении остаточной вариации. Существенность коэффициента множественной корреляции и всего уравнения регрессии в целом оценивают с помощью F -критерия Фишера или t -критерия Стьюдента. Фактические их значения рассчитывают по формулам: , (для большой выборки), (для малой выборки), где n – численность выборочной совокупности; k – число параметров в уравнении регрессии. Полученные значения F -критерия и t -критерия сравнивают с их табличными значениями. При этом число степеней свободы вариации для F -критерия принимают и , для t -критерия - . Если фактические значения критериев превышают табличные, то связь между признаками считается достоверной и уравнение регрессии существенным. Оценку значимости коэффициентов регрессии проводят с помощью t -критерия, который рассчитывают по формуле: . Ее применяют для шагового регрессионного анализа, при котором на каждом шагу поочередно отсеиваются факторы, имеющие незначимый коэффициент регрессии. При этом вначале выбираются те факторы, которые имеют наименьшее фактическое значение t -критерия. Рассмотрим методику корреляционного анализа для множественной корреляции. Пример. Для анализа удоя коров по 26 хозяйствам было отобрано пять факторов, которые могут оказывать влияние на удой: расход кормов на голову, удой матерей, живая масса, продолжительность сухостойного периода и сервис-периода (табл. 7.5).
Т а б л и ц а 7.5
|