Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корреляционный анализ
Различают:
Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул: (5.16) . (5.17) Оценка линейного коэффициента корреляции
Значимость линейного коэффициента корреляции проверяется на основе t- критерия Стьюдента. Для этого определяется фактическое значение критерия : , (5.18) Вычисленное по формуле (6.18) значение сравнивается с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы ν. Коэффициент корреляции считается статистически значимым, если t расч превышает : t расч > . Универсальным показателем тесноты связи является теоретическое корреляционное отношение: , (5.19) где – общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х; – факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у; – остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х. По правилу сложения дисперсий: , т.е. . (5.19) Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)
Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = | r|. Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле: , (5.20) где – парные коэффициенты корреляции между признаками. Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .
Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера: , (5.21) где R 2 – коэффициент множественной детерминации (R 2 ); k – число факторных признаков, включенных в уравнение регрессии.
Связь считается существенной, если F расч > F табл – табличного значения F- критерия для заданного уровня значимости α и числе степеней свободы ν 1 = k, ν 2 = n – k – 1. Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х 2, во втором – х 1): ; , (5.22) где r – парные коэффициенты корреляции между указанными в индексе переменными. Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности: , (5.23) где – среднее значение соответствующего факторного признака; – среднее значение результативного признака; – коэффициент регрессии при i -м факторном признаке. Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов. Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i -го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле: , (5.24) где – парный коэффициент корреляции между результативным и i -м факторным признаком; – соответствующий стандартизованный коэффициент уравнения множественной регрессии: . (5.25) Пример По данным о стоимости основных производственных фондов (СОПФ) и объеме валовой продукции (ВП) определить линейное уравнение связи.
; . Уравнение регрессии имеет вид: . Следовательно, с увеличением стоимости основных фондов на 1 млн.руб. объем валовой продукции увеличивается в среднем на 5, 6 млн. руб. Проверим значимость полученных коэффициентов регрессии. Рассчитаем и : для параметра а 0: для параметра а 1: . По таблице Стьюдента с учетом уровня значимости =5% и числа степеней свободы ν =10-1-1=8 получаем =2, 306. Фактические значения и превышают табличное критическое значение . Это позволяет признать вычисленные коэффициенты корреляции типичными. Пример По данным предыдущего примера оценить тесноту связи между признаками, оценить значимость найденного коэффициента корреляции. , или . Значение коэффициента корреляции свидетельствует о сильной прямой связи между рассматриваемыми признаками. Значение t расч превышает найденное по таблице значение =2.306, что позволяет сделать вывод о значимости рассчитанного коэффициента корреляции.
Пример Имеются некоторые данные о среднегодовой стоимости ОПФ (СОПФ), уровне затрат на реализацию продукции (ЗРП) и стоимости реализованной продукции (РП). Считая зависимость между этими показателями линейной, определить уравнение связи; вычислить множественный и частные коэффициенты корреляции, оценить значимость модели.
Решение. Составим систему нормальных уравнений МНК: Выразим из 1-го уравнения системы a 0 = 29, 4 – 6, 6· a 1 – 9· a 2. Подставив во 2-е уравнение это выражение, получим: . Далее подставляем в 3-е уравнение вместо a 0 и a 1 полученные выражения и решаем его относительно a 2 с точностью не менее 3-х знаков после запятой. Итак: a 0 = 12, 508; a 1 = 2, 672; a 2 = – 0, 082; = 12, 508 + 2, 672· х 1 – 0, 082· х 2. = = 0, 884; = = 0, 777; = = 0, 893; =0, 893. Проверим значимость r (α = 0, 01 и ν = 7): = 5, 00; = 3, 27. =5, 00 > t табл=3, 50 – коэффициент корреляции x 1 значим; =3, 27 < t табл=3, 50 – коэффициент корреляции x 2 не значим. Произведенные расчеты подтверждают условие включения факторных признаков в регрессионную модель – между результативным и факторными признаками существует тесная связь ( = 0, 884; = 0, 777), однако между факторными признаками достаточно существенная связь ( = 0, 893). Включение в модель фактора x 2 незначительно увеличивает коэффициент корреляции ( = 0, 884; =0, 893), поэтому включение в модель фактора x 2 нецелесообразно. Вычислим стандартизованные коэффициенты уравнения множественной регрессии:
Отсюда вычислим частные коэффициенты детерминации:
т.е. вариация результативного признака объясняется главным образом вариацией фактора x1. Вычислим частные коэффициенты эластичности:
Проверим адекватность модели на основе критерия Фишера: Найдем значение табличного значения F-критерия для уровня значимости α =0, 05 и числе степеней свободы ν 1 = 2, ν 2 = 10 –2 – 1: Fтабл=4, 74. Превышение значения Fрасч над значением Fтабл позволяет считать коэффициент множественной детерминации значимым, а соответственно и модель – адекватной, а выбор формы связи - правильным.
|