Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Корреляционный анализ






Различают:

  • парную корреляцию – это зависимость между результативным и факторным признаком;
  • частную корреляцию – это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков;
  • множественную – многофакторное влияние в статической модели .

Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул:

(5.16)

. (5.17)

Оценка линейного коэффициента корреляции

Значение r Характер связи Интерпретация связи
r = 0 Отсутствует Изменение x не влияет на изменения y
0 < r < 1 Прямая С увеличением x увеличивается y
-1 > r > 0 Обратная С увеличением x уменьшается y и наоборот
r = 1 Функциональная Каждому значению факторного признака строго соответствует одно значение результативного

 

Значимость линейного коэффициента корреляции проверяется на основе t- критерия Стьюдента. Для этого определяется фактическое значение критерия :

, (5.18)

Вычисленное по формуле (6.18) значение сравнивается с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы ν. Коэффициент корреляции считается статистически значимым, если t расч превышает : t расч > .

Универсальным показателем тесноты связи является теоретическое корреляционное отношение:

, (5.19)

где общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х;

факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у;

остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х.

По правилу сложения дисперсий:

, т.е. . (5.19)

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)

Значение Характер связи   Значение Характер связи
η = 0 Отсутствует   0, 5 ≤ η < 0, 7 Заметная
0 < η < 0, 2 Очень слабая   0, 7 ≤ η < 0, 9 Сильная
0, 2 ≤ η < 0, 3 Слабая   0, 9 ≤ η < 1 Весьма сильная
0, 3 ≤ η < 0, 5 Умеренная   η = 1 Функциональная

Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = | r|.

Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле:

, (5.20)

где парные коэффициенты корреляции между признаками.

Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: .

 

Условие включения факторных признаков в регрессионную модель – наличие тесной связи между результативным и факторными признаками и как можно менее существенная связь между факторными признаками.

 

Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера:

, (5.21)

где R 2 – коэффициент множественной детерминации (R 2 );

k – число факторных признаков, включенных в уравнение регрессии.

 

Связь считается существенной, если F расч > F табл – табличного значения F- критерия для заданного уровня значимости α и числе степеней свободы ν 1 = k, ν 2 = n – k – 1.

Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х 2, во втором – х 1):

; , (5.22)

где r – парные коэффициенты корреляции между указанными в индексе переменными.

Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности:

, (5.23)

где – среднее значение соответствующего факторного признака;

– среднее значение результативного признака;

– коэффициент регрессии при i -м факторном признаке.

Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.

Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i -го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле:

, (5.24)

где – парный коэффициент корреляции между результативным и i -м факторным признаком;

– соответствующий стандартизованный коэффициент уравнения множественной регрессии:

. (5.25)

Пример

По данным о стоимости основных производственных фондов (СОПФ) и объеме валовой продукции (ВП) определить линейное уравнение связи.

 

Номер предприятия СОПФ (), млн. руб. ВП (y), млн. руб. 2 2
            19, 4 0, 36 20, 25
                12, 25
            30, 6 0, 16 6, 25
            36, 2 27, 04 2, 25
            41, 8 3, 24 0, 25
            47, 4 73, 96 0, 25
                2, 25
            58, 6 1, 96 6, 25
            64, 2 17, 64 12, 25
            69, 8 0, 04 20, 25
Сумма             125, 4 82, 5
Среднее 5, 5 44, 5 290, 7 38, 5 2248, 7 44, 5    

;

.

Уравнение регрессии имеет вид:

.

Следовательно, с увеличением стоимости основных фондов на 1 млн.руб. объем валовой продукции увеличивается в среднем на 5, 6 млн. руб.

Проверим значимость полученных коэффициентов регрессии. Рассчитаем и :

для параметра а 0:

для параметра а 1: .

По таблице Стьюдента с учетом уровня значимости =5% и числа степеней свободы ν =10-1-1=8 получаем =2, 306.

Фактические значения и превышают табличное критическое значение . Это позволяет признать вычисленные коэффициенты корреляции типичными.

Пример По данным предыдущего примера оценить тесноту связи между признаками, оценить значимость найденного коэффициента корреляции.

, или .

Значение коэффициента корреляции свидетельствует о сильной прямой связи между рассматриваемыми признаками.

Значение t расч превышает найденное по таблице значение =2.306, что позволяет сделать вывод о значимости рассчитанного коэффициента корреляции.

 

Пример Имеются некоторые данные о среднегодовой стоимости ОПФ (СОПФ), уровне затрат на реализацию продукции (ЗРП) и стоимости реализованной продукции (РП). Считая зависимость между этими показателями линейной, определить уравнение связи; вычислить множественный и частные коэффициенты корреляции, оценить значимость модели.

СОПФ (х 1), млн.руб. ЗРП (х 2), в % к РП РП (y), млн.руб. х 1 х 2 х 1 y х 2 y
                20, 36
                20, 05
                24, 21
                26, 91
                30, 54
                29, 08
                33, 24
                35, 01
                36, 25
                38, 33
S = 66 S = 90 S = 294 S = 490 S = 1018 S = 688 S = 2078 S = 2880 S = 294
=6, 6 =9, 0 =29, 4 =68, 8 =207, 8 =288, 0

Решение. Составим систему нормальных уравнений МНК:

Выразим из 1-го уравнения системы a 0 = 29, 4 – 6, 6· a 1 – 9· a 2.

Подставив во 2-е уравнение это выражение, получим:

.

Далее подставляем в 3-е уравнение вместо a 0 и a 1 полученные выражения и решаем его относительно a 2 с точностью не менее 3-х знаков после запятой. Итак:

a 0 = 12, 508; a 1 = 2, 672; a 2 = – 0, 082; = 12, 508 + 2, 672· х 1 – 0, 082· х 2.

= = 0, 884;

= = 0, 777;

= = 0, 893;

=0, 893.

Проверим значимость r (α = 0, 01 и ν = 7):

= 5, 00; = 3, 27.

=5, 00 > t табл=3, 50 коэффициент корреляции x 1 значим;

=3, 27 < t табл=3, 50 коэффициент корреляции x 2 не значим.

Произведенные расчеты подтверждают условие включения факторных признаков в регрессионную модель – между результативным и факторными признаками существует тесная связь ( = 0, 884; = 0, 777), однако между факторными признаками достаточно существенная связь ( = 0, 893). Включение в модель фактора x 2 незначительно увеличивает коэффициент корреляции ( = 0, 884; =0, 893), поэтому включение в модель фактора x 2 нецелесообразно.

Вычислим стандартизованные коэффициенты уравнения множественной регрессии:

Отсюда вычислим частные коэффициенты детерминации:

т.е. вариация результативного признака объясняется главным образом вариацией фактора x1.

Вычислим частные коэффициенты эластичности:

Проверим адекватность модели на основе критерия Фишера:

Найдем значение табличного значения F-критерия для уровня значимости α =0, 05 и числе степеней свободы ν 1 = 2, ν 2 = 10 –2 – 1: Fтабл=4, 74. Превышение значения Fрасч над значением Fтабл позволяет считать коэффициент множественной детерминации значимым, а соответственно и модель – адекватной, а выбор формы связи - правильным.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.014 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал