Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство = 0, а при наличии функциональной связи между ними - равенство = 1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
, (10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
=
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер
банка
п/п
| Прибыль, млн руб.
|
|
|
|
|
|
|
|
|
| 45, 1
| -11, 803
| 139, 3187
| 2034, 01
|
| 6, 2
| -50, 703
| 2570, 8280
| 38, 44
|
| 67, 0
| 10, 097
| 101, 9427
| 4489, 00
|
| 27, 3
| -29, 603
| 876, 3573
| 745, 29
|
| 62, 5
| 5, 597
| 31, 3227
| 3906, 25
|
| 60, 0
| 3, 097
| 9, 5893
| 3600, 00
|
| 16, 9
| -40, 003
| 1600, 2667
| 285, 61
|
| 20, 9
| -36, 003
| 1296, 2400
| 436, 81
|
| 65, 0
| 8, 097
| 65, 5560
| 4225, 00
|
| 16, 0
| -40, 903
| 1673, 0827
| 256, 00
|
| 69, 0
| 12, 097
| 146, 3293
| 4761, 00
|
| 35, 0
| -21, 903
| 479, 7560
| 1225, 00
|
| 53, 4
| -3, 503
| 12, 2733
| 2851, 56
|
| 66, 2
| 9, 297
| 86, 4280
| 4382, 44
|
| 56, 0
| -0, 903
| 0, 8160
| 3136, 00
|
| 58, 0
| 1, 097
| 1, 2027
| 3364, 00
|
| 47, 0
| -9, 903
| 98, 0760
| 2209, 00
|
| 64, 7
| 7, 797
| 60, 7880
| 4186, 09
|
| 46, 2
| -10, 703
| 114, 5613
| 2134, 44
|
| 53, 7
| -3, 203
| 10, 2613
| 2883, 69
|
| 67, 0
| 10, 097
| 101, 9427
| 4489, 00
|
| 68, 0
| 11, 097
| 123, 1360
| 4624, 00
|
| 70, 0
| 13, 097
| 171, 5227
| 4900, 00
|
| 80, 1
| 23, 197
| 538, 0853
| 6416, 01
|
| 67, 7
| 10, 797
| 116, 5680
| 4583, 29
|
| 72, 0
| 15, 097
| 227, 9093
| 5184, 00
|
| 84, 0
| 27, 097
| 734, 2293
| 7056, 00
|
| 87, 0
| 30, 097
| 905, 8093
| 7569, 00
|
| 90, 2
| 33, 297
| 1108, 6680
| 8136, 04
|
| 85, 0
| 28, 097
| 789, 4227
| 7225, 00
| Итого
| 1707, 1
| 1650, 197
| 14192, 2897
| 111331, 97
|
Расчет общей дисперсии по формуле (10):

Общая дисперсия может быть также рассчитана по формуле
,
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера


Тогда

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по размеру кредитных вложений,
млн руб.
| Число банков,
| Среднее значение в группе
|
|
|
|
|
|
|
| 40 – 90
|
|
|
|
| 90 – 140
|
|
|
|
| 140 – 190
|
| 59, 283
| 2, 380
| 67, 9728
| 190 – 240
|
| 78, 222
| 21, 319
| 4090, 4552
| Итого
|
|
|
| 10653, 9291
| Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического коэффициента детерминации по формуле (9):
………………………………или ……….%
Вывод. ……..% вариации суммы прибыли банков обусловлено вариацией объема кредитных вложений, а ……..% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
h
| 0, 1 – 0, 3
| 0, 3 – 0, 5
| 0, 5 – 0, 7
| 0, 7 – 0, 9
| 0, 9 – 0, 99
| Характеристика
силы связи
| Слабая
| Умеренная
| Заметная
| Тесная
| Весьма тесная
| Расчет эмпирического корреляционного отношения по формуле (14):

Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной.
3. Оценка статистической значимости коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
,
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1, 2, …, m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m: k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0, 05 (что соответствует доверительной вероятности Р=0, 95).
Если Fрасч> Fтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч< Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0, 05; k1=3, 4, 5; k2=24-35 представлен ниже:
| k2
| k1
|
|
|
|
|
|
|
|
|
|
|
|
|
| 3, 01
| 2, 99
| 2, 98
| 2, 96
| 2, 95
| 2, 93
| 2, 92
| 2, 91
| 2, 90
| 2, 89
| 2, 88
| 2, 87
|
| 2, 78
| 2, 76
| 2, 74
| 2, 73
| 2, 71
| 2, 70
| 2, 69
| 2, 68
| 2, 67
| 2, 66
| 2, 65
| 2, 64
|
| 2, 62
| 2, 60
| 2, 59
| 2, 57
| 2, 56
| 2, 55
| 2, 53
| 2, 52
| 2, 51
| 2, 50
| 2, 49
| 2, 48
|
Расчет дисперсионного F-критерия Фишера для оценки =……..%, полученной при =……………, =………….:
Fрас ч
Табличное значение F-критерия при = 0, 05:
Вывод: поскольку Fрасч……Fтабл, то величина коэффициента детерминации =……….% признается ……………………. и, следовательно, найденные характеристики связи между признаками Объем кредитных вложений банков и Сумма прибыли банков правомерны ………………………………………………….
.
|