Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение . Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле , (9) где – общая дисперсия признака Y, – межгрупповая (факторная) дисперсия признака Y. Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство = 0, а при наличии функциональной связи между ними - равенство = 1. Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле , (10) где yi – индивидуальные значения результативного признака; – общая средняя значений результативного признака; n – число единиц совокупности. Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности: (11) или как средняя взвешенная по частоте групп интервального ряда: (12) Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы. Расчет по формуле (11): = Для расчета общей дисперсии применяется вспомогательная таблица 12. Таблица 12 Вспомогательная таблица для расчета общей дисперсии
Расчет общей дисперсии по формуле (10): Общая дисперсия может быть также рассчитана по формуле , где – средняя из квадратов значений результативного признака, – квадрат средней величины значений результативного признака. Для демонстрационного примера Тогда Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле , (13) где –групповые средние, – общая средняя, –число единиц в j-ой группе, k – число групп. Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5). Таблица 13 Вспомогательная таблица для расчета межгрупповой дисперсии
Расчет межгрупповой дисперсии по формуле (11): Расчет эмпирического коэффициента детерминации по формуле (9): ………………………………или ……….% Вывод. ……..% вариации суммы прибыли банков обусловлено вариацией объема кредитных вложений, а ……..% – влиянием прочих неучтенных факторов. Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле (14) Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14 Шкала Чэддока
Расчет эмпирического корреляционного отношения по формуле (14): Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной. 3. Оценка статистической значимости коэффициента детерминации . Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка. Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле , где n – число единиц выборочной совокупности, m – количество групп, – межгрупповая дисперсия, – дисперсия j-ой группы (j=1, 2, …, m), – средняя арифметическая групповых дисперсий. Величина рассчитывается, исходя из правила сложения дисперсий: , где – общая дисперсия. Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m: k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0, 05 (что соответствует доверительной вероятности Р=0, 95). Если Fрасч> Fтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность. Если Fрасч< Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность. Фрагмент таблицы Фишера критических величин F-критерия для значений =0, 05; k1=3, 4, 5; k2=24-35 представлен ниже:
Расчет дисперсионного F-критерия Фишера для оценки =……..%, полученной при =……………, =………….: Fрас ч Табличное значение F-критерия при = 0, 05:
Вывод: поскольку Fрасч……Fтабл, то величина коэффициента детерминации =……….% признается ……………………. и, следовательно, найденные характеристики связи между признаками Объем кредитных вложений банков и Сумма прибыли банков правомерны ………………………………………………….
.
|