Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Block 0: Beginning Block
Classification Tablea, b
|
| Observed
| Predicted
|
| Используют Интернет каждый день, или нет
| Percentage Correct
|
| Не используют Интернет каждый день
| Используют Интернет каждый день
| Step 0
| Используют Интернет каждый день, или нет
| Не используют Интернет каждый день
|
|
| 100, 0
| Используют Интернет каждый день
|
|
| , 0
| Overall Percentage
|
|
| 53, 9
| a. Constant is included in the model.
| b. The cut value is, 570
| Таблица классификации для модели, в которой нет ни одной независимой переменной.
Variables in the Equation
|
| B
| S.E.
| Wald
| df
| Sig.
| Exp(B)
| Step 0
| Constant
| -, 158
| , 077
| 4, 242
|
| , 039
| , 854
| | | | | | | | | Из таблицы ниже можно узнать, какие переменные были бы значимыми, если бы они вводились в модель поодиночке (отмечены желтым)
Для категориальных переменных – не все их уровни могут значимо отличаться от опорной категории. См., например, город-село.
Некоторые переменные, значимые на этом шаге, если их попытаться включить в модель вместе с другими переменными – могут оказаться незначимым.
Score – параметр, похожий на ХИ-квадрат. Чем он выше в расчете на одну степень свободы, тем важнее данная переменная для модели.
В нашем случае – очевидно, самый значимый – возраст. Он и будет введен в модель на первом шаге.
Variables not in the Equation
|
| Score
| df
| Sig.
| Step 0
| Variables
| gndr_Пол(1)
| 10, 323
|
| , 001
| Возраст_в_категор
| 92, 937
|
| , 000
| ГОРОД_СЕЛО2
| 12, 452
|
| , 006
| ГОРОД_СЕЛО2(1)
| 11, 086
|
| , 001
| ГОРОД_СЕЛО2(2)
| , 004
|
| , 952
| ГОРОД_СЕЛО2(3)
| 3, 685
|
| , 055
| eisced_Образование
| 9, 852
|
| , 043
| eisced_Образование(1)
| 1, 000
|
| , 317
| eisced_Образование(2)
| 5, 832
|
| , 016
| eisced_Образование(3)
| , 068
|
| , 794
| eisced_Образование(4)
| 5, 333
|
| , 021
| maritalb_Семейное_П_перекодированное
| 47, 438
|
| , 000
| maritalb_Семейное_П_перекодированное(1)
| 4, 766
|
| , 029
| maritalb_Семейное_П_перекодированное(2)
| , 617
|
| , 432
| maritalb_Семейное_П_перекодированное(3)
| 20, 133
|
| , 000
| Голос_ЕДРОС(1)
| , 167
|
| , 683
| Overall Statistics
| 117, 709
|
| , 000
|
Block 1: Method = Forward Stepwise (Likelihood Ratio)
Omnibus Tests of Model Coefficients
|
| Chi-square
| df
| Sig.
| Step 1
| Step
| 98, 916
|
| , 000
| Block
| 98, 916
|
| , 000
| Model
| 98, 916
|
| , 000
| Step 2
| Step
| 11, 447
|
| , 010
| Block
| 110, 363
|
| , 000
| Model
| 110, 363
|
| , 000
| Step 3
| Step
| 6, 673
|
| , 010
| Block
| 117, 035
|
| , 000
| Model
| 117, 035
|
| , 000
|
Model Summary
| Step
| -2 Log likelihood
| Cox & Snell R Square
| Nagelkerke R Square
|
| 847, 827a
| , 134
| , 179
|
| 836, 380a
| , 149
| , 199
|
| 829, 707a
| , 157
| , 210
| a. Estimation terminated at iteration number 4 because parameter estimates changed by less than, 001.
| Нагелькерке Nagelkerke R Square – параметр, аналогичный ар-квадрат в линейной регрессии.
Самый важный шаг – первый: возраст объяснил 18% дисперсии, два последующих – добавили всего 3% (всего на третьем шаге 21%)
Classification Tablea
|
| Observed
| Predicted
|
| Используют Интернет каждый день, или нет
| Percentage Correct
|
| Не используют Интернет каждый день
| Используют Интернет каждый день
| Step 1
| Используют Интернет каждый день, или нет
| Не используют Интернет каждый день
|
|
| 77, 0
| Используют Интернет каждый день
|
|
| 54, 7
| Overall Percentage
|
|
| 66, 8
| Step 2
| Используют Интернет каждый день, или нет
| Не используют Интернет каждый день
|
|
| 80, 0
| Используют Интернет каждый день
|
|
| 50, 6
| Overall Percentage
|
|
| 66, 5
| Step 3
| Используют Интернет каждый день, или нет
| Не используют Интернет каждый день
|
|
| 77, 8
| Используют Интернет каждый день
|
|
| 53, 2
| Overall Percentage
|
|
| 66, 5
| a. The cut value is, 570
| Анализируя коэффициенты B ниже – нужно проверить, нет ли мультиколлинеарности (рост коэффициентов, смена знаков).
В нашем случае – проблем нет.
В логистической регрессии нельзя интерпретировать коэффициенты B как изменение зависимой переменной при изменении независимой переменной на одну единицу, как это мы делали в простой линейной регрессии.
Интерпретируется Exp(B). Если этот коэффициент больше единицы – это означает, что при переходе независимой переменной к следующей категории шансы для моделируемой (большей) категории зависимой переменной (в нашем случае это пользование Интернетом каждый день – повышаются).
А, если он меньше единицы – они, наоборот, снижаются. Ниже будут конкретные примеры.
Отметим, что плюс коэффициента B соответствуют экспонентам больше единицы (рост вероятности, большего значения зависимой переменной), а, если он отрицательный – шансы большей категории, напротив, снижаются. Ниже будут конкретные примеры.
Variables in the Equation
|
| B
| S.E.
| Wald
| df
| Sig.
| Exp(B)
| Step 1a
| Возраст_в_категор
| -, 619
| , 068
| 83, 377
|
| , 000
| , 538
| Constant
| 1, 757
| , 221
| 63, 037
|
| , 000
| 5, 798
| Step 2b
| Возраст_в_категор
| -, 623
| , 069
| 82, 533
|
| , 000
| , 536
| ГОРОД_СЕЛО2
|
|
| 11, 298
|
| , 010
|
| ГОРОД_СЕЛО2(1)
| , 691
| , 257
| 7, 212
|
| , 007
| 1, 995
| ГОРОД_СЕЛО2(2)
| , 413
| , 402
| 1, 052
|
| , 305
| 1, 511
| ГОРОД_СЕЛО2(3)
| , 168
| , 263
| , 406
|
| , 524
| 1, 182
| Constant
| 1, 383
| , 303
| 20, 795
|
| , 000
| 3, 985
| Step 3c
| gndr_Пол(1)
| -, 436
| , 169
| 6, 651
|
| , 010
| , 646
| Возраст_в_категор
| -, 609
| , 069
| 79, 025
|
| , 000
| , 544
| ГОРОД_СЕЛО2
|
|
| 12, 301
|
| , 006
|
| ГОРОД_СЕЛО2(1)
| , 699
| , 259
| 7, 307
|
| , 007
| 2, 012
| ГОРОД_СЕЛО2(2)
| , 410
| , 403
| 1, 035
|
| , 309
| 1, 507
| ГОРОД_СЕЛО2(3)
| , 131
| , 265
| , 246
|
| , 620
| 1, 140
| Constant
| 1, 594
| , 317
| 25, 295
|
| , 000
| 4, 921
| a. Variable(s) entered on step 1: Возраст_в_категор.
| b. Variable(s) entered on step 2: ГОРОД_СЕЛО2.
| c. Variable(s) entered on step 3: gndr_Пол.
|
Пол: опорная категория – мужчины, моделируется вторая – женщины. Exp(B) меньше единицы., 646 это значит, что женщины реже используют Интернет каждый день, чем мужчины.
| Возраст: большие значения это более старшие возраста. Exp(B) меньше единицы., 544 это значит, чем старше респонденты, тем меньше доля тех, кто пользуется Интернетом каждый день.
| ГОРОД_СЕЛО2: опорная категория (4) – респонденты, живущие в селе. Значим только коэффициент для первой категории ГОРОД_СЕЛО2(1) – это жители больших городов. В отличие от предыдущих переменных знак – положительный, и Exp(B) больше единицы. Это значит, что среди жителей больших городов в сравнении с другими категориями (а это опорная плюс остальные две) – выше доля тех, кто каждый день пользуется Интернетом.
|
В таблице ниже Change in -2 Log Likelihood (аналогичен Хи-квадрату) показывает, что наиболее значимый предиктор в нашей модели – возраст.
92, 759 – большой ХИ-квадрат показывает, что, если возраст убрать из модели, то это ухудшит ее больше, чем удаление других переменных.
Model if Term Removed
| Variable
| Model Log Likelihood
| Change in -2 Log Likelihood
| df
| Sig. of the Change
| Step 1
| Возраст_в_категор
| -473, 371
| 98, 916
|
| , 000
| Step 2
| Возраст_в_категор
| -467, 119
| 97, 858
|
| , 000
| ГОРОД_СЕЛО2
| -423, 913
| 11, 447
|
| , 010
| Step 3
| gndr_Пол
| -418, 190
| 6, 673
|
| , 010
| Возраст_в_категор
| -461, 233
| 92, 759
|
| , 000
| ГОРОД_СЕЛО2
| -421, 095
| 12, 483
|
| , 006
|
Variables not in the Equation
|
| Score
| df
| Sig.
| Step 1
| Variables
| gndr_Пол(1)
| 5, 653
|
| , 017
| ГОРОД_СЕЛО2
| 11, 409
|
| , 010
| ГОРОД_СЕЛО2(1)
| 10, 350
|
| , 001
| ГОРОД_СЕЛО2(2)
| , 007
|
| , 934
| ГОРОД_СЕЛО2(3)
| 3, 959
|
| , 047
| eisced_Образование
| 7, 760
|
| , 101
| eisced_Образование(1)
| , 554
|
| , 457
| eisced_Образование(2)
| 5, 201
|
| , 023
| eisced_Образование(3)
| , 099
|
| , 752
| eisced_Образование(4)
| 6, 010
|
| , 014
| maritalb_Семейное_П_перекодированное
| 6, 644
|
| , 084
| maritalb_Семейное_П_перекодированное(1)
| , 003
|
| , 958
| maritalb_Семейное_П_перекодированное(2)
| , 008
|
| , 927
| maritalb_Семейное_П_перекодированное(3)
| 4, 824
|
| , 028
| Голос_ЕДРОС(1)
| , 522
|
| , 470
| Overall Statistics
| 29, 660
|
| , 003
| Step 2
| Variables
| gndr_Пол(1)
| 6, 687
|
| , 010
| eisced_Образование
| 5, 145
|
| , 273
| eisced_Образование(1)
| , 344
|
| , 557
| eisced_Образование(2)
| 3, 082
|
| , 079
| eisced_Образование(3)
| , 204
|
| , 651
| eisced_Образование(4)
| 4, 258
|
| , 039
| maritalb_Семейное_П_перекодированное
| 6, 781
|
| , 079
| maritalb_Семейное_П_перекодированное(1)
| , 013
|
| , 910
| maritalb_Семейное_П_перекодированное(2)
| , 078
|
| , 780
| maritalb_Семейное_П_перекодированное(3)
| 4, 977
|
| , 026
| Голос_ЕДРОС(1)
| , 430
|
| , 512
| Overall Statistics
| 18, 719
|
| , 028
| Step 3
| Variables
| eisced_Образование
| 6, 859
|
| , 144
| eisced_Образование(1)
| , 371
|
| , 543
| eisced_Образование(2)
| 3, 864
|
| , 049
| eisced_Образование(3)
| , 442
|
| , 506
| eisced_Образование(4)
| 5, 991
|
| , 014
| maritalb_Семейное_П_перекодированное
| 6, 321
|
| , 097
| maritalb_Семейное_П_перекодированное(1)
| , 150
|
| , 699
| maritalb_Семейное_П_перекодированное(2)
| , 015
|
| , 903
| maritalb_Семейное_П_перекодированное(3)
| 4, 204
|
| , 040
| Голос_ЕДРОС(1)
| , 155
|
| , 694
| Overall Statistics
| 12, 191
|
| , 143
|
Показано, каких переменных не было в модели на каждом шаге: образование, семейное положение и голосование за Единую Россию так и не были включены в модель, так как они оказались незначимы.
Модели для обычной линейной регрессии и логистической – сходны. И та, и другая показывает, что самый важный предиктор пользования Интернетом – это возраст. Менее значимы – тип населенного пункта (город или село) и пол. Но, в логистической регрессии образование оказалось незначимым. Это может быть связано с тем, что в простой регрессии – более подробная кодировка зависимой переменной (то есть, учитывается частота пользования, а не только различия между теми, кто пользуется Интернетом каждый день, и не каждый день).
|