Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Block 0: Beginning Block






 

 

Classification Tablea, b
  Observed Predicted
  Используют Интернет каждый день, или нет Percentage Correct
  Не используют Интернет каждый день Используют Интернет каждый день
Step 0 Используют Интернет каждый день, или нет Не используют Интернет каждый день     100, 0
Используют Интернет каждый день     , 0
Overall Percentage     53, 9
a. Constant is included in the model.
b. The cut value is, 570

Таблица классификации для модели, в которой нет ни одной независимой переменной.

 

Variables in the Equation
  B S.E. Wald df Sig. Exp(B)
Step 0 Constant -, 158 , 077 4, 242   , 039 , 854
               

Из таблицы ниже можно узнать, какие переменные были бы значимыми, если бы они вводились в модель поодиночке (отмечены желтым)

Для категориальных переменных – не все их уровни могут значимо отличаться от опорной категории. См., например, город-село.

Некоторые переменные, значимые на этом шаге, если их попытаться включить в модель вместе с другими переменными – могут оказаться незначимым.

Score – параметр, похожий на ХИ-квадрат. Чем он выше в расчете на одну степень свободы, тем важнее данная переменная для модели.

В нашем случае – очевидно, самый значимый – возраст. Он и будет введен в модель на первом шаге.

Variables not in the Equation
  Score df Sig.
Step 0 Variables gndr_Пол(1) 10, 323   , 001
Возраст_в_категор 92, 937   , 000
ГОРОД_СЕЛО2 12, 452   , 006
ГОРОД_СЕЛО2(1) 11, 086   , 001
ГОРОД_СЕЛО2(2) , 004   , 952
ГОРОД_СЕЛО2(3) 3, 685   , 055
eisced_Образование 9, 852   , 043
eisced_Образование(1) 1, 000   , 317
eisced_Образование(2) 5, 832   , 016
eisced_Образование(3) , 068   , 794
eisced_Образование(4) 5, 333   , 021
maritalb_Семейное_П_перекодированное 47, 438   , 000
maritalb_Семейное_П_перекодированное(1) 4, 766   , 029
maritalb_Семейное_П_перекодированное(2) , 617   , 432
maritalb_Семейное_П_перекодированное(3) 20, 133   , 000
Голос_ЕДРОС(1) , 167   , 683
Overall Statistics 117, 709   , 000

 

 

Block 1: Method = Forward Stepwise (Likelihood Ratio)

 

 

Omnibus Tests of Model Coefficients
  Chi-square df Sig.
Step 1 Step 98, 916   , 000
Block 98, 916   , 000
Model 98, 916   , 000
Step 2 Step 11, 447   , 010
Block 110, 363   , 000
Model 110, 363   , 000
Step 3 Step 6, 673   , 010
Block 117, 035   , 000
Model 117, 035   , 000

 

 

Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
  847, 827a , 134 , 179
  836, 380a , 149 , 199
  829, 707a , 157 , 210
a. Estimation terminated at iteration number 4 because parameter estimates changed by less than, 001.

Нагелькерке Nagelkerke R Square – параметр, аналогичный ар-квадрат в линейной регрессии.

Самый важный шаг – первый: возраст объяснил 18% дисперсии, два последующих – добавили всего 3% (всего на третьем шаге 21%)

 

Classification Tablea
  Observed Predicted
  Используют Интернет каждый день, или нет Percentage Correct
  Не используют Интернет каждый день Используют Интернет каждый день
Step 1 Используют Интернет каждый день, или нет Не используют Интернет каждый день     77, 0
Используют Интернет каждый день     54, 7
Overall Percentage     66, 8
Step 2 Используют Интернет каждый день, или нет Не используют Интернет каждый день     80, 0
Используют Интернет каждый день     50, 6
Overall Percentage     66, 5
Step 3 Используют Интернет каждый день, или нет Не используют Интернет каждый день     77, 8
Используют Интернет каждый день     53, 2
Overall Percentage     66, 5
a. The cut value is, 570

Анализируя коэффициенты B ниже – нужно проверить, нет ли мультиколлинеарности (рост коэффициентов, смена знаков).

В нашем случае – проблем нет.

В логистической регрессии нельзя интерпретировать коэффициенты B как изменение зависимой переменной при изменении независимой переменной на одну единицу, как это мы делали в простой линейной регрессии.

Интерпретируется Exp(B). Если этот коэффициент больше единицы – это означает, что при переходе независимой переменной к следующей категории шансы для моделируемой (большей) категории зависимой переменной (в нашем случае это пользование Интернетом каждый день – повышаются).

А, если он меньше единицы – они, наоборот, снижаются. Ниже будут конкретные примеры.

Отметим, что плюс коэффициента B соответствуют экспонентам больше единицы (рост вероятности, большего значения зависимой переменной), а, если он отрицательный – шансы большей категории, напротив, снижаются. Ниже будут конкретные примеры.

 

Variables in the Equation
  B S.E. Wald df Sig. Exp(B)
Step 1a Возраст_в_категор -, 619 , 068 83, 377   , 000 , 538
Constant 1, 757 , 221 63, 037   , 000 5, 798
Step 2b Возраст_в_категор -, 623 , 069 82, 533   , 000 , 536
ГОРОД_СЕЛО2     11, 298   , 010  
ГОРОД_СЕЛО2(1) , 691 , 257 7, 212   , 007 1, 995
ГОРОД_СЕЛО2(2) , 413 , 402 1, 052   , 305 1, 511
ГОРОД_СЕЛО2(3) , 168 , 263 , 406   , 524 1, 182
Constant 1, 383 , 303 20, 795   , 000 3, 985
Step 3c gndr_Пол(1) -, 436 , 169 6, 651   , 010 , 646
Возраст_в_категор -, 609 , 069 79, 025   , 000 , 544
ГОРОД_СЕЛО2     12, 301   , 006  
ГОРОД_СЕЛО2(1) , 699 , 259 7, 307   , 007 2, 012
ГОРОД_СЕЛО2(2) , 410 , 403 1, 035   , 309 1, 507
ГОРОД_СЕЛО2(3) , 131 , 265 , 246   , 620 1, 140
Constant 1, 594 , 317 25, 295   , 000 4, 921
a. Variable(s) entered on step 1: Возраст_в_категор.
b. Variable(s) entered on step 2: ГОРОД_СЕЛО2.
c. Variable(s) entered on step 3: gndr_Пол.

 

Пол: опорная категория – мужчины, моделируется вторая – женщины. Exp(B) меньше единицы., 646 это значит, что женщины реже используют Интернет каждый день, чем мужчины.
Возраст: большие значения это более старшие возраста. Exp(B) меньше единицы., 544 это значит, чем старше респонденты, тем меньше доля тех, кто пользуется Интернетом каждый день.
ГОРОД_СЕЛО2: опорная категория (4) – респонденты, живущие в селе. Значим только коэффициент для первой категории ГОРОД_СЕЛО2(1) – это жители больших городов. В отличие от предыдущих переменных знак – положительный, и Exp(B) больше единицы. Это значит, что среди жителей больших городов в сравнении с другими категориями (а это опорная плюс остальные две) – выше доля тех, кто каждый день пользуется Интернетом.

 

В таблице ниже Change in -2 Log Likelihood (аналогичен Хи-квадрату) показывает, что наиболее значимый предиктор в нашей модели – возраст.

92, 759 – большой ХИ-квадрат показывает, что, если возраст убрать из модели, то это ухудшит ее больше, чем удаление других переменных.

Model if Term Removed
Variable Model Log Likelihood Change in -2 Log Likelihood df Sig. of the Change
Step 1 Возраст_в_категор -473, 371 98, 916   , 000
Step 2 Возраст_в_категор -467, 119 97, 858   , 000
ГОРОД_СЕЛО2 -423, 913 11, 447   , 010
Step 3 gndr_Пол -418, 190 6, 673   , 010
Возраст_в_категор -461, 233 92, 759   , 000
ГОРОД_СЕЛО2 -421, 095 12, 483   , 006

 

 

Variables not in the Equation
  Score df Sig.
Step 1 Variables gndr_Пол(1) 5, 653   , 017
ГОРОД_СЕЛО2 11, 409   , 010
ГОРОД_СЕЛО2(1) 10, 350   , 001
ГОРОД_СЕЛО2(2) , 007   , 934
ГОРОД_СЕЛО2(3) 3, 959   , 047
eisced_Образование 7, 760   , 101
eisced_Образование(1) , 554   , 457
eisced_Образование(2) 5, 201   , 023
eisced_Образование(3) , 099   , 752
eisced_Образование(4) 6, 010   , 014
maritalb_Семейное_П_перекодированное 6, 644   , 084
maritalb_Семейное_П_перекодированное(1) , 003   , 958
maritalb_Семейное_П_перекодированное(2) , 008   , 927
maritalb_Семейное_П_перекодированное(3) 4, 824   , 028
Голос_ЕДРОС(1) , 522   , 470
Overall Statistics 29, 660   , 003
Step 2 Variables gndr_Пол(1) 6, 687   , 010
eisced_Образование 5, 145   , 273
eisced_Образование(1) , 344   , 557
eisced_Образование(2) 3, 082   , 079
eisced_Образование(3) , 204   , 651
eisced_Образование(4) 4, 258   , 039
maritalb_Семейное_П_перекодированное 6, 781   , 079
maritalb_Семейное_П_перекодированное(1) , 013   , 910
maritalb_Семейное_П_перекодированное(2) , 078   , 780
maritalb_Семейное_П_перекодированное(3) 4, 977   , 026
Голос_ЕДРОС(1) , 430   , 512
Overall Statistics 18, 719   , 028
Step 3 Variables eisced_Образование 6, 859   , 144
eisced_Образование(1) , 371   , 543
eisced_Образование(2) 3, 864   , 049
eisced_Образование(3) , 442   , 506
eisced_Образование(4) 5, 991   , 014
maritalb_Семейное_П_перекодированное 6, 321   , 097
maritalb_Семейное_П_перекодированное(1) , 150   , 699
maritalb_Семейное_П_перекодированное(2) , 015   , 903
maritalb_Семейное_П_перекодированное(3) 4, 204   , 040
Голос_ЕДРОС(1) , 155   , 694
Overall Statistics 12, 191   , 143

 

Показано, каких переменных не было в модели на каждом шаге: образование, семейное положение и голосование за Единую Россию так и не были включены в модель, так как они оказались незначимы.

Модели для обычной линейной регрессии и логистической – сходны. И та, и другая показывает, что самый важный предиктор пользования Интернетом – это возраст. Менее значимы – тип населенного пункта (город или село) и пол. Но, в логистической регрессии образование оказалось незначимым. Это может быть связано с тем, что в простой регрессии – более подробная кодировка зависимой переменной (то есть, учитывается частота пользования, а не только различия между теми, кто пользуется Интернетом каждый день, и не каждый день).


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.009 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал