Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Regression
Custom Tables
[DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav
В этой таблице показано, как закодированы переменные
| Column N %
| Пол респондентов
| Мужчины
| 41, 0
| Женщины
| 59, 0
| Возраст респондентов в категориях
| 14 - 24 года
| 13, 8
| 25 - 34 года
| 18, 1
| 35 - 44 года
| 15, 9
| 45 - 54 года
| 16, 5
| 55 - 64 года
| 16, 6
| 65 - 74 года
| 11, 5
| 75 лет и старше
| 7, 6
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| Большой город
| 37, 4
| Пригород или окраина большого города
| 5, 2
| Небольшой город
| 34, 9
| Поселок или деревня
| 22, 5
| Ферма или отдельностоящий дом в сельской местности
| , 0
| Официальное семейное положение -- перекодированное
| Состоят в официальном браке
| 44, 1
| Зарегистрированный гражданский брак
| , 0
| Официально расстались
| , 0
| Официально разведены
| 14, 4
| Вдовы и вдовцы
| 17, 1
| Никогда не состояли в зарегистрованном браке
| 24, 4
| Состоят в официальном браке
| Не состоят в официальном браке
| 56, 2
| Состоят в официальном браке
| 43, 8
| Разведены официально или расстались
| Не в разводе
| 85, 7
| В разводе или расстались
| 14, 3
| ОБРАЗОВАНИЕ, ES - ISCED
| Not possible to harmonise into ES-ISCED
| , 0
| ES-ISCED I, начальное
| 4, 5
| ES-ISCED II, неполное среднее
| 9, 6
| ES-ISCED IIIb, среднее
| , 0
| ES-ISCED IIIa, среднее -- продвинутое (гимназия и т.п.)
| 34, 1
| ES-ISCED IV, среднее специальное (техникум и т.п.)
| 24, 9
| ES-ISCED V2, высшее -- специалисты, баки, магистры и выше
| 27, 0
| Other
| , 0
| Голосовали на последних выборах за Единую Россию?
| Не голосовали за Единую Россию
| 36, 4
| Голосовали за Единую Россию
| 63, 6
| Используют Интернет/e-mail/www в личных целях
| Нет доступа дома или на работе
| 49, 8
| Никогда не пользуются в личных целях
| 4, 5
| Реже, чем раз в месяц
| 1, 3
| Раз в месяц
| , 7
| Несколько раз в месяц
| 4, 6
| Раз в неделю
| 2, 7
| Несколько раз в неделю
| 9, 8
| Каждый день
| 26, 6
|
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT netuse
/METHOD=STEPWISE gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 Брак Развод eisced_Образование Голос_ЕДРОС.
Считается линейная пошаговая регрессия (STEPWISE)
Переменная «место жительства» трактуется как интервальная: чем выше значение, тем менее городское место жительства (1 – большой город, 4 – сельская местность).
Regression
[DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav
Variables Entered/Removeda
| Model
| Variables Entered
| Variables Removed
| Method
|
| Возраст респондентов в категориях
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
|
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
|
| ОБРАЗОВАНИЕ, ES - ISCED
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
|
| Пол респондентов
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
| a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
| Четыре шага – на последнем – в модели 4 переменных.
Model Summary
| Model
| R
| R Square
| Adjusted R Square
| Std. Error of the Estimate
|
| , 572a
| , 327
| , 326
| 2, 473
|
| , 603b
| , 363
| , 363
| 2, 405
|
| , 619c
| , 383
| , 381
| 2, 369
|
| , 625d
| , 390
| , 389
| 2, 355
| a. Predictors: (Constant), Возраст респондентов в категориях
| b. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
| d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов
| Подавляющую долю дисперсии, судя по R-квадрат, объяснил возраст (33%), вторая по значимости переменная – место жительства добавочно объяснила объяснила лишь 36, 3 – 32, 6 = 3, 7% дисперсии…
ANOVAa
| Model
| Sum of Squares
| df
| Mean Square
| F
| Sig.
|
| Regression
| 4714, 283
|
| 4714, 283
| 770, 860
| , 000b
| Residual
| 9717, 715
|
| 6, 116
|
|
| Total
| 14431, 997
|
|
|
|
|
| Regression
| 5243, 871
|
| 2621, 935
| 453, 154
| , 000c
| Residual
| 9188, 127
|
| 5, 786
|
|
| Total
| 14431, 997
|
|
|
|
|
| Regression
| 5522, 062
|
| 1840, 687
| 327, 855
| , 000d
| Residual
| 8909, 936
|
| 5, 614
|
|
| Total
| 14431, 997
|
|
|
|
|
| Regression
| 5634, 794
|
| 1408, 699
| 253, 967
| , 000e
| Residual
| 8797, 203
|
| 5, 547
|
|
| Total
| 14431, 997
|
|
|
|
| a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
| b. Predictors: (Constant), Возраст респондентов в категориях
| c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
| e. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов
| !!! Внимание!!! во вкладке Statistics была поставлена «галочка» для collinearity diagnostics (диагностика коллинеарности).
В пошаговой регрессии по определению каждая модель лучше предыдущей, если рассматривать ANOVA.
Поскольку использовалась пошаговая регрессия, все коэффициенты, включенные в модели – значимы.
Судя по VIF, которые близки к единице, больших проблем с мультиколлинеарностью быть не должно.
Все же стоит посмотреть не растут ли коэффициенты и не меняются ли знаки. В четвертой модели по сравнению с третьей немного увеличился коэффициент для образования, но это не страшно.
Coefficientsa
| Model
| Unstandardized Coefficients
| Standardized Coefficients
| t
| Sig.
| Collinearity Statistics
| B
| Std. Error
| Beta
| Tolerance
| VIF
|
| (Constant)
| 6, 593
| , 165
|
| 39, 978
| , 000
|
|
| Возраст респондентов в категориях
| -1, 017
| , 037
| -, 572
| -27, 764
| , 000
| 1, 000
| 1, 000
|
| (Constant)
| 7, 709
| , 198
|
| 38, 867
| , 000
|
|
| Возраст респондентов в категориях
| -, 990
| , 036
| -, 556
| -27, 699
| , 000
| , 994
| 1, 006
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 485
| , 051
| -, 192
| -9, 567
| , 000
| , 994
| 1, 006
|
| (Constant)
| 5, 608
| , 357
|
| 15, 724
| , 000
|
|
| Возраст респондентов в категориях
| -, 888
| , 038
| -, 499
| -23, 336
| , 000
| , 850
| 1, 176
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 425
| , 051
| -, 168
| -8, 393
| , 000
| , 966
| 1, 035
| ОБРАЗОВАНИЕ, ES - ISCED
| , 334
| , 048
| , 153
| 7, 039
| , 000
| , 826
| 1, 210
|
| (Constant)
| 6, 367
| , 392
|
| 16, 224
| , 000
|
|
| Возраст респондентов в категориях
| -, 865
| , 038
| -, 486
| -22, 647
| , 000
| , 835
| 1, 198
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 424
| , 050
| -, 168
| -8, 428
| , 000
| , 966
| 1, 035
| ОБРАЗОВАНИЕ, ES - ISCED
| , 345
| , 047
| , 158
| 7, 301
| , 000
| , 824
| 1, 213
| Пол респондентов
| -, 557
| , 123
| -, 089
| -4, 508
| , 000
| , 981
| 1, 019
| a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
|
Уравнение регрессии (для него всегда используются нестандартизованные коэффициенты B, округляем до десятых):
Интернет = 6, 4 – 0, 9*Возраст – 0, 4*Место жительства + 0, 3*образование – 0, 6*пол использованные в уравнении коэффициенты
Как уже было сказано, судя по стандартизованному коэффициенту бетта сильнее всего влияет на пользование Интернетом возраст.
Интерпретация коэффициентов (нужно учитывать знак и кодировку).
Для пользования Интернетом 0 «минимальное использование» … 7 «максимальное»
Для возраста коэффициент отрицательный, это значит, что старшие возрастные группы реже пользуются интернетом, чем молодые.
Для места жительства – он тоже отрицательный. Учитывая кодировку – жители малых городов и сельских поселений меньше пользуются интернетом в сравнении с жителями больших городов.
Для образования – положительный. Чем выше образовательный уровень, тем больше пользуются Интернетом.
Пол – отрицательный коэффициент показывает, что женщины меньше пользуются Интернетом, чем мужчины.
!!! Внимание!!! нельзя ориентироваться только на знак регрессионного коэффициента. Нужно учесть, как закодированы независимые и зависимые переменные.
Excluded Variablesa
| Model
| Beta In
| t
| Sig.
| Partial Correlation
| Collinearity Statistics
| Tolerance
|
| Пол респондентов
| -, 081b
| -3, 916
| , 000
| -, 098
| , 984
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 192b
| -9, 567
| , 000
| -, 233
| , 994
| Состоят в официальном браке
| , 066b
| 3, 188
| , 001
| , 080
| , 994
| Разведены официально или расстались
| -, 027b
| -1, 326
| , 185
| -, 033
| , 998
| ОБРАЗОВАНИЕ, ES - ISCED
| , 183b
| 8, 388
| , 000
| , 206
| , 850
| Голосовали на последних выборах за Единую Россию?
| -, 025b
| -1, 213
| , 225
| -, 030
| , 984
|
| Пол респондентов
| -, 082c
| -4, 077
| , 000
| -, 102
| , 984
| Состоят в официальном браке
| , 069c
| 3, 447
| , 001
| , 086
| , 994
| Разведены официально или расстались
| -, 031c
| -1, 555
| , 120
| -, 039
| , 998
| ОБРАЗОВАНИЕ, ES - ISCED
| , 153c
| 7, 039
| , 000
| , 174
| , 826
| Голосовали на последних выборах за Единую Россию?
| -, 010c
| -, 505
| , 613
| -, 013
| , 978
|
| Пол респондентов
| -, 089d
| -4, 508
| , 000
| -, 112
| , 981
| Состоят в официальном браке
| , 054d
| 2, 723
| , 007
| , 068
| , 982
| Разведены официально или расстались
| -, 041d
| -2, 075
| , 038
| -, 052
| , 993
| Голосовали на последних выборах за Единую Россию?
| -, 003d
| -, 159
| , 874
| -, 004
| , 976
|
| Состоят в официальном браке
| , 036e
| 1, 761
| , 078
| , 044
| , 931
| Разведены официально или расстались
| -, 033e
| -1, 652
| , 099
| -, 041
| , 983
| Голосовали на последних выборах за Единую Россию?
| , 008e
| , 418
| , 676
| , 010
| , 960
| a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
| b. Predictors in the Model: (Constant), Возраст респондентов в категориях
| c. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| d. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
| e. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов
| Интернет перекодируется в бинарную переменную: 1 – пользуются Интернетом каждый день, 0 – пользуются реже или вообще не пользуются.
Рассчитывается логистическая регрессия. Зависимая переменная – описанная выше бинарная.
Независимые:
gndr_Пол -- категориальная
Возраст_в_категор -- интервальная
ГОРОД_СЕЛО2 -- категориальная
eisced_Образование - категориальная
maritalb_Семейное_П_перекодированное - категориальная
Голос_ЕДРОС - категориальная
RECODE netuse (7=1) (1 thru 6=0) (ELSE=SYSMIS) INTO Интернет.
VARIABLE LABELS Интернет 'Используют Интернет каждый день, или нет'.
EXECUTE.
LOGISTIC REGRESSION VARIABLES Интернет
/METHOD=FSTEP(LR) gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 eisced_Образование maritalb_Семейное_П_перекодированное Голос_ЕДРОС
/CONTRAST (gndr_Пол)=Indicator(1)
/CONTRAST (ГОРОД_СЕЛО2)=Indicator
/CONTRAST (eisced_Образование)=Indicator(1)
/CONTRAST (maritalb_Семейное_П_перекодированное)=Indicator
/CONTRAST (Голос_ЕДРОС)=Indicator(1)
/PRINT=GOODFIT
/CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20) CUT(0.57).
В диалоге бинарной логистической регрессии нужно нажать на кнопку “Categorical” и указать, какие переменные – категориальные, и, если нужно, указать, какая категория – первая или последняя, будет опорной.
|