Главная страница
Случайная страница
КАТЕГОРИИ:
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника
|
Regression
Custom Tables
[DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav
В этой таблице показано, как закодированы переменные
|
| Column N %
| | Пол респондентов
| Мужчины
| 41, 0
| | Женщины
| 59, 0
| | Возраст респондентов в категориях
| 14 - 24 года
| 13, 8
| | 25 - 34 года
| 18, 1
| | 35 - 44 года
| 15, 9
| | 45 - 54 года
| 16, 5
| | 55 - 64 года
| 16, 6
| | 65 - 74 года
| 11, 5
| | 75 лет и старше
| 7, 6
| | 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| Большой город
| 37, 4
| | Пригород или окраина большого города
| 5, 2
| | Небольшой город
| 34, 9
| | Поселок или деревня
| 22, 5
| | Ферма или отдельностоящий дом в сельской местности
| , 0
| | Официальное семейное положение -- перекодированное
| Состоят в официальном браке
| 44, 1
| | Зарегистрированный гражданский брак
| , 0
| | Официально расстались
| , 0
| | Официально разведены
| 14, 4
| | Вдовы и вдовцы
| 17, 1
| | Никогда не состояли в зарегистрованном браке
| 24, 4
| | Состоят в официальном браке
| Не состоят в официальном браке
| 56, 2
| | Состоят в официальном браке
| 43, 8
| | Разведены официально или расстались
| Не в разводе
| 85, 7
| | В разводе или расстались
| 14, 3
| | ОБРАЗОВАНИЕ, ES - ISCED
| Not possible to harmonise into ES-ISCED
| , 0
| | ES-ISCED I, начальное
| 4, 5
| | ES-ISCED II, неполное среднее
| 9, 6
| | ES-ISCED IIIb, среднее
| , 0
| | ES-ISCED IIIa, среднее -- продвинутое (гимназия и т.п.)
| 34, 1
| | ES-ISCED IV, среднее специальное (техникум и т.п.)
| 24, 9
| | ES-ISCED V2, высшее -- специалисты, баки, магистры и выше
| 27, 0
| | Other
| , 0
| | Голосовали на последних выборах за Единую Россию?
| Не голосовали за Единую Россию
| 36, 4
| | Голосовали за Единую Россию
| 63, 6
| | Используют Интернет/e-mail/www в личных целях
| Нет доступа дома или на работе
| 49, 8
| | Никогда не пользуются в личных целях
| 4, 5
| | Реже, чем раз в месяц
| 1, 3
| | Раз в месяц
| , 7
| | Несколько раз в месяц
| 4, 6
| | Раз в неделю
| 2, 7
| | Несколько раз в неделю
| 9, 8
| | Каждый день
| 26, 6
|
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT netuse
/METHOD=STEPWISE gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 Брак Развод eisced_Образование Голос_ЕДРОС.
Считается линейная пошаговая регрессия (STEPWISE)
Переменная «место жительства» трактуется как интервальная: чем выше значение, тем менее городское место жительства (1 – большой город, 4 – сельская местность).
Regression
[DataSet1] D: \SLISS\--- 2012-2013\- 2013 Анализ данных\RU_ESS5e03.sav
| Variables Entered/Removeda
| | Model
| Variables Entered
| Variables Removed
| Method
| |
| Возраст респондентов в категориях
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
| |
| 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
| |
| ОБРАЗОВАНИЕ, ES - ISCED
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
| |
| Пол респондентов
| .
| Stepwise (Criteria: Probability-of-F-to-enter < =, 050, Probability-of-F-to-remove > =, 100).
| | a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
| Четыре шага – на последнем – в модели 4 переменных.
| Model Summary
| | Model
| R
| R Square
| Adjusted R Square
| Std. Error of the Estimate
| |
| , 572a
| , 327
| , 326
| 2, 473
| |
| , 603b
| , 363
| , 363
| 2, 405
| |
| , 619c
| , 383
| , 381
| 2, 369
| |
| , 625d
| , 390
| , 389
| 2, 355
| | a. Predictors: (Constant), Возраст респондентов в категориях
| | b. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| | c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
| | d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов
| Подавляющую долю дисперсии, судя по R-квадрат, объяснил возраст (33%), вторая по значимости переменная – место жительства добавочно объяснила объяснила лишь 36, 3 – 32, 6 = 3, 7% дисперсии…
| ANOVAa
| | Model
| Sum of Squares
| df
| Mean Square
| F
| Sig.
| |
| Regression
| 4714, 283
|
| 4714, 283
| 770, 860
| , 000b
| | Residual
| 9717, 715
|
| 6, 116
|
|
| | Total
| 14431, 997
|
|
|
|
| |
| Regression
| 5243, 871
|
| 2621, 935
| 453, 154
| , 000c
| | Residual
| 9188, 127
|
| 5, 786
|
|
| | Total
| 14431, 997
|
|
|
|
| |
| Regression
| 5522, 062
|
| 1840, 687
| 327, 855
| , 000d
| | Residual
| 8909, 936
|
| 5, 614
|
|
| | Total
| 14431, 997
|
|
|
|
| |
| Regression
| 5634, 794
|
| 1408, 699
| 253, 967
| , 000e
| | Residual
| 8797, 203
|
| 5, 547
|
|
| | Total
| 14431, 997
|
|
|
|
| | a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
| | b. Predictors: (Constant), Возраст респондентов в категориях
| | c. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| | d. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
| | e. Predictors: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов
| !!! Внимание!!! во вкладке Statistics была поставлена «галочка» для collinearity diagnostics (диагностика коллинеарности).
В пошаговой регрессии по определению каждая модель лучше предыдущей, если рассматривать ANOVA.
Поскольку использовалась пошаговая регрессия, все коэффициенты, включенные в модели – значимы.
Судя по VIF, которые близки к единице, больших проблем с мультиколлинеарностью быть не должно.
Все же стоит посмотреть не растут ли коэффициенты и не меняются ли знаки. В четвертой модели по сравнению с третьей немного увеличился коэффициент для образования, но это не страшно.
| Coefficientsa
| | Model
| Unstandardized Coefficients
| Standardized Coefficients
| t
| Sig.
| Collinearity Statistics
| | B
| Std. Error
| Beta
| Tolerance
| VIF
| |
| (Constant)
| 6, 593
| , 165
|
| 39, 978
| , 000
|
|
| | Возраст респондентов в категориях
| -1, 017
| , 037
| -, 572
| -27, 764
| , 000
| 1, 000
| 1, 000
| |
| (Constant)
| 7, 709
| , 198
|
| 38, 867
| , 000
|
|
| | Возраст респондентов в категориях
| -, 990
| , 036
| -, 556
| -27, 699
| , 000
| , 994
| 1, 006
| | 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 485
| , 051
| -, 192
| -9, 567
| , 000
| , 994
| 1, 006
| |
| (Constant)
| 5, 608
| , 357
|
| 15, 724
| , 000
|
|
| | Возраст респондентов в категориях
| -, 888
| , 038
| -, 499
| -23, 336
| , 000
| , 850
| 1, 176
| | 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 425
| , 051
| -, 168
| -8, 393
| , 000
| , 966
| 1, 035
| | ОБРАЗОВАНИЕ, ES - ISCED
| , 334
| , 048
| , 153
| 7, 039
| , 000
| , 826
| 1, 210
| |
| (Constant)
| 6, 367
| , 392
|
| 16, 224
| , 000
|
|
| | Возраст респондентов в категориях
| -, 865
| , 038
| -, 486
| -22, 647
| , 000
| , 835
| 1, 198
| | 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 424
| , 050
| -, 168
| -8, 428
| , 000
| , 966
| 1, 035
| | ОБРАЗОВАНИЕ, ES - ISCED
| , 345
| , 047
| , 158
| 7, 301
| , 000
| , 824
| 1, 213
| | Пол респондентов
| -, 557
| , 123
| -, 089
| -4, 508
| , 000
| , 981
| 1, 019
| | a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
|
Уравнение регрессии (для него всегда используются нестандартизованные коэффициенты B, округляем до десятых):
Интернет = 6, 4 – 0, 9*Возраст – 0, 4*Место жительства + 0, 3*образование – 0, 6*пол использованные в уравнении коэффициенты
Как уже было сказано, судя по стандартизованному коэффициенту бетта сильнее всего влияет на пользование Интернетом возраст.
Интерпретация коэффициентов (нужно учитывать знак и кодировку).
Для пользования Интернетом 0 «минимальное использование» … 7 «максимальное»
Для возраста коэффициент отрицательный, это значит, что старшие возрастные группы реже пользуются интернетом, чем молодые.
Для места жительства – он тоже отрицательный. Учитывая кодировку – жители малых городов и сельских поселений меньше пользуются интернетом в сравнении с жителями больших городов.
Для образования – положительный. Чем выше образовательный уровень, тем больше пользуются Интернетом.
Пол – отрицательный коэффициент показывает, что женщины меньше пользуются Интернетом, чем мужчины.
!!! Внимание!!! нельзя ориентироваться только на знак регрессионного коэффициента. Нужно учесть, как закодированы независимые и зависимые переменные.
| Excluded Variablesa
| | Model
| Beta In
| t
| Sig.
| Partial Correlation
| Collinearity Statistics
| | Tolerance
| |
| Пол респондентов
| -, 081b
| -3, 916
| , 000
| -, 098
| , 984
| | 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| -, 192b
| -9, 567
| , 000
| -, 233
| , 994
| | Состоят в официальном браке
| , 066b
| 3, 188
| , 001
| , 080
| , 994
| | Разведены официально или расстались
| -, 027b
| -1, 326
| , 185
| -, 033
| , 998
| | ОБРАЗОВАНИЕ, ES - ISCED
| , 183b
| 8, 388
| , 000
| , 206
| , 850
| | Голосовали на последних выборах за Единую Россию?
| -, 025b
| -1, 213
| , 225
| -, 030
| , 984
| |
| Пол респондентов
| -, 082c
| -4, 077
| , 000
| -, 102
| , 984
| | Состоят в официальном браке
| , 069c
| 3, 447
| , 001
| , 086
| , 994
| | Разведены официально или расстались
| -, 031c
| -1, 555
| , 120
| -, 039
| , 998
| | ОБРАЗОВАНИЕ, ES - ISCED
| , 153c
| 7, 039
| , 000
| , 174
| , 826
| | Голосовали на последних выборах за Единую Россию?
| -, 010c
| -, 505
| , 613
| -, 013
| , 978
| |
| Пол респондентов
| -, 089d
| -4, 508
| , 000
| -, 112
| , 981
| | Состоят в официальном браке
| , 054d
| 2, 723
| , 007
| , 068
| , 982
| | Разведены официально или расстались
| -, 041d
| -2, 075
| , 038
| -, 052
| , 993
| | Голосовали на последних выборах за Единую Россию?
| -, 003d
| -, 159
| , 874
| -, 004
| , 976
| |
| Состоят в официальном браке
| , 036e
| 1, 761
| , 078
| , 044
| , 931
| | Разведены официально или расстались
| -, 033e
| -1, 652
| , 099
| -, 041
| , 983
| | Голосовали на последних выборах за Единую Россию?
| , 008e
| , 418
| , 676
| , 010
| , 960
| | a. Dependent Variable: Используют Интернет/e-mail/www в личных целях
| | b. Predictors in the Model: (Constant), Возраст респондентов в категориях
| | c. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм)
| | d. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED
| | e. Predictors in the Model: (Constant), Возраст респондентов в категориях, 2 Место жительства (город - сельская местность) -- описание респондента (без ферм), ОБРАЗОВАНИЕ, ES - ISCED, Пол респондентов
| Интернет перекодируется в бинарную переменную: 1 – пользуются Интернетом каждый день, 0 – пользуются реже или вообще не пользуются.
Рассчитывается логистическая регрессия. Зависимая переменная – описанная выше бинарная.
Независимые:
gndr_Пол -- категориальная
Возраст_в_категор -- интервальная
ГОРОД_СЕЛО2 -- категориальная
eisced_Образование - категориальная
maritalb_Семейное_П_перекодированное - категориальная
Голос_ЕДРОС - категориальная
RECODE netuse (7=1) (1 thru 6=0) (ELSE=SYSMIS) INTO Интернет.
VARIABLE LABELS Интернет 'Используют Интернет каждый день, или нет'.
EXECUTE.
LOGISTIC REGRESSION VARIABLES Интернет
/METHOD=FSTEP(LR) gndr_Пол Возраст_в_категор ГОРОД_СЕЛО2 eisced_Образование maritalb_Семейное_П_перекодированное Голос_ЕДРОС
/CONTRAST (gndr_Пол)=Indicator(1)
/CONTRAST (ГОРОД_СЕЛО2)=Indicator
/CONTRAST (eisced_Образование)=Indicator(1)
/CONTRAST (maritalb_Семейное_П_перекодированное)=Indicator
/CONTRAST (Голос_ЕДРОС)=Indicator(1)
/PRINT=GOODFIT
/CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20) CUT(0.57).
В диалоге бинарной логистической регрессии нужно нажать на кнопку “Categorical” и указать, какие переменные – категориальные, и, если нужно, указать, какая категория – первая или последняя, будет опорной.

|