Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Линейно – логарифмическая модель
Построим линейно-логарифмическую модель без переменных guest и cruising_speed, так как они способствовали появлению мультиколлинеарности в модели, и это было обосновано в линейной модели.
Модель 8: МНК, использованы наблюдения 1-153 Зависимая переменная: price
В данной модели коэффициенты при const, l_length, l_fuel значимые на 1% уровне, l_beam на 10 % уровне. Уравнение в целом значимое на 1 % уровне значимости и R2= 0, 704285. Полученные результаты свидетельствуют о наличии мультиколлинерности в модели. (мало значимых переменных, а уравнение в целом значимо). В результате проведенного теста на мультиколлениарность было обнаружено, что переменная l_fuel является причиной данной проблемы. Исключим данную переменную.
Модель 9: МНК, использованы наблюдения 1-153 Зависимая переменная: price
В данной модели коэффициенты при const, l_length, l_beam значимы на 1%, а при l_draft на 10 % уровне. Было решено исключить незначимые переменные кроме l_max_speed, l_power и l_cabin, так как на мой взгляд, данные параметры очень важны при формировании цены яхт. Проинтерпретируем коэффициент при фиктивной переменной region (1- Европа, 0-Америка): Цена яхты в Европе на 309391 евро ниже, чем цена яхты в Америке.
Модель 10: МНК, использованы наблюдения 1-153 Зависимая переменная: price
В данной модели коэффициенты при const, l_lenght, l_beam, значимы на 1% уровне значимости, при l_draft на 10% уровне. Уравнение в целом значимо на 1% и R2= 0, 674912. Коэффициенты при l_max_speed, l_cabin и l_power не являются значимыми. С помощью теста на линейное ограничение проверим равенство коэффициентов при данных переменных нулю. H0: b[l_max_speed] = 0 F(1, 146) = 0, 770214, р-значение = 0, 381593 Так как р-значение меньше тестовой статистики, то Н0 принимается, и это означает, что коэффициент при данной переменной равен нулю. Н0: b[l_power] =0 F(1, 146) = 0, 97815, р-значение = 0, 324292 Так как р-значение меньше тестовой статистики, то Н0 принимается, и это означает, что коэффициент при данной переменной равен нулю. H0: b[l_cabin]=0 F(1, 146) = 1, 13994, р-значение = 0, 287427 Так как р-значение меньше тестовой статистики, то Н0 принимается, и это означает, что коэффициент при данной переменной равен нулю. Таким образом, нужно исключить данные переменные из модели.
Модель 11: МНК, использованы наблюдения 1-153 Зависимая переменная: price
В данной модели коэффициенты при const, l_length, l_beam на 1% уровне. Уравнение в целом является значимым на 1% уровне и R2 = 0, 668538. Проведем тест Уайта на гетероскедастичность, так как метод МНК можно применять лишь при отсутствии гетероскедастичности. Н0: в модели нет гетероскедастичности Тест Вайта (White) на гетероскедастичность МНК, использованы наблюдения 1-153 Зависимая переменная: uhat^2
Коэффициент Ст. ошибка t-статистика P-значение ------------------------------------------------------------------ const 6, 00346e+013 2, 91142e+013 2, 062 0, 0410 ** l_length 4, 51192e+012 3, 33044e+013 0, 1355 0, 8924 l_beam -7, 96889e+013 5, 58662e+013 -1, 426 0, 1559 l_draft -2, 42108e+013 8, 39166e+012 -2, 885 0, 0045 *** sq_l_length -3, 02120e+011 1, 29880e+013 -0, 02326 0, 9815 X2_X3 -1, 96861e+012 3, 27349e+013 -0, 06014 0, 9521 X2_X4 8, 78593e+012 8, 69348e+012 1, 011 0, 3139 sq_l_beam 2, 58137e+013 2, 54149e+013 1, 016 0, 3115 X3_X4 -8, 85192e+011 1, 37071e+013 -0, 06458 0, 9486 sq_l_draft 9, 41496e+011 1, 89302e+012 0, 4974 0, 6197
Неисправленный R-квадрат = 0, 286356
Тестовая статистика: TR^2 = 43, 812479, р-значение = P(Хи-квадрат(9) > 43, 812479) = 0, 000002
Таким образом, в модели есть гетероскедастичность. Проведем коррекцию ошибок в формуле Уайта. Предположим, что зависимость квадратных остатков описывается следующим образом: Оцениваем параметры модели. Получаем ряд . Используем оценку дисперсии: . В качестве весов возьмем переменную w3=1/ .
Модель 12: ВМНК, использованы наблюдения 1-153 Зависимая переменная: price Весовая переменная: w3
Статистика, полученная по взвешенным данным:
Статистика, полученная по исходным данным:
В данной модели коэффициенты при const, l_length, l_beam являются значимыми на 1% уровне. Уравнение в целом является значимым на 1% уровне и R2 = 0, 668510. Существенным недостатком данной модели является то, что значительные характеристики модели были исключены при улучшении линейно-логарифмической модели и данная модель характеризует зависимость цены только от размеров судна. Также недостатком является то, что оценки коэффициентов не являются наилучшими в классе несмещенных линейных оценок. Полученная модель отображает зависимость цены яхты от длины, ширины и осадки судна. В процессе улучшения модели фиктивная переменная region была исключена из модели, но была проинтерпретирована ранее. Price = -1, 51531e+07 +3, 18289e+06 * ln (length) + 4, 483e+06 * ln (beam) + 453326 ln (draft) Проинтерпретируем значимые коэффициенты полученной модели: ü При увеличении длины яхты на 1%, цена увеличивается на 31828.9 евро; ü При увеличении ширины яхты на 1%, цена яхты увеличивается на 44830 евро; ü При увеличении осадки яхты на 1%, цена яхты увеличивается на 4533, 26 евро;
|