Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Сравнение моделей ⇐ ПредыдущаяСтр 9 из 9
Если зависимая переменная одна и та же, то для сравнения моделей можно использовать R2 и R2-adj.
Сравним линейную и линейно-логарифмическую.
Линейная модель: R2=0, 0, 76332, R2-adj=0, 750184 Линейно-логарифмическая модель: R2=0, 668510 R2-adj=0, 661836
Итак, из этих моделей линейная модель является наилучшей, так как у нее наибольший R2-adj.
Сравним логарифмическую и логарифмически-линейную модели множественной регрессии.
Логарифмическая модель: R2=0, 0.791064 R2-adj=0.783958
Логарифмически-линейная модель: R2=0.768413 R2-adj=0.758895
Итак, из этих моделей логарифмическая модель является наилучшей, так как у нее наибольший R2-adj. К тому же недостатком логарифмически-линейной модели является гетероскедастичность.
Сравним линейную и логарифмическую модель. Так как зависимые переменные разные, то нельзя сравнивать R2 и R2-adj, будем использовать критерий Акаике и критерий Шварца.
Линейная модель: Критерий Акаике = 4125, 92, критерий Шварца = 4153, 166 Логарифмическая модель: Критерий Акаике = 123, 2005, критерий Шварца = 141, 3831
Логарифмическая модель является наилучшей, так как критерий Акаике и критерий Шварца в этой модели ниже, чем в линейной.
Таким образом, лучшей моделью является логарифмическая модель.
ln(price) = 4, 59755+2, 5175*ln(beam) + 0, 452243*ln(max_speed) + 0, 691972*ln(fuel) -0, 0515864*ln (cabin) - 0, 256186*ln (water) В итоге, в лучшей модели (в моем случае - логарифмической) были оставлены логарифмы следующих переменных: ширина судна, максимальная скорость, запасы топлива и воды, число кают. Данные переменные отражают влияние на цену яхты всех видов характеристик, а именно размеров судна, мощностных и скоростных показателей, запасов судна, а также показателей размещения экипажа. Это дает возможность дать более глубокий анализ ценообразования на рынке моторных яхт. Необходимо отметить, что все переменные, за исключением запаса воды, положительно влияют на цену. Однако увеличение запаса воды ведет к снижению стоимости яхты. Это может быть связано с тем, что наиболее состоятельные покупатели, приобретающие соответственно более дорогие суда, меньше проводят времени на своих яхтах и поэтому не нуждаются в больших запасах пресной воды. Необходимо также логически обосновать исключение остальных переменных из логарифмической модели (технически это уже было сделано ранее). При первом рассмотрении достаточно странным видится исключение переменной длины. Ведь чаще всего любое упоминание о характеристиках яхты начинается с приведения именно этого показателя. Здесь необходимо вспомнить, что ранее нами была выявлена сильная положительная связь между показателями длины и ширины, так что в целом, оба показателя могут быть успешно использованы при описания внешних габаритов судна. Конечно, длина для человека является более наглядной характеристикой, однако для компьютерной программы это не имеет значения. Поэтому здесь было решено довериться точным расчетам программы и выбрать ширину основной характеристикой габаритов судна. Исключение переменной " осадка" можно обосновать так же. Интереснее обстоит дело с переменной " водоизмещение". Её влияние на цену достаточно противоречиво, ибо судно с большим водоизмещением может оказаться как очень дорогой мегаяхтой, так и недорогой баржей схожих размеров. Ввиду данной нестабильности и неопределенности исключение данной переменной кажется нам достаточно логичным. Показатель " мощность" тоже весьма противоречивый, так как не всегда наиболее мощные яхты являются самыми престижными и дорогими. Обоснуем теперь исключение переменной " крейсерская скорость". И данный показатель, и переменная " максимальная скорость" примерно одинаково могут влиять на цену яхты, однако, максимальная скорость для многих покупателей зачастую является более " интересным" показателем, что делает его влияние на цену несколько более сильным и позволяет нам исключить дублирующую переменную " крейсерская скорость". Другая исключенная переменная, " число спальных мест" практически прямо зависит от числа кают, и поэтому здесь также было решено положиться на точные оценки программы, которая предложила оставить переменную " число кают" Интерпретация полученных коэффициентов была приведена выше.
Для подтверждения правильности спецификации модели проведем тест Рамсея.
Н0: спецификация модели правильная
Тест Рамсея (RESET) (квадраты и кубы) Расчетное значение: F = 1, 552195, Р – значение = P(F(2, 145) > 1, 5522) = 0, 215
Тест Рамсея (RESET) (только квадраты) Расчетное значение: F = 3, 032891, Р – значение = P(F(1, 146) > 3, 03289) = 0, 0837
Тест Рамсея (RESET) (только кубы) Расчетное значение: F = 3, 013034, Р – значение = P(F(1, 146) > 3, 01303) = 0, 0847
Так как для всех случаев р-значение > 0.05, то это означает, что спецификация модели верна на 5% уровне значимости.
Источники:
|