Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
РЕГРЕССИОННЫЙ АНАЛИЗ» по курсу теория вероятностей и математическая статистика
Отчет по лабораторной работе №2 студент:
Москва, 2012 Цель: привитие умения и навыков построения экспериментально-статистической модели объекта с использованием процедур регрессионного анализа.
Выполнение работы Уравнение регрессии вида:
где k — число независимых переменных модели регрессии. Для каждого момента времени t = 1: n значение определяется по формуле Существует две оценки дисперсии случайного возмущения: S 2В и S 2. Первая из них S 2 вычисляется как: и характеризует достигнутую точность оцененной модели, а вторая – S 2В есть дисперсия воспроизводимости, определяемая по результатам m наблюдений в одной и той же точке области изменения переменных.
Правленый коэффициент детерминации R 2n:
Тест Чоу:
Произведем выборку из массива данных по признаку-условию Автомобили FORD.
Предположим, что на цену автомобиля (price) сильнее всего влияет кол-во лошадиных сил (horsepower).
Получаем:
Значит наше предположение было не верно. На цену автомобилей Ford кол-во лошадиных сил влияет не достаточно значимо
Теперь вновь добавим все переменные. И в итоге получим уравнение вида y =a 0 f 0(x 1, …, xn) + a 1 f 1(x 1, …, xn) + ….+ak fk (x1, …, xn).
Начинаем избавляться от переменных, которые оказывают наименьшее влияние, в нашем случае это - horsepower.
Статистика имеет распределение n2=-6, 16-6-2=8.
Будем повторять свои действия, пока в нашей таблице не останутся только красные значения, т.е. те, которые значительно влияют на нашу depended variable. В итоге получим:
Получилось, что для автомобилей Ford переменные year и weight оказывают наибольшее влияние на цены. Теперь посмотрим на показатель остаточной суммы квадратов, который вычисляется как
График остатков имеет следующий вид:
Проведем следующую выборку- только автомобили Volkswagen
Остаточная сумма квадратов:
График остатков:
Объединим эти два условия для выборки и повторим все наши действия
Остаточная сумма квадратов:
График остатков:
Тест Чоу Сопоставим два уравнения регрессии, построенные для двух выборок и воспользуемся тестом Чоу. Пусть и – остаточные суммы квадратов регрессий для первого и второго набора данных, – остаточная сумма квадратов для полной регрессии (объединенная выборка). Если выполняется соотношение
,
то гипотеза H: a 1= a 2 отвергается.
Sr1 = 2342657 Sr2 = 14925092 N1 = 15 N2 = 10 Sr = 26033750 Подставим данные в соотношение. 3, 2 > 3. Значит гипотеза опровергнута.
|