Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






РЕГРЕССИОННЫЙ АНАЛИЗ» по курсу теория вероятностей и математическая статистика

Отчет по лабораторной работе №2

студент:
группа:
преподаватель: Низаметдинов Ш.У.

 

Москва, 2012

Цель: привитие умения и навыков построения экспериментально-статистической модели объекта с использованием процедур регрессионного анализа.

 

Выполнение работы

Уравнение регрессии вида:

где k — число независимых переменных модели регрессии. Для каждого момента времени t = 1: n значение определяется по формуле

Существует две оценки дисперсии случайного возмущения: S 2В и S 2.

Первая из них S 2 вычисляется как:


и характеризует достигнутую точность оцененной модели, а вторая – S 2В есть дисперсия воспроизводимости, определяемая по результатам m наблюдений в одной и той же точке области изменения переменных.



Коэффициент детерминации R 2:

 

Правленый коэффициент детерминации R 2n:

 



F р = S2/S2 В:

 

 

Тест Чоу:

 

 


Произведем выборку из массива данных по признаку-условию Автомобили FORD.

 

 

Предположим, что на цену автомобиля (price) сильнее всего влияет кол-во лошадиных сил (horsepower).

 

 

 

 

Получаем:

 

 

Значит наше предположение было не верно. На цену автомобилей Ford кол-во лошадиных сил влияет не достаточно значимо

 

 

Теперь вновь добавим все переменные. И в итоге получим уравнение вида

y =a 0 f 0(x 1, …, xn) + a 1 f 1(x 1, …, xn) + ….+ak fk (x1, …, xn).

 

Начинаем избавляться от переменных, которые оказывают наименьшее влияние, в нашем случае это - horsepower.

 

Статистика имеет распределение n2=-6, 16-6-2=8.

 

 

Будем повторять свои действия, пока в нашей таблице не останутся только красные значения, т.е. те, которые значительно влияют на нашу depended variable. В итоге получим:

 

Получилось, что для автомобилей Ford переменные year и weight оказывают наибольшее влияние на цены. Теперь посмотрим на показатель остаточной суммы квадратов, который вычисляется как

 

 

График остатков имеет следующий вид:

 

 

Проведем следующую выборку- только автомобили Volkswagen

 

Остаточная сумма квадратов:

 

 

График остатков:

 

 

Объединим эти два условия для выборки и повторим все наши действия

 

 

Остаточная сумма квадратов:

 

График остатков:

 

Тест Чоу

Сопоставим два уравнения регрессии, построенные для двух выборок и воспользуемся тестом Чоу. Пусть и – остаточные суммы квадратов регрессий для первого и второго набора данных, – остаточная сумма квадратов для полной регрессии (объединенная выборка). Если выполняется соотношение

 

,

 

то гипотеза H: a 1= a 2 отвергается.

 

Sr1 = 2342657

Sr2 = 14925092

N1 = 15

N2 = 10

Sr = 26033750

Подставим данные в соотношение.

3, 2 > 3. Значит гипотеза опровергнута.

 

<== предыдущая лекция | следующая лекция ==>
 | I. Специальная дошкольная психология
Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.009 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал