Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Задача №1. Данная задача является модификацией примера регрессионного анализа, рассмотренного в учебнике по экспериментальной психологии Джеймса Гудвина (ССтр 1 из 7Следующая ⇒
Данная задача является модификацией примера регрессионного анализа, рассмотренного в учебнике по экспериментальной психологии Джеймса Гудвина (С. James Goodwin) (2004, с.484, 486-487). Исследователь пытается выявить взаимосвязь между количеством времени X, бесполезно потраченного студентами, и средним баллом Y их академической успеваемости, который варьируется в пределах от 2, 0 до 5, 0. Под потраченным без пользы временем понимается количество часов определенного соответствующего времяпровождения в неделю (например, занятого просмотром «мыльных» телесериалов). Данные для выборки студентов приведены в табл. 1 Требуется построить линейную регрессионную зависимость среднего балла успеваемости от показателя бесполезно потраченного времени, а также выполнить прогноз успеваемости для значений X, равных 20, 30 и 40 часов. В ответе к задаче приведите: а) скорректированный процент объясняемой моделью дисперсии отклика, б) оценку уровня значимости регрессии по F-критерию, в) нестандартизованные коэффициенты регрессионного уравнения и оценки их значимости по t-критерию, г) номер наблюдения, имеющего наибольший по модулю остаток, д) прогнозируемые значения отклика. Таблица 1. Средний балл успеваемости студентов и показатель бесполезно потраченного ими времени
Решение: Задачу необходимо при помощи простой регрессионной модели. Первоначально посмотрим на значение р-уровня значимости по критерию F-Фишера. Таблица 2.
Из таблицы 2 видно, что р-уровень значимости статистически достоверен, поэтому модель может быть содержательно интерпретирована. Далее посмотрим на значение скорректированного R-квадрата. Таблица 3.
Из таблицы 3 видно, что значение КМД (0, 795) достаточно велико, т.е. регрессионная модель объясняет более 79, 5% дисперсии зависимой переменной, и результаты предсказания могут быть приняты во внимание, а скорректированный процент объясняемой моделью дисперсии отклика равен 76, 6%, что приводит к незначительному уменьшению R-квадрат. Таблица 4.
Из таблицы 4 видно, что значимость регрессионного коэффициента по критерию t-Стьюдента является достоверной (0, 001). Вклад переменной (Время, потраченное зря) является значимым - 89%, и мы можем включить данный коэффициент в уравнение. Таблица 5.
По полученным остаткам, приведенным в базе «Задача 1», видим, что наибольший по модулю остаток имеет испытуемый №3. Уравнение регрессии: У (х)= 5, 521 – 0, 060*(время потраченное зря). Построим линейную регрессионная зависимость среднего балла успеваемости от показателя бесполезно потраченного времени: Рис 1. Линейная регрессионная зависимость среднего балла успеваемости от показателя бесполезно потраченного времени. Прогноз успеваемости для значений X, равных 20, 30 и 40 часов: У (20) = 5, 521 – 0, 060 * 20 = 4, 321 - студенты, тратящие примерно 20 часов в неделю на бесполезные дела, имеют более высокие оценки зависимой переменной, следовательно, их академическая успеваемость намного выше; У (30) = 5, 521 – 0, 060 * 30 = 3, 721 - студенты, тратящие без пользы 30 часов в неделю, имеют менее высокие оценки зависимой переменной, соответственно у них наблюдается средняя академическая успеваемость; У (40) = 5, 521 – 0, 060 * 40 = 3, 121 - учащиеся, которые тратят по 40 часов в неделю без пользы, обладают самыми низкими показателями оценки зависимой переменной и низкой академической успеваемостью. Таким образом, мы можем сделать вывод о том, что чем большее количество времени тратится студентом на бесполезные дела, тем ниже его академическая успеваемость. Ответы: а) скорректированный процент объясняемой моделью дисперсии отклика равен 76, 6%; б) оценка уровня значимости регрессии по F-критерию равна 28, 5; в) нестандартизованный коэффициент регрессионного уравнения и оценка его значимости по t-критерию равны -0, 060 и 0, 001 соответственно; г) наибольший по модулю остаток имеет испытуемый №3; д) чем большее количество времени тратится студентом на бесполезные дела, тем ниже его академическая успеваемость. Таблица 6.
|