![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Ошибочная оценка условий применимости линейного уравнения регрессии ⇐ ПредыдущаяСтр 7 из 7
Широкое распространение электронных таблиц и программного обеспечения для статистических расчетов ликвидировало вычислительные проблемы, препятствовавшие применению регрессионного анализа. Однако это привело к тому, что регрессионный анализ стали применять пользователи, не обладающие достаточной квалификацией и знаниями. Многие из них вообще не имеют ни малейшего понятия об условиях применимости метода наименьших квадратов и не умеют проверять их выполнение. Используют регрессионный анализ без глубоких знаний о предмете исследования. Зачастую пытаются экстраполировать полученную регрессионную модель за пределы диапазона изменения объясняющей переменной. Исследователь не должен увлекаться перемалыванием чисел — вычислением коэффициентов регрессии и коэффициента смешанной корреляции. Ему нужны более глубокие знания. Проиллюстрируем это рядом примеров, представленных ниже в виде 4-х наборов статистических данных.
Все представленные виды экспериментальных данных, если к ним применить модель линейной регрессии, имеют одни и те же статистические параметры: Далее для каждого набора (I - IV) приведены диаграммы разброса и графики остатков, свидетельствующие о существенном их различии.
Итак, с точки зрения регрессионного анализа все эти наборы данных совершенно идентичны. Если бы анализ был на этом закончен, мы потеряли бы много полезной информации. Диаграммы разброса и графики остатков свидетельствуют о том, что эти данные отличаются друг от друга. Единственный набор, распределенный вдоль прямой линии, — набор I. График остатков, вычисленных по набору I, не имеет никакой закономерности. Этого нельзя сказать о наборах II, III и IV. График разброса, построенный по набору II, демонстрирует ярко выраженную квадратичную модель. Этот вывод подтверждается графиком остатков, имеющим параболическую форму. Диаграмма разброса и график остатков показывают, что набор данных III содержит выброс. В этой ситуации необходимо исключить выброс из набора данных и повторить анализ. После исключения выброса результат повторной оценки модели может оказаться совершенно иным. Диаграмма разброса, построенная по данным из набора IV, иллюстрирует необычную ситуацию, в которой эмпирическая модель значительно зависит от отдельного отклика (Х 8 = 19, Y 8 = 12, 5). Такие регрессионные модели необходимо вычислять особенно тщательно. Итак, графики остатков и диаграммы разброса являются крайне необходимыми инструментами регрессионного анализа и должны быть его неотъемлемой частью. Без них регрессионный анализ не заслуживает доверия.
|