Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Й учебный вопрос. Построение уравнения двухфакторной линейной регрессии.Стр 1 из 2Следующая ⇒
Уравнение двухфакторной линейной регрессии является простейшим случаем множественной регрессии. На предыдущей лекции мы имели дело с двумя признаками — результативным и факторным. Но на результат действует обычно не один фактор, а несколько, что необходимо учитывать для достаточно полного анализа связей. В математической статистике разработаны методы построения множественной регрессии (Регрессия называется множественной, если число независимых переменных, учтенных в ней, больше или равно двум.), Возвратимся к ранее рассмотренному примеру. В нем была определена форма связи между величиной сбора хлеба на душу и размером посева на душу. Введем в анализ еще один фактор — уровень урожайности (см.табл. 3.1). Без сомнения, эта переменная влияет на сбор хлеба на душу. Но в какой степени влияет? Насколько обе независимые переменные определяют сбор хлеба на душу в черноземных губерниях? Какая из переменных — посев на душу или урожайность — оказывает определяющее влияние на сбор хлеба? Попытаемся ответить на эти вопросы. После добавления второй независимой переменной уравнение регрессии будет выглядеть так: y = a0+a1x1+a2x2 (3.4) где у—сбор хлеба на душу; х1—размер посева на душу; x2—урожай с десятины (в пудах); а0, а1, а2—параметры, подлежащие определению. Для нахождения числовых значений искомых параметров, как и в случае одной независимой переменной, пользуются методом наименьших квадратов. Он сводится к составлению и решению системы нормальных уравнений, которая имеет вид: Когда система состоит из трех и более нормальных уравнений, решение ее усложняется. Существуют стандартные программы расчета неизвестных параметров регрессионного уравнения на ЭВМ (например, SPCC, Statistica, Statgraphic и другие). При расчете вручную можно воспользоваться известным методом определителей. Использование этого метода чрезвычайно упрощается, если все расчеты вести в программе Excel. Пример. По данным табл. 3.1 найдем параметры a0, а1, а2. Построим вспомогательную таблицу 3.2. для составления системы нормальных уравнений: Таблица 3.2 Вспомогательная таблица для расчета параметров уравнения двухфакторной линейной регрессии
Используя суммы, рассчитанные в последней строке таблицы 3.2, построим систему нормальных уравнений и решим ее. 23a0 + 22, 5a1+967, 72a2 = 959, 43 22, 5a0+16, 06a1+508, 5a3=614, 76 (3.5) 967, 72 a0+508, 50a1+22148a3=21403, 63 Решая систему (3.5) методом определителей, получаем следующие результаты: a0 = -0, 85, a1 =28, 18, a2 =0, 36. Таким образом, уравнение множественной регрессии между величиной сбора хлеба на душу населения (у), размером посева на душу (x1) и уровнем урожайности (х2) имеет вид: у = -0, 85+28, 18x1+0, 36x2 (3.6)
|