Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Пример 3.6.
Пусть в результате наблюдения за экономическим процессом получен ряд из пяти пар чисел , характеризующих (описывающих) данный процесс (X – объясняющая переменная, причина; Y – объясняемая переменная, следствие):
Например, Х – цена предложения товара (грн./шт.), Y – объем предложения товара (тыс.грн.). Поскольку переменных две, а характер поведения рассматриваемого процесса неизвестен – построим на основе этих эмпирических данных корреляционное поле в декартовой системе координат (рис.3.2). Корреляционное поле (точечный график; точечная диаграмма рассеивания) – это графическое изображение совокупности реальных статистических данных (данных наблюдений) в виде точек в декартовой системе координат.
Рис.3.2. Корреляционное поле, эмпирическая и теоретическая линии регрессии
Если на корреляционном поле соединить все точки в порядке возрастания Х отрезками прямой получим эмпирическую (наблюдаемую) линию регрессии. Причем, если в массиве наблюдений некоторому значению X соответствует несколько значений Y, то только для построения эмпирической линии регрессии при каждом таком Х должно быть определено групповое среднее значение Y. Поэтому в общем случае эмпирическая линия регрессии строится по групповым средним значениям Y, которые определены при имеющих место в массиве наблюдений значениях Х, т.е. необходимо поступать так, как в качестве примера показано на рис.3.3.
Рис.3.3. К методике построения эмпирической линии регрессии
Характер эмпирической линии (в общем случае – поверхности) регрессии дает представление об ожидаемом поведении среднего значения Y под влиянием фактора X (в общем случае – под влиянием учтенных факторов). Статистические данные, представленные в числовом виде (в виде таблицы значений), не всегда удобны и наглядны. Они значительно лучше воспринимаются, если представлены в аналитическом виде, т.е. в виде функций. Можно построить полином. Однако во многих случаях эмпирические данные по Х и по Y не являются достаточно точными (ошибки измерений, влияние других факторов, ограниченный объем массива наблюдений). Поэтому представляет интерес выбор такой аппроксимирующей функции , чтобы значения её находились достаточно близко от известных (наблюдаемых) значений при наблюдаемых значениях , но не обязательно совпадали с ними. Например, по расположению эмпирической линии регрессии на рис.3.2 можно предположить, что форма корреляционной связи – линейная. Уравнение парной линейной регрессии: , где - параметры уравнения регрессии. Линия регрессии, построенная по уравнению регрессии, называется теоретической линией регрессии. Интерпретация параметров уравнения парной линейной регрессии (рис.3.2): параметр – это постоянная регрессии, определяющая точку пересечения регрессионной прямой с осью ординат. Например, если Y – валовые издержки, то – это постоянные издержки. Экономическая интерпретация параметра возможна не всегда. В общем случае отражает средний эффект всех факторов, которые влияют на Y за исключением явно включенных в модель; параметр – это коэффициент регрессии. Отражает наклон линии регрессии, вдоль которой рассеяны данные наблюдений. Параметр может быть интерпретирован как показатель, характеризующий изменение переменной Y, которое вызвано изменением значения Х на единицу, и равняется тангенсу угла наклона на рис.3.2.Знак параметра определяет направление этого изменения. При положительном коэффициенте регрессии с ростом значений Х растет и , при отрицательном – увеличение значений Х сопровождается уменьшением .
При выборе (выявлении) функциональной составляющей связи в качестве меры «близости» часто принимается квадрат расстояния между эмпирической функцией, заданной таблицей значений, и аналитическим аналогом. Такое приближение функции решается методом наименьших квадратов. Обычный метод наименьших квадратов (МНК) Суть метода в том, чтобы сумма квадратов отклонений расчетных значений (определенных по теоретической линии регрессии при наблюдаемых значениях ) от наблюдаемых значений была наименьшей. Метод построения аппроксимирующей функции из этого условия называется методом наименьших квадратов. В соответствии с идеей МНК необходимо минимизировать функционал , где , - значения переменных в i -том наблюдении (наблюдаемые значения); - теоретическое (расчетное) значение Y при ; n - количество наблюдений. Минимум функционала достигается в той точке, в которой первые частные производные от функционала Q по параметрам и обращаются в ноль: ; . В результате получаем систему нормальных линейных уравнений относительно неизвестных параметров и : ; . Решив систему, получим: - коэффициент регрессии ; (3.1) - постоянная регрессии (свободный член) , (3.2) где - средние значения соответственно X и Y для данного массива наблюдений. Если фактор Х не оказывает влияния на результат Y, то , линия регрессии параллельна оси абсцисс и . Данные для расчета параметров уравнения регрессии (пример 3.6):
; . Тогда оцененное уравнение парной линейной регрессии в явном виде: Если бы между Y и X существовала чисто функциональная связь, то все наблюдаемые значения Y лежали бы на теоретической линии регрессии. Приведение нелинейных парных регрессий к линейному виду по параметрам и по переменным (линеаризация функций) Достаточно часто между экономическими показателями имеют место нелинейные взаимосвязи. Основной прием, с помощью которого упрощается процесс оценки параметров нелинейных взаимосвязей, – их линеаризация. Линеаризация – это переход от нелинейной формы связи (гиперболической, показательной, степенной, логарифмической и т.п.) к линейной (по внешнему виду) форме с помощью различных преобразований, что позволяет в дальнейшем оценивать параметры обычным методом наименьших квадратов. В частности, параметры нелинейных парных регрессий можно также оценивать по выражениям (3.1) и (3.2), произведя предварительно их приведение к линейному виду. Пример 3.7. Если прологарифмировать степенную зависимость , то получим её линейную по переменным и по параметрам форму . Полученная зависимость линейна относительно и может быть оценена как парная линейная регрессия. Тогда при оценивании параметров и значения переменных и в выражениях (3.1) и (3.2) должны быть заменены на их логарифмы. Результат же для свободного члена, вычисленный по формуле (3.2), должен быть преобразован путем нахождения его антилогарифма: .
|