Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Моменты распределений
Для введенных выше распределений вводятся соответствующие им моменты. Сохраняя прежние [2] обозначения, приведем формулы, определяющие начальные и центральные моменты до второго порядка включительно: · – первый начальный момент (математическое ожидание) соответственно первой и второй координаты; · – второй смешанный начальный момент; · – второй центральный момент (дисперсия) соответственно первой и второй координаты; · – второй смешанный центральный момент. Ниже приводятся определения этих моментов для совместных распределений непрерывного и дискретного типов. Непрерывный вектор:
, .
,
.
. Дискретный вектор: ,
, ,
2. Регрессионный анализ 2.1 Функции, линии и поверхности регрессии Рассмотрим вначале двумерный случайный вектор. Условным распределениям координат такого вектора (x, h) соответствуют условные математические ожидания его компонент: · j(x) = M(h/x= x) – условное математическое ожидание случайной величины h при условии, что другая случайная величина x приняла значение x, · y(y) = M(x/h= x) – условное математическое ожидание случайной величины x при условии, что другая случайная величина h приняла значение y. Функции j(x) и y(y) называются функциями регрессии случайного вектора (x, h), а уравнения y = j(x), x = y(y) (2.1)
– уравнениями регрессии. Первое из них – уравнение регрессии h на x, второе – x на h. Геометрическое место соответствующих этим уравнениям точек называются линиями регрессии. Ясно, что для случайного вектора с независимыми компонентами линиями регрессии будут две взаимно перпендикулярные прямые, параллельные координатным осям и пересекающиеся в центре распределения – в точке с координатами Мx, Мh. В некоторых случаях функции регрессии оказываются линейными. Тогда говорят, что имеет место линейная регрессия. Аналогично определяются уравнения регрессии трехмерного случайного вектора (x, h, z):
z = j(x, y), y = y(x, z), x = c(y, z), (2.2)
где j(x, y) – условное математическое ожидание случайной величи-ны z при условии что x = x, h = y; аналогично y = y(x, z), x = c(y, z) для h, z. Геометрическим образом уравнений (2.2) регрессии трехмерного случайного вектора (x, h, z) являются некоторые поверхности, которые называются поверхностями регрессии. Таким же образом вводятся уравнения регрессии случайного вектора (x1, x2,..., x n) произвольного числа измерений. Имеет место некоторая неоднозначность термина уравнение регрессии.
2.2 Экстремальное свойство функции регрессии Поставим следующую задачу. Задано совместное распределение двумерного случайного вектора (x, h). Требуется найти такие функции y = f (x), x = g (y), (2.3)
которые наилучшим в смысле среднеквадратического отклонения образом описывают зависимость между компонентами случайного вектора. Иначе говоря, определить функции (3.1) так, чтобы соответствующие моменты М(h – f (x))2 и М(x – g (y))2 достигали своего наименьшего значения. Для этого надо найти минимум функционалов
Q1[ f (x)] = М(h – f (x))2, Q2[ g (y)] = М(x – g (y))2. (2.4)
Теорема. Минимум функционалам (3.4) доставляют функции регрессии (2.1). Докажем это, ограничиваясь ради краткости и простоты рассмотрением двумерного дискретного распределения. Примем обозначения: · { xi }, { yj } – множества значений случайных величин x и h соответственно, · pij = P(x = xi, h = yj) – вероятность того, что случайный вектор (x, h) принимает значение (xi, yj), · P(x = xi / h = yj) – условная вероятность того, что x = xi при условии h = yj, · Р(h = yj / x = xi) – условная вероятность того, что h = yj при условии x = xi. Первое из минимизируемых выражений принимает вид
Q1[ f (x)] = М(h – f (x))2 = (yj – f (xi))2 pij = = (yj – f (xi))2P(x = xi, h = yj). (2.5) Заменяя вероятность соответствующим произведением вероятностей (теорема умножения)
pij = P(x = xi, h = yj) = P(x = xi) Р(h = yj / x = xi),
получим:
М(h– f (x))2 = P(x = xi) (yj – f (xi))2 Р(h = yj / x = xi). (3.4)
Преобразуем внутреннюю сумму последнего выражения так:
(yj – f (xi))2 Р(h = yj / x = xi) = = (yj – j(xi))2 Р(h = yj / x = xi) + + (j(xi) – f (xi))2 Р(h = yj /x = xi) + + 2 ((yj – j(xi)) (j(xi) – f (xi)(Р(h = yj / x = xi).
Покажем, что последняя сумма равна нулю:
(yj – j(xi)) (j(xi) – f (xi)(Р(h = yj / x = xi) =
=(j(xi) – f (xi))( yj Р(h = yj /x = xi) – j(xi) Р(h = yj /x = xi) =
= (j(xi) – f (xi))(j(xi) – j(xi)) = 0.
Здесь мы воспользовались тем, что j(x) – функция регрессии и по определению она равна условному математическому ожиданию:
yj Р(h = yj / x = xi) = j(xi),
а также очевидным равенством
Р(h = yj / x = xi) = 1.
Теперь минимизируемое выражение (3.3) принимает вид:
Q1[ f (y)] = М(h – f (x))2 =
= P(x = xi) ((yj – j(xi))2 + (j(xi) – f (xi))2)Р(h = yj /x = xi), (2.6) и становится ясно, что минимальное значение этому выражению среди всех возможных функций f (x) доставляет функция регрессии j(x): f (x) = j(x).
Аналогично можно доказать, что минимальное значение функционалу Q2[ g (y)] доставляет функция регрессии y(y):
g (y) = y(y).
Для функций регрессии n -мерного случайного вектора также справедливо экстремальное свойство, доказанное выше для случая двух измерений. Это свойство можно выразить с помощью следующего равенства:
Q[ f (x1, x2,..., x n-1)] = M(x n – f (x1, x2,..., x n-1))2 = = M(x n – j(x1, x2,..., x n-1))2, (2.7)
где j(x 1, x 2,..., xn-1) – функция регрессии x n на x1, x2,..., x n. Экстремальное свойство функций регрессии может служить обоснованием прогноза значений случайной величины на основании известных значений других координат случайного вектора.
|