Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Элементы корреляционного и регрессионного анализа






 

Одной из важнейших задач математической статистики является нахождение зависимостей между переменными Х и Y. В естественных науках большей частью приходится сталкиваться с зависимостями, когда каждому значению одной величины строго соответствует определённое значение другой величины. Такие зависимости называются функциональными.

В большинстве случаев между переменными, характеризующими экономические показатели, существуют зависимости, отличные от функциональных. Зависимости между переменными, когда каждому значению переменной Х соответствует не одно, а множество возможных значений переменной Y, называются стохастическими или корреляционными. Эти зависимости обнаруживаются лишь при массовом изучении переменных.

Например, уровень производительности труда Y на предприятиях тем выше, чем больше его электровооружённость X. Вместе с тем такая зависимость может быть не обязательно однозначной. И это потому, что зависимая переменная Y испытывает влияние не только переменной Х, но и целого ряда других факторов, которые не учитываются. Кроме этого, влияние выделенного фактора может быть не прямым, а проявляться через цепочку других факторов. Поэтому в таких зависимостях каждому значению независимой переменной Х может соответствовать не одно, а ряд значений переменной Y.

При изучении корреляционных зависимостей (связей) возникают два основных вопроса – о тесноте связи и о форме связи. Если рассматриваются только две переменные, то связь (корреляция) между ними называется парной.

Если с увеличением значений переменной Х значения переменной Y в среднем растут, то такая парная корреляция называется положительной. Если же с ростом значений переменной Х значения переменной Y в среднем уменьшаются, то такая корреляция называется отрицательной. Если же между переменными Х и Y связь отсутствует, то говорят, что имеет место нулевая корреляция.

Каждую пару значений , соответствующих значениям переменных X и Y в i -м наблюдении, можно изобразить в виде точки на координатной плоскости. Совокупность таких точек называется корреляционным полем.

x
y
x
y
x
y

Линейная корреляционная зависимость и прямые регрессии

Ранее было отмечено, что корреляция по направлению может быть положительной и отрицательной. Положительную корреляцию называют прямой, а отрицательную – обратной. По форме корреляция может быть линейной и криволинейной.

Парная корреляционная зависимость будет линейной, если она приближённо выражается линейной функцией.

Вид зависимости можно определить по виду корреляционного поля, т.е. по расположению построенных точек подбирается линия. Если это будет прямая, то корреляция между признаками будет линейной.

x
x
Линейная Линейная Криволинейная прямая обратная
y
• •
• •
• •
• •
• •
• •
y
x
• •
• •
• •
• •
•  
y
• • • •
• • •
• •
• •

Для оценки тесноты связи между признаками используется выборочный линейный коэффициент корреляции

,

где - выборочные средние; - выборочные средние квадратические отклонения.

Так как коэффициент корреляции определяется по выборочным данным, то он является оценкой генерального коэффициента корреляции .

Коэффициент корреляции находится в пределах от -1 до 1, т.е. . Чем ближе к –1 или 1, тем теснее связь между переменными Х и Y. Чем ближе к нулю, тем слабее связь между переменными. Таким образом, по величине коэффициента корреляции можно судить о тесноте связи между двумя переменными.

По знаку коэффициента корреляции можно судить о направлении корреляционной зависимости между переменными Х и Y. Если , то зависимость прямая. Если же , то зависимость обратная.

Квадрат коэффициента корреляции называется коэффициентом детерминации и обозначается в долях или в процентах. Он показывает, на сколько процентов в среднем изменения зависимой переменной Y зависят от независимой переменной Х.

Линейная корреляционная зависимость между переменными Х и Y приближённо выражается в виде линейного уравнения

.

Это уравнение называется уравнением регрессии Y на Х, а его график называется линией регрессии. Если уравнение регрессии описывает зависимость между двумя переменными, то такая регрессия называется парной.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.006 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал