Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Факторный анализ
Основная цель факторного анализа – обнаружить скрытые общие факторы, объясняющие связи между наблюдаемыми признаками. Исходные показатели для проведения факторного анализа также центрируются. x1, x2 …xp – исходные наблюдаемые показатели; y1, y2 …yp’ – общие факторы, p’< p. x1-m1 = , j = 1…p. qjn - нагрузка общего фактора yn на исходный показатель, uj – остаточная случайная компонента, невязка. M[Y] = 0, M[U] = 0, D[Y] = 1; y и u попарно некоррелированны (r(yi, yj) =0, r(ui, uj) =0). F – возможная с учетом ограничений линейная комбинация. Ip’(Z(X))=1- , Rx –корреляционная матрица исходных данных, - корреляционная матрица = , - евклидова норма. Найденные факторы y могут считаться причинами, а признаки x – следствиями.
30. Метод главных компонент Задача заключается в определении такого набора , найденного на классе F допустимых преобразований исходных показателей x1, x2 …xp, что . F – всевозможные линейные ортогональные нормированные комбинации исходных показателей: Zj(X) = cj1(x1-m1)+…+ cjp(xp-mp). ; , i ¹ j. . В матричной форме = LX, – вектор искомых вспомогательных переменных, - матрица, строки которой удовлетворяют условиям ортогональности. . Переменные, полученные таким образом называются главными компонентами исследуемой системы показателей X. Первой главной компонентой 1 (X) называется такая нормировано-центрированная линейная комбинация показателей, которая среди всех прочих линейных комбинаций имеет наибольшую дисперсию. , l 1 – первая строка матрицы L. Пусть X центрирована: X=X - , M[X] = 0, S = M[X X’] – ковариационная матрица. l1: (S-lI) =0 или det(S-lI)=0 – характеристическое уравнение матрицы S. Так как S - симметрична и неотрицательна, уравнение имеет p вещественных неотрицательных корней l1³ …³ l1 ³ 0. , l1 - наибольшее собственное значение. Первая главная компонента Z1(X) = l1X, l1 – соответствующий l1 собственный вектор. Основные числовые характеристики главных компонент: M[Z]= M[L X]=L M[X] = 0; SZ = M[Z Z’] = M[(L X) (L X)’]= M[LXX’ L’]= LM[XX’] L’=LSL’ – диагональная матрица, по диагонали стоят собственные числа.; D[Zk]= lk, k=1…p. Кроме того, сумма дисперсий исходных признаков равняется сумме дисперсий главных компонент, а обобщенная дисперсия исходных признаков |S| равняется обобщенной дисперсии главных компонент |SZ|. Критерий информативности: , отсюда также можно получить ответ сколько (p’) главных компонент достаточно для качественного представления. Использование главных компонент эффективно, когда все показатели X имеют одинаковую физическую природу (измеряются в одинаковых единицах). Иначе результаты исследования будут зависеть от выбора масштаба и природы единиц измерения.
|