Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Компоненты корреляционной матрицы показателей интеллекта
Собственные значения выделяются в порядке их убывания в соответствии с осями эллипсоида разброса наблюдений. Количество выделяемых компонент (и собственных значений) равно числу переменных. Сумма всех собственных значений равна количеству переменных. Отметим, что если бы все корреляции между исходными переменными были бы равны нулю, то каждое собственное значение равнялось бы 1. Чем выше корреляции между переменными, тем больше предыдущие собственные значения и меньше — последующие. Собственное значение, деленное на количество переменных, есть доля дисперсии, соответствующая данной компоненте. Все компоненты исчерпывают 100% совокупной дисперсии переменных. Каждый элемент aik матрицы А — это компонентная нагрузка переменной i (строка) по компоненте k (столбец). Компонентная (как и факторная) нагрузка — аналог коэффициента корреляции, мера связи переменной i и компоненты k. Соответственно, квадрат компонентной нагрузки (как и корреляции) приобретает смысл части дисперсии, в данном случае — части дисперсии переменной, объясняемой соответствующей компонентой. Сумма квадратов всех компонентных нагрузок по строке равна 1, полной дисперсии переменной (в z -значениях). Таким образом, полная единичная дисперсия каждой переменной разложена по компонентам. Сумма квадратов всех компонентных нагрузок по столбцу равна собственному значению данной компоненты:
(16.2) где i — номер компоненты, j — номера переменных (количеством Р). Как было указано, это собственное значение, деленное на количество переменных, есть доля дисперсии, соответствующая данной компоненте, и используется как показатель информативности компоненты. Уравнение 16.1 позволяет восстановить коэффициенты корреляции по матрице компонентных нагрузок А, так как произведение этой матрицы на саму себя транспонированную дает корреляционную матрицу. В соответствии с правилом умножения матриц, каждый коэффициент корреляции rij может быть восстановлен через компонентные нагрузки, как сумма всех (по строке) произведений нагрузок для этих двух переменных по каждой компоненте. Восстановленный коэффициент корреляции вычисляется по формуле:
(16.3)
где i, j — номера переменных в корреляционной матрице; k — номер компоненты; М — количество компонент; а — компонентные нагрузки. Так, восстановленная корреляция между переменными 3 и 5:
Заметим, что диагональный элемент корреляционной матрицы, как корреляция признака с самим собой (i=j), равен сумме квадратов всех компонентных нагрузок данной переменной — по строке, то есть 1. Исследователь может воспользоваться анализом главных компонент как упрощенным вариантом факторного анализа. Тогда он выберет не все компоненты, а только главные, объясняющие большую часть дисперсии. В данном случае главными будут первые две компоненты, объясняющие 81% суммарной дисперсии переменных. Переход к главным компонентам позволяет ввести еще одно важное понятие факторного анализа. Общность (Communality) — часть дисперсии переменной, объясняемая главными компонентами (факторами), вычисляется как сумма квадратов нагрузок по строке:
(16.4)
где i — номер переменной, k — номер (главной) компоненты. Например, если по таблице 16.3 выделяются две главные компоненты, то общность переменной 1: = 0, 772 + (-0.58)2 = 0, 93, а общность переменной 4: = 0, 682 + 0, 532 = 0, 74. То есть первые две компоненты исчерпывают 93% дисперсии переменой 1 и 74% дисперсии переменной 4. Восстановленные только по главным компонентам коэффициенты корреляции (по формуле 16.3) будут меньше исходных по абсолютной величине, а на диагонали восстановленной корреляционной матрицы будут не 1, а величины общностей. Анализ главных компонент в «чистом виде» используется для решения одной из ключевых проблем факторного анализа — проблемы числа факторов. Принцип выделения «главных факторов» в факторном анализе тот же, что и при анализе главных компонент. Но в отличие от компонентного анализа факторный анализ направлен на объяснение корреляций между переменными, а не только компонент дисперсии. Факторная структура (Factor Structure Matrix) — основной результат применения факторного анализа. Элементы факторной структуры — факторные нагрузки (Factor Loadings) переменных aik, аналогичные компонентным нагрузкам (см. табл. 16.3). Однако основное требование их получения, в отличие от анализа главных компонент, — максимально полное отражение исходных коэффициентов корреляции. Поэтому основное уравнение факторного анализа:
= А – A’ при условии –> R, (16.5)
где R — исходная матрица интеркорреляций; — матрица восстановленных коэффициентов корреляции; А — матрица факторных нагрузок размерностью, столбцы которой — факторные нагрузки Р переменных по М факторам; А' — транспонированная матрица А. Отличие уравнения 16.5 от сходного с ним уравнения компонентного анализа (16.1) в том, что матрица факторных нагрузок А вычисляется таким образом, чтобы восстановленные коэффициенты корреляции минимально отличались от исходных корреляций. Рассмотрим искомую факторную структуру в общем виде, как матрицу факторных нагрузок (табл. 16.4). В этой таблице Р строк, соответствующих переменным, и М столбцов — факторов. Значение aik — это факторная нагрузка переменной i по фактору k. Соотношения величин в этой таблице идентично соотношениям в таблице компонентных нагрузок. Собственное значение (Eigenvalue) каждого фактора , по формуле 16.2, равно сумме квадратов факторных нагрузок всех переменных по фактору k (по столбцу). Общность каждой переменной , в соответствии с формулой 16.4, равна сумме квадратов факторных нагрузок переменной i по всем факторам. Коэффициент корреляции между любыми двумя переменными может быть восстановлен по этой таблице, как сумма произведений факторных нагрузок по соответствующим строкам (по формуле 16.3).
Таблица 16.4
|