![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Алгоритм оценки главных компонент
Ставится задача на основе выборочных данных, представленных в виде матрицы X типа «объект-свойство» с элементами На основе выборочных данных можно найти лишь оценки теоретических характеристик, рассмотренных ранее. Это влечет за собой проверку ряда статистических гипотез. Предполагая, что вектор исходных признаков распределен по нормальному закону 1. На основе матрицы X типа «объект-свойство» рассчитывается оценка ковариационной матрицы 2. Проверка гипотезы о диагональности матрицы
Для проверки нулевой гипотезы используется статистика:
где При расчете наблюдаемого значения статистики (5.6) определитель матрицы Статистика (5.6) при В случае диагональности матрицы Для проверки гипотезы о незначимости корреляционной матрицы используется критерий Уилкса.
Для проверки нулевой гипотезы используется статистика:
Статистика (5.7) при 3. Нахождение точечных и интервальных оценок собственных значений матрицы Для построения доверительного интервала для собственного числа
где
Если доверительный интервал какого-то собственного числа содержит внутри себя оценки для других собственных чисел, то следует заподозрить кратность (повторение) собственных чисел. 4. Проверка гипотезы о кратности собственных чисел (если есть на это основание). Нулевая гипотеза о равенстве r характеристических корней формулируется следующим образом:
Очевидно, альтернативой этой гипотезе является утверждение, что не все корни среди Для проверки нулевой гипотезы используется следующая статистика:
Статистика (5.8) в предположении справедливости проверяемой гипотезы и Возможно обобщение асимптотического доверительного интервала на случай кратных корней [12]. Если r – это кратность корня
где 5. Оценка уровня информативности и проверка гипотезы о достаточности m главных компонент с помощью критерия Бартлетта ( Так как на основании выборочных данных можно рассчитать лишь оценку критерия информативности, то необходимо проверить гипотезу о том, что m главных компонент вносят существенный вклад в дисперсию исходных признаков. Нулевая и альтернативная гипотезы формулируются следующим образом:
При
где При справедливости нулевой гипотезы статистика (5.9) имеет распределение «Хи-квадрат» с числом степеней свободы Если m главных компонент обеспечивают высокий уровень информативности, то соответствующие им собственные числа
Для проверки нулевой гипотезы используется следующая статистика:
Статистика (5.10) в предположении справедливости проверяемой гипотезы и 6. Построение главных компонент. 7. Нахождение матрицы нагрузок. 8. Интерпретация главных компонент. Анализируя, с какими исходными признаками тесно коррелирует та или иная главная компонента, подбираются названия новым признакам. 9. Нахождение матрицы индивидуальных значений центрировано-нормированных главных компонент. Обозначим матрицу индивидуальных значений центрировано-нормированных главных компонент следующим образом:
где Можно записать: В общем случае
5.2 Факторный анализ: метод общих (главных) факторов
|