Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Представление и первичная обработка данных в многомерном шкалировании
Основным источником информации в многомерном шкалировании являются эксперты или просто субъекты, оценивающие предлагаемые им объекты (стимулы). Получаемая от экспертов информация обобщается в квадратные или прямоугольные матрицы с названиями, соответствующими методике получения данных и их характеру. В литературе выделяют 4 основных типа матрицы исходных данных: матрица прямых оценок различий, матрица условных вероятностей, матрица совместных вероятностей и матрица различия профилей [44, 26, 47]. При планировании исследования по сбору оценок различий пар объектов необходимо построить выборки объектов (стимулов) и субъектов (испытуемых), осуществить выбор задания для оценки и планирование инструментария (вопросника) для представления этого задания испытуемым. С одной стороны, испытуемые могут обоснованно оценить только те стимулы, с которыми они хорошо знакомы. С другой стороны, процесс отбора стимулов может оказать существенное влияние на полученное решение. Например, если при исследовании профессий в выборку включены только профессии из категории «белые воротнички», то не следует ожидать появления координатной оси, соответствующей безопасности профессии. Рекомендуется, чтобы на каждую пару стимулов приходилось не менее M оценок (, где n – число стимулов, k – ожидаемое число координатных осей). Учитывая, что число пар стимулов равно , общее число оценок составляет , т.е. в 20 раз больше, чем число оцениваемых параметров равное nk. После построения выборок стимулов и испытуемых необходимо решить, какой тип задания для оценки различий следует дать испытуемым. В литературе встречаются различные виды заданий. Например, оценка величины различия, категориальная оценка, графическая оценка и категориальная сортировка [26]. Определив тип задания, экспериментатор должен продумать, как представить его испытуемым. Пары стимулов, которые необходимо оценить, следует упорядочить в логическую последовательность. Испытуемые должны получить соответствующую инструкцию. Затем экспериментатор должен решить, будет ли он использовать полный план, когда каждый испытуемый оценивает все возможные пары стимулов, или неполный, когда каждый оценивает только одно подмножество пар стимулов. Психологи предполагают, что существуют два фактора, влияющие на оценки испытуемых: порядок предъявления стимулов в паре (пространственный эффект) и упорядочение пар стимулов в списке оцениваемых пар (временной эффект). Сбалансированность как пространственных, так и временных эффектов обеспечивает упорядочение Росса. Альтернативами упорядочению Росса являются случайное упорядочение и метод чередующегося стандарта. Они не гарантирует сбалансированности ни пространственных, ни временных эффектов. Метод чередующегося стандарта прост для реализации и состоит в следующем. Задание по упорядочению пар делится на (n -1) разделов. В i -ом разделе стандартом служит стимул i. Задача испытуемого – дать в i -ом разделе оценку сходства между стандартом и каждым из последующих стимулов. Из инструкции все испытуемые должны получить одинаковое представление о наборе стимулов, которые будут оцениваться. В инструкции могут ограничиваться характеристики, которые должны учитываться при проставлении оценок. Например, испытуемых можно попросить оценивать учебные заведения в предположении, что они будут приняты в каждое из них. Такое предположение, включенное в инструкцию, позволит испытуемому игнорировать такую возможную характеристику как трудность поступления. При большом числе стимулов n, нельзя ожидать от испытуемого оценок всех пар стимулов. В таких случаях экспериментатор может использовать неполный план, в котором стимулы делятся на подмножества (возможно пересекающиеся), и каждый испытуемый оценивает пары только в одном подмножестве. Рекомендуется, чтобы каждое из подмножеств оценивалось одинаковым числом испытуемых, каждая пара стимулов встречалась в одинаковом числе подмножеств, каждый из стимулов появился по крайней мере в одной паре каждого подмножества. В качестве мер близости стимулов используются различные типы матриц условных и совместных вероятностей. В матрицах условных вероятностей в качестве меры сходства стимулов i и j служат вероятности того, что стимул j встречается при наличии стимула i. В матрицах совместных вероятностей в качестве меры сходства стимулов i и j берут вероятность того, что стимулы i и j встречаются вместе. Матрица условных вероятностей или матрица идентификаций строится на основе большого числа опытов (большого числа испытуемых). В каждом опыте экспериментатор предъявляет стимул в зрительном или слуховом виде и просит испытуемого указать название этого стимула. Затем для каждой пары (i, j) рассчитывается доля опытов, в которых стимул i принят за стимул j. Итак, строки матрицы представляют перечень объектов, предъявляемых для оценки, столбцы матрицы – перечень объектов, распознанных экспертами. На пересечении i -ой строки и j -го столбца содержится относительная частота узнавания экспертами в i -ом объекте j -го, т.е. это доля экспертов, которые объект приняли за объект , , , где n – число объектов. С помощью многомерного шкалирования на основе матрицы условных вероятностей можно определить характеристики сходства, ведущие к путанице одного стимула с другим, а, следовательно, к ошибкам в идентификации. Среди матриц условных вероятностей выделяют матрицы перехода. Они отражают трансформационные процессы, протекающие во времени или пространстве. Строки матрицы дают представление об изучаемом явлении в момент начала, столбцы – в момент окончания чего-либо, или то же самое, но при переходе к другой территориальной единице и т.п. Каждый элемент матрицы обозначает долю наблюдений, находившихся в начальный момент в состоянии i, а в конечный момент в состоянии j. Матрицы условных вероятностей являются квадратными, но могут быть несимметричными. А, как известно, несимметричные матрицы методами многомерного шкалирования не обрабатываются. Существуют простые способы преобразования их в симметричные: от переходят к мерам сходства , где, например, , , и др. [43]. Совместные вероятности разного типа также могут быть индикаторами сходства между парами объектов. Матрица совместных вероятностей является симметричной, строки и столбцы матрицы – это взаимодействующие элементы, а элементы матрицы обозначают долю взаимодействий, включающих элементы i и j. Предполагается, что если элементы i и j очень похожи, то они более склонны взаимодействовать. Один из методов получения матриц совместных вероятностей – сортировка стимулов, предложенная С. Розенбергом. Метод сортировки стимулов может применяться для шкалирования большого числа стимулов без перегрузки испытуемых. От матрицы сходства с элементами , построенной на основе матриц условных или совместных вероятностей, можно перейти к матрице различий с элементами , рассчитанными, например, следующим образом: [16]. Рассмотрим четвертый вариант исходной матрицы данных – матрица мер различия профилей. Профиль – это набор количественных значений признаков, характеризующих объект, или значения признака в разные моменты времени. Для получения профиля оценок каждого стимула исследователю необходимо знать существенные признаки стимулов и иметь возможностью измерить каждый из них. Матрица различия профилей – это матрица расстояний между объектами, рассчитанная на основе стандартизированной матрицы типа «объект-свойство». Стандартизация матрицы может осуществляться как по столбцам, так и по строкам матрицы. Метод стандартизации зависит от целей исследования.
5.5 Вопросы и задания к практическим занятиям
Вопросы и задания к практическим занятиям на тему «Метод главных компонент» 5. Постановка задачи снижения размерности признакового пространства 6. Обоснуйте необходимость и возможность решения задачи снижения размерности признакового пространства 7. Дайте определение первой, второй, s -ой главной компоненты? 8. Сформулируйте оптимизационную задачу для построения первой главной компоненты 9. Опишите метод множителей Лагранжа для решения оптимизационной задачи для построения первой главной компоненты 10. Докажите, что 11. Сформулируйте оптимизационную задачу для построения второй главной компоненты и опишите алгоритм её решения [24, с. 322-324; 16, с. 251-252] 12. Сколько всего можно построить главных компонент и каким образом осуществляется снижение размерности признакового пространства? 13. При каком условии корни характеристического уравнения (5.4) удовлетворяют условию ? 14. В каком случае существуют нулевые корни характеристического уравнения (5.4)? 15. Опишите алгоритм нахождения собственных векторов матрицы в случае, когда корень характеристического уравнения (5.4) имеет кратность порядка r 16. Когда необходимо переходить к центрировано-нормированным признакам и в чем отличие алгоритмов метода главных компонент по центрированным и центрировано-нормированным признакам? 17. Найдите основные числовые характеристики главных компонент: , 18. Чему равна при m = k. На основе полученного результата запишите, каким образом может быть представлен критерий информативности новой системы признаков. Рассмотрите случай, когда исходные признаки центрировано-нормированные 19. Найдите обобщенную дисперсию всех m = k главных компонент 20. Дайте определение матрицы нагрузок 21. Сформулируйте и докажите свойства матрицы нагрузок 22. Сформулируйте этапы решения задачи оценки главных компонент 23. Опишите алгоритм проверки гипотезы о диагональности матрицы (о незначимости матрицы ) 24. Поясните случай: – диагональная матрица 25. Опишите алгоритм построения доверительных интервалов для собственных чисел 26. Опишите алгоритм проверки гипотезы о кратности собственных чисел. Когда возникает необходимость проверки этой гипотезы? 27. Опишите алгоритм построения доверительного интервала в случае кратных собственных чисел 28. Опишите алгоритм проверки гипотезы о достаточности m главных компонент 29. Найдите матрицу индивидуальных значений главных компонент 30. Экономическое развитие региона характеризуется 3 показателями. Наибольшее и наименьшее собственное число матрицы парных коэффициентов корреляции равно соответственно 1, 6 и 0, 5. Чему равен уровень информативности (в %), обеспечиваемый 2-мя первыми главными компонентами? 31. Экономическое развитие региона характеризуется 3 показателями. Наибольшее и наименьшее собственное число матрицы парных коэффициентов корреляции равно соответственно 1, 8 и 0, 5. Сколько главных компонент достаточно взять для достижения уровня информативности 0, 55? 32. По данным выборки из трехмерной генеральной совокупности для центрировано-нормированных признаков рассчитана матрица нагрузок:
,
в которой оказались пропущенными диагональные элементы. Известно, что а11< 0, а22> 0, a33< 0. Чему равен элемент матрицы нагрузок ? Чему равна дисперсия первой главной компоненты? Чему равен относительный вклад второй главной компоненты в суммарную дисперсию признаков? Чему равен относительный вклад первых двух главных компонент в суммарную дисперсию признаков? 33. Найдены значения главных компонент для i -го объекта наблюдения , и матрица нагрузок
.
Найдите центрировано-нормированное значение первой главной компоненты для i -го объекта. 34. Найдены значения центрировано-нормированных главных компонент для i -го объекта наблюдения , и матрица нагрузок
.
Найдите центрировано-нормированное значение первого исходного признака для i -го объекта . 35. В матрице индивидуальных значений главных компонент оказалась пропущенной последняя десятая строка:
.
Найдите индивидуальное значение первой главной компоненты для десятого объекта . Чему равен коэффициент корреляции между признаками и ? 36. Матрица нагрузок имеет вид:
.
Найдите ковариационную матрицу главных компонент . Найдите корреляционную матрицу исходных признаков . Какие исходные признаки преимущественно будут участвовать в названии первой главной компоненты? Чему равен относительный вклад первой главной компоненты в дисперсию третьего признака? 37. Ковариационная матрица исходных признаков имеет вид:
.
Какой вид имеет первая главная компонента? Какой вид имеет ковариационная матрица главных компонент ? Какой вид имеет матрица нагрузок ? 38. При реализации метода главных компонент гипотеза о незначимости корреляционной матрицы была принята. Какой вид не может иметь матрица нагрузок? а) ; б) ; в) ; г) .
Вопросы и задания к практическим занятиям на тему «Факторный анализ: метод общих (главных) факторов»
1. Постановка задачи факторного анализа 2. Запишите линейную модель факторного анализа, сформулируйте и обоснуйте требования к общим и характерным факторам 3. Представьте разложение дисперсии в факторном анализе на общность и характерность 4. Что показывает общность, характерность? 5. Запишите линейную модель факторного анализа, учитывающую специфичность признака и ошибки измерения 6. Что показывает надежность? Как вычислить вклад r -ого общего фактора в суммарную дисперсию исходных признаков, вклад всех общих факторов в суммарную дисперсию исходных признаков? 7. Найдите корреляционную матрицу исходных признаков на основе линейной модели факторного анализа 8. Дайте определение редуцированной матрицы. Чем она отличается от корреляционной матрицы? 9. Сформулируйте фундаментальную теорему факторного анализа и поясните, в чем её смысл 10. Дайте определение факторного отображения 11. Что понимается под факторной структурой? 12. В чем назначение матриц факторного отображение и факторной структуры и как они связаны? 13. Опишите алгоритм построения первого главного фактора 14. Сформулируйте оптимизационную задачу для построения второго главного фактора и опишите алгоритм её решения 15. Можно ли построить главные факторы, используя алгоритм метода главных компонент к редуцированной матрице ? В чем преимущества поэтапного построения главных факторов? 16. Сформулируйте этапы решения задачи оценки главных факторов 17. Опишите алгоритм проверки гипотезы о незначимости матрицы с помощью критерия Уилкса 18. Какие существуют методы оценки общности? 19. Опишите алгоритм проверки гипотезы о достаточности выделенных главных факторов с помощью критерия Лоули 20. Как интерпретировать главные факторы? 21. Опишите алгоритм оценки матрицы индивидуальных значений главных факторов методов Бартлетта 22. Матрица весовых коэффициентов при главных факторах имеет вид: . Чему равны следующие характеристики: 1. вклад первого главного фактора в дисперсию второго центрировано-нормированного признака; 2. общность для второго центрировано-нормированного признака; 3. характерность для первого центрировано-нормированного признака; 4. суммарная общность; 5. доля суммарной общности, обеспечиваемая первым главным фактором; 6. относительный вклад первого и второго главных факторов в суммарную дисперсию исходных центрировано-нормированных признаков; 7. коэффициент корреляции между признаками вторым и третьим исходными признаками. 23. Оценка корреляционной матрицы исходных признаков имеет вид: . Вычислите оценку редуцированной матрицы методом наибольшего коэффициента корреляции по строке или столбцу, методом среднего коэффициента корреляции по строке или столбце, методом триад и методом первого центроидного фактора. 24. Матрица факторной структуры исходных центрировано-нормированных признаков и главных факторов имеет вид: . Найдите редуцированную матрицу . 25. Редуцированная матрица имеет вид: . Чему равен относительный вклад главных факторов и относительный вклад характерных факторов в суммарную дисперсию исходных центрировано-нормированных признаков?
Вопросы и задания к практическим занятиям на тему «Вращение факторного пространства»
1. Дайте определение пространства общих факторов и полного факторного пространства 2. Найдите матрицу, связывающую две матрицы факторного отображения А и В 3. Какие существуют виды конфигураций? 4. Найдите матрицу Т ортогонального вращения факторов и на угол по часовой стрелке 5. Найдите матрицу Т ортогонального вращения факторов и на угол против часовой стрелки 6. Как осуществляется ортогональное вращение пространства общих факторов в многомерном случае? 7. Как выбрать угол поворота осей? 8. Какие существуют критерии для оценки структуры обобщенных факторов? Как или пользоваться? 9. Результаты проведения факторного анализа методом главных факторов и центроидным методом представлены матрицами факторного отображения А и В соответственно: . Найдите матрицу преобразования Т, связывающую решения А и В. 10. Выберите матрицу нагрузок, в наибольшей степени соответствующую простой структуре: а) ; б) ; в) ; г) . 11. В результате проведения факторного анализа получена матрица факторного отображения . Вычислите матрицу факторного отображения после вращения факторного пространства на 45 градусов против часовой стрелки. Изобразите пространство общих факторов и пространство обобщенных факторов. Произошло ли упрощение структуры? 12. На рисунке представлены результаты проведения факторного анализа для 10 переменных. Укажите способ вращения, который приведет к простой и легко интерпретируемой структуре факторного пространства: а) поворот f1 и f2 на 45 градусов по часовой стрелке; б) поворот f1 и f2 на 45 градусов против часовой стрелки; в) поворот f1 на 45 градусов, а f2 на 30 градусов по часовой стрелке; г) поворот f1 на 45 градусов, а f2 на 30 градусов против часовой стрелки. 13. На рисунке представлены результаты проведения факторного анализа для 9 переменных. Укажите способ вращения, который приведет к простой и легко интерпретируемой структуре факторного пространства: а) поворот f1 и f2 на 45 градусов по часовой стрелке; б) поворот f1 и f2 на 45 градусов против часовой стрелки; в) поворот f1 на 45 градусов, а f2 на 30 градусов по часовой стрелке; г) поворот f1 на 45 градусов, а f2 на 30 градусов против часовой стрелки.
Вопросы и задания к практическим занятиям на тему «Многомерное шкалирование»
1. Постановка задачи многомерного шкалирования 2. Какие выделяют типы приложений многомерного шкалирования? 3. Какие предположения выдвигаются относительно матрицы различий в метрическом многомерном шкалировании? 4. Почему разложение матрицы вида не позволяет получить координаты объектов в пространстве действительных чисел? 5. Каким образом в подходе Торгерсона осуществляется преобразование матрицы различий в положительно полуопределенную матрицу? 6. Сформулируйте и докажите теорему Торгерсона 7. Каким образом можно осуществить факторизацию матрицы двойного центрирования ? 8. Каким образом в метрическом шкалировании определить количество шкал и как интерпретировать результаты шкалирования? 9. Какие подходы существуют к определению аддитивной константы c такой, чтобы стали расстояниями? 10. В чем отличие метрического и неметрического многомерного шкалирования? 11. Дайте определение алгоритма неметрического многомерного шкалирования 12. Сформулируйте постановку задачи неметрического многомерного шкалирования 13. Какие существуют количественные меры оценки качества решения, полученного неметрическим шкалированием? 14. Какие типы графиков используются для анализа качества модели в неметрическом шкалировании? 15. Из каких этапов состоит алгоритм неметрического многомерного шкалирования? 16. Какие подходы существуют для построения стартовой конфигурации? 17. Каким образом можно осуществить стандартизацию текущих расстояний и оценок координат? 18. В чем суть неметрического этапа многомерного шкалирования? 19. Какие существуют алгоритмы неметрического этапа многомерного шкалирования? 20. Опишите метрический этап многомерного шкалирования 21. Как выбрать размерность конфигурации в неметрическом шкалировании? 22. Как осуществляется интерпретация результатов неметрического шкалирования? 23. С какими вычислительными проблемами можно столкнуться при реализации алгоритма неметрического многомерного шкалирования? 24. Какие типы матриц исходных данных могут использоваться в многомерном шкалировании и в чем суть их построения? 25. Какая из предложенных матриц, может выступать в качестве матрицы различий объектов? а) б) в) г) 26. Постройте на основе гипотетической матрицы различий матрицу двойного центрирования . 27. Для некоторых элементов матрицы различий , имеющей вид , нарушено неравенство треугольника. Найдите оценку аддитивной константы и рассчитайте преобразованную матрицу различий. 28. При реализации неметрического многомерного шкалирования в результате поиска стартовой конфигурации получена таблица, в которой представлены исходные различия между объектами и стандартизированные оценки расстояний между объектами :
Укажите пары объектов, для которых нарушается условие монотонности. 29. Рассматриваются данные о предпочтениях 4 брендов. Полученная по выборке 1000 человек оценка корреляционной матрицы имеет вид:
Преобразуйте корреляционную матрицу в матрицу различий брендов. 30. В результате проведения неметрического многомерного шкалирования составлена таблица, содержащая оценки отклонений и оценки расстояний :
С помощью стресс-формулу Краскала, используя ниже приведенную таблицу, оцените степень соответствия и .
31. По имеющимся ранговым данным сравнительной парной оценки безопасности четырех автомобилей и полученной стартовой конфигурации объектов определить количество пар автомобилей, для которых нет расхождения между исходными значениями и оценками расстояний , полученными по стартовой конфигурации. Сравнительная оценка безопасности автомобилей
Стартовые координаты объектов
32. В ходе проведения неметрического этапа шкалирования составлена таблица, содержащая исходные различия объектов , расположенные в возрастающем порядке, и стартовые расстояния :
Запишите оценки отклонений , образующих монотонную последовательность.
5.6 Задание, порядок выполнения и вопросы к защите лабораторной работы на тему «Метод главных компонент»
|