![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Назначение и классификация многомерных методов
При изучении основ применения математических методов акцент ставится на процедурах проверки статистических гипотез. В XX столетии статистическая проверка гипотез становится обязательной в науке вплоть до того, что логика статистического вывода начинает диктовать характер и форму самого исследования. При этом зачастую получается, что выявленные «статистически достоверные закономерности» с точки зрения содержательной теории или здравого смысла имеют в лучшем случае ничтожную ценность. Обилие подобных фактов вызывает справедливую критику абсолютизации теории статистического вывода в исследованиях, появляются даже крайние точки зрения, ставящие под сомнение саму возможность использования математических методов в психологии. Ведь действительно, выбор и использование статистических критериев не свободны от произвола исследователя; во многих случаях для одной и той же гипотезы можно подобрать статистический критерий, который ее отбросит, или тот критерий, который ее подтвердит. Остается уповать только на добросовестность исследователя. При абсолютизации аппарата проверки гипотез забывают о том, что роль математических методов не только, да и не столько в статистическом обосновании предположений. Более значима исходная функция математических методов в любой области знания — представление эмпирических данных в пригодном для интерпретации виде, поиск смысла в обилии исходной информации. Ведь очень часто прежде, чем сформулировать гипотезу, мы «для себя» вычисляем средние значения, сравниваем частоты и т.д., то есть пытаемся осмыслить данные. Часто эти простейшие операции и не ассоциируются с применением математических методов. А на самом деле, с них и начинается использование математических методов в их основных назначениях — поисковых и описательных. Здесь уместно ввести понятие эмпирической математической модели (ЭММ). Это описательные математические модели, применяемые для представления исходных (эмпирических) данных в доступном для интерпретации виде. Простейшие ЭММ — средние значения признака, вычисляемые для сравниваемых групп в предположении, что различия в средних значениях отражают различия между представителями групп. Или даже просто ранжирование членов группы, которое предполагает, что порядковый номер испытуемого отражает выраженность изучаемого свойства. Если у нас два признака, измеренных на группе объектов (испытуемых), то мы вычисляем коэффициент корреляции или сопряженности, исходя из предположения о согласованности индивидуальной изменчивости признаков. По сути дела, ЭММ идентичны мыслительным операциям. Но непосредственно сравнивать, различать, определять взаимосвязь и т. д. мы можем только при небольшой численности объектов или признаков. Когда объектов много, а признаков один-два, мы начинаем подсчитывать, если объектов более десятка — мы берем калькулятор. Когда много и объектов и признаков, простейшие ЭММ уже мало пригодны. И тогда возникает необходимость применения многомерных методов и компьютера. Многомерные методы, таким образом, это дальнейшее развитие ЭММ в отношении многостороннего (многомерного) описания изучаемых явлений. Как и простейшие ЭММ, многомерные ЭММ воспроизводят мыслительные операции человека, но в отношении таких данных, непосредственное осмысление которых невозможно в силу нашей природной ограниченности. Многомерные методы выполняют такие интеллектуальные функции, как структурирование эмпирической информации (факторный анализ), классификация (кластерный анализ), экстраполяция (множественный регрессионный анализ), распознавание образов (дискриминантный анализ) и т. д. Идея применения многомерных методов возникла практически одновременно с началом измерений в психологии. В конце XIX века Ф. Гальтон высказал мысль об общем факторе способностей, лежащем в основе согласованной индивидуальной изменчивости разных показателей способностей. Ч. Спирмен в начале XX века реализовал эту идею в однофакторном анализе для обоснования модели общего интеллекта. В 1930-е годы другой психолог, Л. Терстоун, предложил многофакторную математическую модель интеллекта и процедуру факторного анализа для ее верификации. На протяжении последующих двух десятков лет факторный анализ не признавался математиками, ассоциируясь лишь с психологической моделью интеллекта. В 1950-е годы, с появлением ЭВМ, расширение применения факторного анализа в психологии сопровождается совершенствованием его математического аппарата. Итог этих лет — выход факторного анализа за пределы психологии, его внедрение в различные области знания в качестве популярного общенаучного метода. Другой итог — касается самой психологии: факторный анализ используется как основной инструмент при разработке наиболее известных тестовых методик (Р. Кеттелл, Г. Айзенк, Д. Векслер, Р. Амтхауэр и т. д.). Дальнейшее развитие психодиагностики складывается в соответствии с известным каноном: величие открытия определяется степенью последующего торможения развития науки в данном направлении. В настоящее время, несмотря на возникновение новых многомерных методов, в том числе в психологии (многомерное шкалирование), развитие психодиагностики буквально блокировано факторно-аналитической традицией: мы измеряем признаки и сортируем их по факторам на основе взаимных корреляций.
С 1960-х годов, в связи с развитием компьютеризации, появляются все новые и новые методы многомерного анализа данных. Однако их широкое применение становится возможным лишь к концу 1980-х годов, с распространением персональных компьютеров. Дело в том, что любой многомерный метод требует циклической обработки данных, где на каждом этапе сам исследователь должен принимать решение о характере обработки. Поэтому раньше корректная реализация многомерного метода, например факторного анализа, требовала недель работы группы специалистов: предметника (психолога), статистика, программиста, оператора и др. Далеко не каждая исследовательская лаборатория могла себе это позволить. В настоящее время, с появлением мощных и простых в применении программных средств, сам специалист может реализовать весь процесс многомерного анализа данных, не вдаваясь в вычислительные сложности. Для этого ему достаточно знать общий смысл метода, требования к исходным данным и основные показатели для интерпретации получаемых результатов. Вот этих-то знаний, компактных по объему и далеких от вычислительных тонкостей, ему часто и не хватает. Наш опыт работы с многомерными методами начался с осознания необходимости создания удобного инструмента для их применения. Так, под нашим руководством в конце 1980-х годов была создана «Диалоговая система многомерного анализа экспериментальных данных» (ДИСМА — для ДВК, ISMEX — для PC). Работа этой программы на протяжении 10 лет в качестве основной для статистической обработки данных на факультете психологии СПбГУ выявила преобладание консервативной традиции у большинства специалистов. Понятие многомерных данных ограничивается факторным анализом, а сам анализ понимают как однократное преобразование корреляций в факторные нагрузки. Такое упрощенное понимание, помимо малоэффективного использования эмпирики, ограничивает перспективы развития как методов психодиагностики, так и методов организации исследования. Во-первых, любой многомерный анализ предполагает многократное преобразование данных, например факторный анализ — с разным числом факторов и с вариацией набора переменных. Во-вторых, факторный анализ — далеко не единственный, а часто и не оптимальный многомерный метод. В-третьих, ограниченность факторно-аналитической моделью задает слишком узкий диапазон способов организации самого эмпирического исследования: его данные должны представлять собой «множество признаков, измеренных у множества испытуемых». Список многомерных методов, рассмотренных в этом разделе книги, не претендует на полноту: здесь изложены основы наиболее часто применяемых в психологии многомерных методов. Представленные методы можно классифицировать по трем основаниям: в соответствии с интеллектуальной операцией (по способу преобразования исходной информации) — по назначению метода; по способу сопоставления данных — по сходству (различию) или пропорциональности (корреляции); по виду исходных эмпирических данных. Классификация методов по назначению: 1. Методы предсказания (экстраполяции): множественный регрессионный и дискриминантный анализ. Множественный регрессионный анализ предсказывает значения метрической «зависимой» переменной по множеству известных значений «независимых» переменных, измеренных у множества объектов (испытуемых). Дискриминантный анализ предсказывает принадлежность объектов (испытуемых) к одному из известных классов (номинативной шкале) по измеренным метрическим (дискриминантный) переменным. 2. Методы классификации: варианты кластерного анализа и дискриминантный анализ. Кластерный анализ («классификация без обучения») по измеренным характеристикам у множества объектов (испытуемых) либо по данным об их попарном сходстве (различии) разбивает это множество объектов на группы, в каждой из которых содержатся объекты, более похожие друг на друга, чем на объекты из других групп. Дискриминантный анализ («классификация с обучением», «распознавание образов») позволяет классифицировать объекты по известным классам, исходя из измеренных у них признаков, пользуясь решающими правилами, выработанными предварительно на выборке идентичных объектов, у которых были измерены те же признаки. 3. Структурные методы: факторный анализ и многомерное шкалирование. Факторный анализ направлен на выявление структуры переменных как совокупности факторов, каждый из которых — это скрытая, обобщающая причина взаимосвязи группы переменных. Многомерное шкалирование выявляет шкалы как критерии, по которым поляризуются объекты при их субъективном попарном сравнении. Классификация методов по исходным предположениям о структуре данных: 1. Методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. На корреляционной модели основаны факторный анализ, множественный регрессионный анализ, отчасти — дискриминантный анализ. 2. Методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними. На дистантной модели основаны кластерный анализ и многомерное шкалирование, частично — дискриминантный анализ. Многомерное шкалирование и дискриминантный анализ добавляют предположение о том, что исходные различия между объектами можно представить как расстояния между ними в пространстве небольшого числа шкал (функций). Классификация методов по виду исходных данных: 1. Методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Это множественный регрессионный анализ, дискриминантный анализ и факторный анализ. 2. Методы, исходными данными для которых могут быть попарные сходства (различия) между объектами: это кластерный анализ и многомерное шкалирование. Многомерное шкалирование, кроме того, может анализировать данные о попарном сходстве между совокупностью объектов, оцененном группой экспертов. При этом совместно анализируются как различия между объектами, так и индивидуальные различия между экспертами.
Представленные классификации свидетельствуют о необходимости знаний многомерных методов, их возможностей и ограничений уже на стадии общего замысла исследования. Например, ориентируясь только на факторно-аналитическую модель, исследователь ограничен в выборе процедуры диагностики: она должна состоять в измерении признаков у множества объектов. При этом исследователь ограничен и в направлении поиска: он изучает либо взаимосвязи между признаками, либо межгрупповые различия по измеряемым признакам. Общая осведомленность о других многомерных методах позволит исследователю использовать более широкий круг психодиагностических процедур, решать более широкий спектр не только научных, но и практических задач. Применение многомерных методов требует, разумеется, не только самого компьютера, но и соответствующего программного обеспечения. Широко известны и распространены универсальные статистические программы STATISTICA и SPSS, содержащие практически весь спектр статистических методов — от простейших до самых современных. Мы разделяем мнение, что программа STATISTICA обладает прекрасной графикой и гибкостью в обработке данных. Однако программа SPSS имеет свои преимущества: она не только проще в освоении и применении, но и включает в себя ряд методов, отсутствующих в STATISTICA, например, варианты многомерного шкалирования. Глава 15
|