Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Психологическая ориентация: Ф.Олпорт, Л.Л.Терстоун, Р.Ликерт 3 страница
V. Шкалы содержания поведения - насколько типичный атеист VI. Поведенческо-объектные шкалы - степень, в которой типич- Аффективные шкалы. Аффективный (или эмоционально-оценочный) компонент установки обычно выражается через степень предпочтительности или благожелательности к объекту установки. " Фермер и игрок в гольф могут в одинаковой мере ожидать дождя в определенный день, но это общее мнение может вызывать у них противоположные чувства" [237. Р.72]. Т.е. игрок в гольф может иметь неблагожелательную установку по отношению к дождю, а фермер - благожелательную. Базисным наблюдением для конструирования аффективной шкалы является проявление субъектом по отношению к объекту установки ориентации " за - против". Эмпирическими событиями, которым приписываются числа, могут выступать субъекты либо объекты установки. Соответственно результатом будут аффективно-субъектные либо аффективно-объектные шкалы. Так как аффект логически может быть определен как унитарное понятие, для аффективных переменных нельзя построить шкалу содержания установок, т.е. для одномерной шкалы аффективной установочной переменной принимается предположение, что один человек испытывает одну, и только одну степень аффекта по отношению к объекту установки (хотя он при этом может приписывать единичному объекту любое количество черт или принимать любое количество способов действий по отношению к одному объекту). На первый взгляд, логика этого рассуждения может быть подвергнута критике с точки зрения понятия " амбивалентного аффекта" (" двойственного отношения" в обыденном языке). Однако для того, чтобы определить амбивалентную эмоциональную оценку как переменную, необходимо либо принять, что один респондент имеет несколько " точек расположения" на шкале, либо трактовать объект установки как имеющий несколько стимульных значений. В принципе эта задача при некоторых условиях разрешима для многомерного шкалирования. Однако наш анализ общих моделей для измерения установочных переменных связан с более ранней традицией измерения установок в социологии. Поэтому здесь речь будет идти об измерении унивалентного аффекта. Таким образом, вслед за Г.Ап-шоу, мы будем говорить лишь о двух классах аффективных шкал, примеры которых приведены ниже: VII. Аффективно-субъектные шкалы - степень, в которой VIII. Аффективно-объектные шкалы - насколько типичному бе- Теперь мы можем перейти к рассмотрению общих моделей, используемых при измерении установочных переменных, и анализу сложившихся преимущественно в 30-е - 40-е годы подходов к измерению установок (описанных в предыдущем параграфе) с точки зрения этих общих моделей. Для каждой из общих моделей будет рассмотрена природа ее базисных данных, правила приписывания численных значений эмпирическим событиям и требования функционального единства, а также возможность использования модели для только что описанных восьми классов шкал установок. Как уже отмечалось, эмпирический " субстрат" для конструирования различных шкал установок практически одинаков. Респондент сообщает исследователю, что он думает, чувствует относительно какого-то объекта или как он собирается поступать по отношению к нему. Различие заключается в том, что исследователь определяет как базисное эмпирическое событие, которое должно быть отражено в числовой системе с отношениями. При этом особую сложность представляют субъектные шкалы, так как задача здесь заключается в том, чтобы получаемая шкала могла служить надежным основанием для межиндивидуальных сравнений, быть нечувствительной к таким источникам вариации, как индивидуальные речевые привычки или стандарты оценивания. Именно для построения аффективно-субъектных шкал и были предназначены модели Гутмана, Терстоуна и Ликерта[15]. Существенным для дальнейшего изложения является еще одно различение - между прямым и косвенным (непрямым) шкалированием, введенное Г.Экманом, Л.Сьобергом и Т.Кюннапасом [60 ]. Различие между названными двумя подходами, в сущности, заключается в принятии или отвержении предположения о способности респондента или испытуемого давать прямые численные оценки на более высоком, чем номинальный, уровне измерения. При использовании моделей прямого шкалирования в измерении установок задача респондента состоит в том, чтобы численно оценить, какая из множества альтернатив наилучшим образом отражает его установку. Прямое конструирование номинальной шкалы обычно рассматривается как безусловно обоснованная процедура. Другие же модели прямого шкалирования в измерении установок нередко вызывали споры о наличии у респондентов способностей к кванти-фикации. Прямое ординальное шкалирование Этой модели соответствует ситуация, когда задачей респондента является ранговое упорядочение совокупности стимулов по некоторому свойству. Формальной моделью этой ситуации является коэффициент конкордации М.Кендэлла. Коэффициент Кендэлла позволяет оценить согласованность рангов. Он равен 1 при полном согласии респондентов и 0 при полном несогласии [10. С.116-123]. Примером реконструирования шкалы при конкордантной модели может служить ранжирование 10 респондентами 8 способов действия по применимости к конкретной ситуации. Результатом будет шкала " содержания поведения" (behavioral-content). Предполагаемая этой моделью шкальная гипотеза - консистентность суждений 10 респондентов. В случае ее неотвержения полученное ранжирование может
быть обобщено для всей популяции, выборкой из которой являются 10 респондентов. Коэффициент конкордантности является здесь средством оценки степени согласованности ранжировок. Если каждый респондент давал бы идентичные данные, то общее ранжирование могло бы быть обобщено до универсума наблюдений. Если согласованность ранговых данных, по гипотезе представляющих случайные репликации, неабсолютна, то исследователь должен предположить либо наличие ошибок респондентов (неправильно понятая инструкция, намеренное искажение, утомление и т.д.), либо неучет других важных аспектов, либо ошибочность своей теоретической концепции, т.е. отсутствие в универсуме наблюдений единичной одномерной ординальной шкалы данной переменной. Трудно установить единый критерий для выбора интерпретации неполной конкордантности. В любом случае здесь должна учитываться численная величина полученного коэффициента. Низкие значения скорее свидетельствуют об ошибочности шкальной гипотезы, чем о влиянии ошибок респондентов. Умеренные - о неадекватной " разметке" релевантных признаков универсума наблюдений [237. Р. 75]. Если исследователь склонен принять предположение о наличии " ошибок ответа", то он либо исключит ошибающихся респондентов (если сможет их идентифицировать), либо воспользуется усредненными оценками для получения ранга каждого стимула и обобщит полученное ранжирование на универсум наблюдений. Прямое интервальное шкалирование: категориальные шкалы Эта процедура является очень типичной для измерения установок и позволяет получить категориальную шкалу. Процедурой шкалирования в этом случае является метод равнокажущихся интервалов. Оценочные суждения осуществляются как приписывание чисел объектам через отнесение к категориям, границы которых равнораспо-ложены по отношению к количеству определенного свойства (переменной). Модель поведения респондента, предполагаемая этой процедурой, заключается в следующем: респондент принимает решение, что стимул имеет больше данного свойства, чем нижняя граница категории, и меньше, чем верхняя граница. В модели прямого шкалирования категориальную шкалу должен сконструировать сам респондент. Начало шкалы соотносится со стимулом (возможно, гипотетическим), который должен быть отнесен к категории 0. Единица шкалы обозначает то количество шкалируемого свойства, которое определяет ширину категории ответа. Еще одним предположением модели прямого шкалирования является инвариантность параметров шкалы при повторении (для новой выборки респондентов или тех же респондентов): численные значения для каждого стимула могут быть усреднены. Чтобы совокупность чисел могла рассматриваться как численные значения свойства на интервальной шкале, они должны быть инва- риантны в пределах линейного преобразования формы у = а + bх, где коэффициент Ъ отражает различие в единицах шкалы, а коэффициент а - различие в начале отсчета. Если результаты репликаций удовлетворяют этому требованию, то усредненные числовые значения стимулов образуют новую шкалу, начальная точка и единица которой являются усреднением значений этих параметров по всем индивидуальным репликациям (при простом усреднении компоненты-репликации будут взвешиваться в прямом соответствии с их дисперсиями: больший " вес" получат те репликации, в которых границы категорий уже и, соответственно, единицы измерения меньше, а дисперсии шкальных значений стимулов - больше). Содержательная интерпретация единицы и начальной точки шкалы потребовала бы введения предположения об их инвариантности при воспроизведениях и введения более сильных ограничений, чем соответствующие интервальному уровню измерения. Рассматривая повторные процедуры вынесения суждений как измерительный инструмент [237. Р.65], т.е. средство, с помощью которого множество стимулов отображается на числовую систем' степень согласованности между различными операциями, составля- ющими в совокупности этот инструмент, можно определить как функциональное единство инструмента. В модели прямого интер- вального шкалирования требование функционального единства предполагает линейные отношения между всеми парами предполагаемых повторений. При выполнении этого требования несистематический разброс в численных значениях, который не относится к линейному отношению, может рассматриваться как устанавливающий перцептивную ошибку респондента либо по отношению к положению отдельного стимула, либо по отношению к численным значениям границ категорий. При предположении, что такие несистематические ошибки будут взаимоуничтожаться при усреднении, оценкой истинного значения будет усреднение численных оценок респондентов по каждому стимулу. Однако наличие линейной связи между парами репликаций, необходимое для выполнения требования функционального единства, недостаточно для доказательства того, что полученная шкала обладает инвариантностью интервального типа шкал. Оно лишь доказывает сходство категориальных суждений респондентов. Интервальный же уровень измерения требует еще и постоянства единицы шкал. Так как последняя проблема возникает и при использовании закона категориального суждения, мы обратимся к ее детальному анализу ниже. Допущение о равенстве различительных дисперсий, делающее возможным их использование в качестве единиц измерения на психофизической шкале, явилось предметом концептуальной критики со стороны С.Стивенса, предложившего альтернативную парадигму прямого шкалирования отношений в психофизике [48 ]. Работы С.Стивенса и его последователей показали, что для прототетических психологических континуумов прямое шкалирование отношений является обоснованной и дающей согласованные результаты процедурой (что было подтверждено экспериментами с кросс-модальной валидацией и сменой стимульного контекста). В основании прямого шкалирования лежит модель прямой оценки субъектом величины стимула. Хотя кросс-модальная валидация неприменима к не имеющим физической измеримости стимулам, Стивенсу удалось получить некоторые непрямые доказательства существования степенного закона для ряда социальных переменных, измеряющих аффективный компонент установки (см.: [48]). Однако методы прямого конструирования шкал отношений, резко изменившие облик психофизики в 40-е - 50-е годы, не оказали заметного воздействия на складывавшиеся в социологии подходы к измерению установок. В 60-е годы появились немногочисленные, но крайне интересные работы в этой области, обзор которых можно найти в [140]. Косвенное интервальное шкалирование и шкалы, основанные на законе категориального суждения Общая форма закона категориального суждения была описана У.Торгерсоном [235 ]. Исходным для развития процедур шкалирования, основанных на этом законе, был метод последовательных интервалов, предложенный в 1937 г. М.Сэффиром [207]. Различные процедуры для получения шкальных оценок и границ категорий описаны М.Сэффиром, А.Эдвардсом и другими[16]. При конструировании шкал, основанных на законе категориального суждения, перед респондентом ставится задача отнесения объекта в наиболее подходящую категорию на континууме предпочита-емости. В отличие от модели прямого шкалирования, предположение о способности респондента устанавливать равноотстоящие категории здесь не вводится, но шкальный порядок категорий должен быть известен и явно задан наименованиями категорий. Границы между категориями ответа рассматриваются как стандартные стимулы: как и в законе сравнительного суждения, величина процесса различения, вызываемого каждым стимулом и каждой границей категории, предполагается нормально распределенной. Выводя закон категориального суждения, Торгерсон фактически предполагает, что процедура вынесения категориального суждения здесь основана на неявном парном сравнении " стимул - граница категории". Закон категориального суждения может быть представлен следующим образом: (1.1) где Si - среднее гипотетического распределения перцептивного процесса для стимула i; Сj - среднее гипотетического распределения перцептивного процесса для j-ойкатегориальной границы; Pij - нормированное отклонение, соответствующее наблюдаемой доле суждений " i > j”; σ i и σ j - различительные дисперсии стимула i и границы категории j; rij - коэффициент корреляции между границей категории j и стимулом i. Очевидно, что закон категориального суждения аналогичен закону сравнительного суждения, однако второй из сравниваемых стимулов здесь заменен на границу категории. Поэтому для решения основного уравнения вводится аналогичная совокупность допущений. Среди обсуждаемых Торгерсоном допущений, нужных для нахождения решений, содержатся следующие три: 1. Различительные дисперсии всех стимулов равны. 2. Различительные дисперсии всех категориальных границ равны. 3. Все коэффициенты корреляции между стимулами и границами При принятии этих допущений, закон категориального суждения может быть приведен к: (1.2) Особая совокупность допущений используется при применении предложенного М.Сэффиром метода последовательных интервалов: различительные дисперсии всех границ категорий принимаются равными, а корреляция между положением на шкале любого стимула и любой границей категории равна нулю [237. Р.87 ]. Тогда уравнение принимает вид: (1.3) Третья из анализируемых Торгерсоном возможностей решения аналогична второй: различительные дисперсии всех стимулов равны, а корреляции между стимулами и границами категорий равны нулю (процедура подробно описана в [21. Р.257-261 ]). Тогда закон категориального суждения принимает вид: (1.4) При анализе данных согласно закону категориального суждения строится матрица Р, элемент которой рij - частота помещения стимула i ниже границы категории j. Так, стимул, помещенный в категорию 2, содержит меньшее количество предполагаемого качества, чем граница между категориями 2 и 3, граница между категориями 3 и 4 и так далее. Матрица P получается при представлении всех р.. в единицах единичного нормального отклонения (табл. 1.2). Таблица 1.2а. Матрица Р. Накопленные частоты суждений " стимул / меньше границы категории f
Таблица 1.26. Матрица P. Единичные нормальные отклонения, соответствующие Р..
Каждая z ij предполагается выраженной в единицах, зависящих от используемой формы закона категориального суждения. Для уравнения (1.2) различные единицы предполагаются равными, а для уравнений (1.3) и (1.4) равными предполагаются единицы для каждого ряда и каждого столбца соответственно. Описание вычислительных процедур для получения шкальных оценок стимулов и границ категорий дано Торгерсоном [235], Эдвард-сом [125] и др. Эдварде и Терстоун предложили вычислять разницу между подсчитанными из параметров модели долями рц и наблюдаемыми долями [21. С.258]. Эта процедура может рассматриваться как критерий функционального единства шкалы. Гилфорд предложил использовать хи-квадрат Мостеллера для оценки статистической значимости величины расхождений [237. Р.89]. Однако Торгерсон отметил, что для любого из стимулов доля случаев, когда он будет оцениваться как больший, чем какая-то из границ категории, не будет независимой от доли случаев, когда он будет оценен как больший, чем любая другая граница категории. Появляющаяся в результате зависимость противоречит предположениям, лежащим в основе теста хи-квадрат. Отрицательный результат проверки внутренней согласованности свидетельствует о необоснованности по крайней мере одного из сделанных допущений. В этом случае можно либо попытаться использовать новую совокупность предположений, либо отвергнуть гипотезу об одномерности и обратиться к процедурам многомерного шкалирования. Существуют некоторые эмпирические доказательства инвариантности шкальных значений, полученных на одной выборке. П.Джо-унс [153 ] предлагал двум выборкам респондентов (из одной совокупности) оценивать один и тот же набор стимулов по 6- и 9-балльной шкале соответственно. Полученные шкалы, относившиеся к классу " аффективно-объектных", оказались линейно связаны. Более того, различительная дисперсия стимулов, оцененная для двух групп, оказалась одинаковой. Кроме того, были найдены доказательства инвариантности измеренной широты категорий. Основным критическим аргументом, относящимся к категориальным шкалам и методам, основанным на законе категориального суждения, является указание на влияние специфических черт " судейской группы" на выносимые суждения. В исследованиях Э.Хинкли, П.Ферпосона и других (см.: [21. С.262-264]) доказывалось отсутствие влияния установок судей на результирующую шкалу. Однако и эти исследования были подвергнуты критике за специфическую процедуру исключения " легкомысленных" судей. В любом случае, оценивая шкалы, основанные на атрибутировании стимула к категории, нельзя забывать об известных из психосемантики и психофизики закономерностях, в частности о зависимости " экстремальности" оценок от субъективной значимости стимулов. Этих недостатков в значительной мере лишен метод парных сравнений, однако он труднее в применении. В целом накопленные доказательства свидетельствуют о том, что прямое интервальное шкалирование и, соответственно, метод равнокажущихся интервалов не дают интервальной шкалы, позволяя говорить лишь об ординальном уровне, тогда как методы, основанные на законе категориального суждения, имеют некоторые преимущества. Это, во-первых, возможность проверки шкальных гипотез, т.е. принимаемой совокупности допущений, и, во-вторых, линейная связь шкальных значений, полученных по этой модели, со значениями, полученными в соответствии с законом сравнительного суждения. Таким образом, модели, основанные на законе категориального суждения, могут обеспечивать интервальный уровень измерения[17]. Описанные нами прямые и косвенные процедуры построения шкал непосредственно предназначены для измерения объектов и содержания установок. Однако основной интерес для нас представляют шкалы, измеряющие различия между субъектами установок, т.е. - между людьми, придерживающимися определенных мнений, имеющих определенные " готовности к действию" и аффективные ориентации. Именно к этому типу шкал установок относятся шкалы Терстоуна, Ликерта, Гутмана, история возникновения которых опи-
сана в первом разделе данной главы. Поэтому мы вкратце рассмотрим особенности этих шкал с точки зрения лежащих в их основе моделей измерения установок. С данной точки зрения, шкала Терстоуна представляет собой двухшаговую процедуру построения аффективно-субъектной шкалы. В принципе она может применяться и для построения когнитивно-субъектной и поведенческо-субъектной шкал. Первый шаг этой процедуры соответствует модели прямого интервального шкалирования (см. выше) - каждое суждение получает значение на " аффективном" континууме в зависимости от эмоционального отношения к объекту установки. На втором шаге суждения шкалы предъявляются выборке респондентов, чье аффективное отношение к объекту установки должно быть измерено. Респондент соглашается либо не соглашается с отдельными суждениями. Окончательный балл респондента - это усредненное значение (средняя или медиана) баллов всех одобренных им суждений. В результате респонденты оказываются размещенными на той же шкале " за - против", что и предъявлявшиеся им суждения. Т.е. субъектам " присваиваются значения так, как если бы они были объектами в когнитивно-объектной шкале" [237. Р.91 ]. При конструировании терстоуновской шкалы установок важно соблюсти ряд требований, которые были сформулированы преимущественно самим Терстоуном [233]. В исходном наборе суждений должны быть представлены суждения, соответствующие всем градациям предполагаемого аффективного отношения, а аффективная " нагрузка" суждений должна быть достаточно очевидной. Терстоун также считал существенным, чтобы суждения выражали эмоциональное переживание, а не некоторый факт, отношение к которому может определяться чем-то, помимо установок респондента (" В США преобладают представители христианских конфессий"). Для окончательного отбора суждений в шкалу Терстоун использовал следующие критерии: 1) совокупность суждений должна " покрывать" весь предполагаемый континуум аффективного отношения, будучи достаточно равномерно распределена по нему; 2) отобранные суждения не должны быть двусмысленными и неясными, т.е. разброс суждений судей должен быть невелик (в качестве объективного критерия использовался межквартильный размах оценок, который для суждений в оригинальной шкале установок по отношению к церкви в среднем был равен 1, 75; 3) должны быть исключены все иррелевантные суждения. При этом объективный критерий ирреле-вантности включал в себя процедуру определения индекса сходства для всех пар суждений, основанного на наблюденной совместной вероятности одобрения пары суждений. Релевантными считались те суждения, которые имеют высокий индекс сходства для близких по шкальному значению суждений, и низкий - для " далеких". Ирреле-вантными оказывались суждения, имевшие противоположный паттерн отношений. На рис.1 схематически показаны паттерны разброса индексов сходства для вымышленных релевантного и иррелевантного суждений (конкретные примеры приведены в книге Л.Л.Терстоуна
Рис. 1. Разброс индексов сходства для релевантных и иррелевантных суждений шкалы Терстоуна. и Э.Чейва [233. Р.45-55]). Очевидно, что для применения критерия иррелевантности нужна еще одна выборка, т.е. группа респондентов, не участвовавших в " судейской" процедуре. Критерий иррелевантности сравнительно редко применялся при конструировании шкал такого типа. Не вполне ясно, насколько этот критерий, явно нацеленный на исключение суждений, " загрязненных" другими коннотациями, помимо собственно аффективной оценки объекта, важен для измерения установок. Однако заслуживает внимания аргумент Г.Апшоу: систематическое исключение суждений по такому критерию иррелевантности может ввести систематическое выборочное смещение в отбор из гипотетического универсума недвусмысленно эмоционально-положительных (" за") и эмоционально-отрицательных (" против") суждений [237. Р.93]. Как уже говорилось выше, терстоуновская модель категориальной шкалы не дает интервального уровня измерения. Вероятно, Терстоун в 30-е годы был очень близок к формулировке закона категориального суждения и соответствующей модели шкалирования, однако описанные нами ранее (см. раздел 3 данной главы) обстоятельства привели к отказу от дальнейшей работы в этом направлении. Что же касается требования функционального единства, то в данном случае оно подразумевает линейную связь категориальных суждений любой пары судей. Многочисленные исследования, связанные с возможностью переноса шкальных значений, полученных на " судейской" выборке, на более широкие совокупности, подтвердили, что это требование удовлетворяется [21. С.262-264; 237. Р.94]. Как уже говорилось выше, данная процедура построения шкалы может применяться и для создания когнитивно-субъектных и пове-денческо-субъектных шкал установок. Полученные шкалы будут отражать соответственно степень готовности приписывать характеристики объекту установки или склонность предпринимать определенные действия по отношению к нему. Предложенный Р.Ликертом метод суммарных рангов, позволяющий получать аффективно-субъектные шкалы, как уже отмечалось, в отличие от терстоуновской процедуры не требует проведения отдельной экспертной процедуры, хотя также предполагает составление исходного " банка" суждений, касающихся объекта установки. Так как первоначальный вариант метода описан нами ранее, остановимся лишь на общих чертах его применения. Исключение " несогласованных" суждений осуществляется по результатам применения исходного полного списка в группе респондентов, которая используется здесь как некий аналог " выборки стандартизации". Для отбора применяются критерии, типичные для психометрического " анализа пунктов", - корреляция с суммарным баллом и выявление вопросов, статистически значимо различающих респондентов " высокой" и " низкой" групп (отобранных по суммарному баллу). При измерении аффективного компонента установки респонденты обычно получают инструкцию выбрать для каждого суждения одну из пяти категорий ответа: от " совершенно согласен" до " совершенно не согласен". Веса категорий отражают интенсивность согласия с суждением, выражающим благоприятную установку, или несогласия с суждением, отражающим неблагоприятную установку. Т.е. вес " 5" может быть приписан категории, выражающей максимальное согласие с " за" -суждением, а вес " О" - категории, выражающей максимальное несогласие с этим суждением. В результате каждый респондент получит балл, соответствующий сумме численных значений своих ответов.
|