Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Процедура контент-анализа
Основа процедуры контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом тексте, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними. Таким образом, главная предпосылка контент-анализа - это выяснение того, что считать и как считать; иными словами, определение единиц анализа. Выделяют две единицы анализы: смысловые и единицы счета. При этом главной смысловой единицей должна быть социальная идея, социально-значимая тема, отображенная в операциональных понятиях. Цель исследования – отыскать индикаторы, указывающие на наличие в документе темы, значимой для анализа, и раскрывающие содержание текстовой информации. Единицы эти в зависимости от целей анализа, типа информационного массива могут быть весьма разнообразными. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте. С другой стороны, единицы должны быть интересными для последующей интерпретации. Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими способами. Их идентификация в общем случае предполагает семантический анализ текста. Чаще всего подсчитывают «интересные» или «ключевые» слова или словосочетания, однако чаще исследователя интересуют не отдельные слова, а тематическое целое, стоящие за отдельными словами категории. Единицы анализа должны легко и по возможности однозначно идентифицироваться в тексте. В идеале их лучше всего свести к самым употребляемым значкам, например, запятым или точкам. Тогда их подсчет не будет представлять никаких трудностей. При всем разнообразии единиц контент-анализа наиболее популярными являются макроединицы: темы или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении». Среди единиц контент-анализа можно выделить несколько основных типов: 1. «Физические» единицы. Под ними понимаются сущности с четко очерченными физическими, геометрическими или временными границами, как, например, экземпляры книги, номера газет, экземпляры плакатов или листовок, фотографии и т.п. Подсчет их не составляют особого труда, однако необходимость в таком подсчете возникает достаточно редко и чаще всего осуществляется с целью оценки представленности какой-то тематики или оценки. 2. Структурно-семиотические единицы. Это: - лексика языка (слова и их эквиваленты, например выражение железная дорога или термин контент-анализ, т. е. то, что фиксируется в словарях); - грамматические показатели (например, отрицательные частицы). Количественный подсчет встречаемости слов в тексте - это, пожалуй, самый простой вариант контент-анализа, который, однако, зачастую способен давать небезынтересные результаты. Чаще всего, конечно, подсчитываются «интересные», или «ключевые» слова или словосочетания, например названия ценностных категорий типа свобода, стабильность, доверие, территориальная целостность; сценариев типа предательство или разочарование; достаточно однозначные обозначения тех или иных общественно значимых явлений, например коррупция, преступность или терроризм; значимые атрибуты наподобие жесткий, решительный; эмоционально окрашенная оценочная лексика типа разрушительный, неудержимый, подлый, кошмарный, человеконенавистнический; слова-пароли (тоже зачастую эмоционально окрашенные) типа патриоты, коммунофашисты, мондиалисты; слова, сильно активизированные в конкретный момент времени, вроде «Семья» или «Мабетекс» в начале осени 1999 года. Контент-анализ грамматических категорий используется достаточно редко, стимулом к которому является гипотеза о том, что употребление грамматических форм в меньшей степени, чем употребление лексики, контролируется автором текста и поэтому может послужить источником таких сведений о нем, которые он сам вовсе не собирался делать доступными своим читателям. В политической психологии существует специальная исследовательская методика, так называемый анализ когнитивной сложности, которая на основе фактически контент-аналитической процедуры позволяет делать выводы о том, насколько простым или сложным является видение политической ситуации автором текста и как оно меняется со временем. Единицами контент-анализа, лежащего в основе оценки когнитивной сложности, являются, например, относимые обычно к служебной лексике категорические квантификаторы типа «всегда», «никогда», «всякий», которым противостоят квантификаторы типа «иногда», «некоторый» и т.п.; категорические оценки истинности в противоположность осторожным «возможно» или «не исключено, что»; языковые средства дифференцированного рассмотрения ситуации наподобие «с одной стороны...», «с другой стороны» и т. д. Поскольку объектами контент-анализа могут быть не только вербальные (естественноязыковые), но и другие виды текстов (например, карикатуры, фотоснимки, рекламные клипы), постольку в числе структурно-семиотических единиц контент-анализа могут присутствовать визуальные и звуковые (чаще всего музыкальные) образы и символы, которые могут анализироваться на тех же основаниях, что и единицы естественного языка. 3. Понятийно-тематические единицы. В большинстве случаев контент-аналитик интересуется не словами как таковыми и не грамматическими категориями, а стоящими за словами значимыми для него понятиями, темами, проблемами. Исследователь, интересующийся тем, какое место в общественном сознании занимает, скажем, проблема преступности, обязан принимать во внимание не только присутствие в информационном массиве слова «преступность», но и упоминания заказных и всяких прочих убийств, бандитского беспредела, «крыши», «братков», авторитетов, власти криминала и т. д. Интересующийся отношением общественного сознания к каким-то реалиям должен принимать во внимание самый широкий спектр позитивных, негативных и некоторых более конкретных оценок, которые могут быть даны этим реалиям, причем эти оценки вовсе не обязательно должны присутствовать в виде оценочных суждений. 4. Референциальные и квазиреференциальные единицы. К референциальным, точнее, конкретно-референциальным единицам относятся обозначения реальных личностей (как современных, так и исторических деятелей), событий, городов, стран, организаций и т. д. Этот блок, особенно в части персоналий, весьма важен и диагностичен, поскольку позволяет определять личностные рейтинги, оценивать идеологические системы с точки зрения присутствующих в них референтных «знаковых» фигур, своего рода «идеологических героев». Примером интересного исследования роли референтных фигур в российском оппозиционном дискурсе 1996-1997 может послужить работа А.В. Дуки, в которой показано, что способы обозначения в тексте конкретных фигур могут различаться (В.В.Жириновский, Владимир Вольфович, Вольфыч, Жирик, сын юриста, лидер ЛДПР, самый провосточный российский политик, главный либеральный демократ, либералиссимус), однако конкретно-референтная единица здесь во всех случаях одна. Квазиреференциальные единицы в политических текстах чаще всего бывают представлены обозначениями всякого рода «сил» - коллективных актеров политической сцены, референция которых может колебаться от реальной (типа КПРФ) через обобщенную (коммунисты, либералы, Запад, исламисты) к откровенно мифологизированной (мировая закулиса). Независимо от своей референции все эти персонажи присутствуют в идеологическом пространстве, им могут приписываться действия и оценки, и отношение к ним является немаловажным политико-идеологическим фактором. Грань между квазиреференциальными и некоторыми типами понятийно-тематических единиц размыта в силу того, что некоторые политические понятия способны и даже склонны (например, та же преступность) к метафорической персонификации. 5. Пропозициональные единицы и оценки. Это примеры высказываний, в основе которых лежат пропозиции - описания конкретных ситуаций. Наряду с пропозициями для контент-анализа могут представлять большой интерес оценки. Изучение динамики оценочных суждений, высказываемых в адрес тех или иных лиц, событий, институтов, - весьма распространенный тип контент-аналитического исследования. 6. Макроструктурные единицы. Это достаточно сложные понятийные конструкции, образующие «верхние этажи» человеческих представлений о мире и, в частности, идеологических систем. Эти конструкции, как правило, носят характер сценариев и описывают стереотипные модели развития, с которыми сопряжены ожидания будущего, соображения о прошлом, эмоциональные ассоциации и т.д. Часто эти конструкции имеют литературные или фольклорные прототипы, что отражается в их названиях. Для обозначения таких конструкций чаще всего используется термин «идеологема»; в различных дисциплинах говорят также о мифологемах, кочующих образах и т.д. Среди подобного рода конструкций, присутствующих в общественном сознании современной России, имеются, например, следующие: «Заговор», «Криминальная революция», «Беспредел», «Нет, ребята, все не так», «Возвращение в цивилизацию» и др. 7. Единицы, представляющие результаты концептуальных операций. Их довольно много, однако наибольший интерес для контент-анализа представляют метафоры, примеры и аналогии, которые в общем плане уже были охарактеризованы выше. Например, в политических текстах часто встречается упоминавшаяся «военная метафора» в варианте «Политическое противостояние – это война», проявляющаяся в таких выражениях, как война с бедностью, удар по губернатору, атака со стороны оппозиции, разгромная публикация и т. д. 8. «Поэтические» единицы. Под таковыми имеются в виду допускающие количественное измерение средства художественной выразительности - каламбуров, аллитераций и т. п. Рассмотрим далее частотные и системные характеристики в контент-анализе. 1. Единицы, категории и признаки. Несмотря на то, что контент-анализ является в своей основе количественным методом, в нем почти всегда присутствует и качественная составляющая. Иными словами, контент-аналитик занимается количественным анализом качественных категорий. Но этим дело не исчерпывается. Во многих контент-аналитических проектах осуществляется не только оценка степени представленности в тексте тех или иных единиц, но и одновременная оценка этих единиц по тем или иным градуированным качественным шкалам. В частности, это могут быть предложенные Ч. Осгудом шкалы абстрактности (фактически - трудности для восприятия) того или иного содержания; расстояния до индивидуума (какие-то содержательные компоненты могут непосредственно касаться читателей, а какие-то могут представлять лишь досужий интерес). При анализе могут быть использованы и другие шкалы, кроме того, единицы контент-анализа могут объединяться в различные более широкие категории. 2. «Фронтальный» и «рейдовый» контент-анализ. Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми. Задачей фронтального контент-аналитического исследования является составление максимально более полного представления об информационном потоке - либо на моментальном срезе, либо на протяжении некоторого периода с целью оценки динамики. Это попытка получить ответ на вопрос «Что пишут?» Единицы такого анализа в принципе могут быть любыми, но чаще всего в таковом качестве выступают либо тематические единицы, либо ключевые слова, реже оценки и пропозиции и еще реже макроструктурные единицы. Такой анализ обычно носит сугубо прикладной характер и ведется в режиме мониторинга. Поскольку целью его является составление общего представления о содержании СМИ и через него - об общественном сознании, он должен в идеале стремиться к возможно более широкому охвату информационного потока. На практике, однако, полный охват чаще всего бывает невозможен, да зачастую и не нужен. Тем самым на повестку дня контент-аналитического исследования встает проблема составления репрезентативной выборки - традиционная проблема эмпирического социологического исследования, которая при неудачном решении может полностью дискредитировать его результаты. Решается она в случае контент-анализа традиционными социологическими методами. Рейдовый анализ, в противоположность фронтальному, ориентирован на решение частных и порой довольно экзотических задач, вытекающих, как правило, из каких-то скорее исследовательских, нежели прикладных интересов, и применительно к нему проблема выборки решается в связи формулировкой этих исследовательских целей и определением единиц анализа. Обоснование выборки при этом производится с учетом стандартных социологических критериев, но может допускать и их нарушение; важно лишь, чтобы факт этого нарушения осознавался и необходимость нарушения специальным образом обосновывалась. 3. Обработка, презентация и интерпретация результатов. Кодирование данных при контент-анализе обычно осуществляется с помощью достаточно простых анкет или компьютерных программ, в которых фиксируется каждое появление в анализируемом тексте искомой единицы. (Проблема подготовки кодировщиков, очень важная в практическом плане, в настоящей статье не затрагивается.) Эта элементарная схема может быть усложнена многими разными способами. Прежде всего, наборы единиц с сопоставленными им количественными оценками, как правило, сопоставляются с другими количественными оценками тех же единиц. Это могут быть, например, результаты подсчета частотности упоминания одних и тех же тем для различных выпусков одного и того же печатного издания или одной и той же регулярно выходящей в эфир новостной программы (временные ряды); результаты аналогичного подсчета для различных изданий/программ или обобщенных категорий изданий. Очевидно, что такие данные могут быть представлены с помощью разнообразных графических средств - диаграмм, графиков и т.д., обеспечивающих наглядность. Классификации зачастую бывают многомерными, и для представления это также могут использоваться различные формальные средства. На практике результаты контент-анализа чаще всего представляются рядами диаграмм, столбчатых или круговых, хотя понятно, что в распоряжении контент-аналитика имеется все разнообразие средств представления количественных данных. А также и качественных: для отображения отношений между единицами контент-анализа и результатов их категоризации используются такие стандартные средства отображения структур, как различные графы. Квантификация данных создает необходимые предпосылки для применения к ним средств математического анализа. Помимо анализа частотного распределения, к ним относится анализ различного рода корреляций между переменными, ассоциаций, анализ сопряженности, кластерный анализ. Разумеется, весь этот инструментарий должен применяться корректно. Содержательная интерпретация результатов зависит от целей анализа; она является прежде всего творческим актом, результаты которого во многом предопределены квалификацией и интуицией исследователей. В ходе контент-аналитического исследования как для анализа текста, так и для последующей обработки его результатов может использоваться вычислительная техника. После квантификации, т. е. перевода данных в числовую форму, их математическая и, в частности, статистическая обработка может осуществляться многими программными средствами, в том числе стандартными статистическими пакетами типа SPSS. При анализе текста и последующем сохранении результатов этого анализа в базах данных могут использоваться специальные программы, предназначенные для целей лингвистических исследований (программа Dialex, способная осуществлять составление частотных словарей и конкордансов, а также поиск лексических единиц с их контекстами и сохранять его результаты в базе данных. Подсистема контент-анализа входит составной частью в отечественную систему прикладного анализа текстов ВААЛ. Имеется также ряд зарубежных контент-аналитических компьютерных систем, а также систем, потенциально применимых для целей контент-анализа - в частности, система KEDS). Процедура контент-анализа следующая: 1. Определение проблемы, цели, задачи, объекта и предмета исследования. Разрабатывается программа контент-аналитического исследования, формируется репрезентативная выборка, отбираются необходимые документы. При определении надежности документа необходимо четко определить, что это за документ, с какой целью он создавался, кто его автор. 2. Выделение в текстовой информации категории анализа - смысловой Категории анализа должны выражать теоретические понятия исследования, иметь смысловые единицы в тексте, обладать возможностями однозначной регистрации признаков. Категории анализа выражаются определенными признаками со своей интенсивностью, направленностью, значимостью проблемы или идей. В качестве смысловых единиц анализа могут выступать: · понятия, выраженные в словах и отдельных терминах; · тема, выраженная в смысловых абзацах, частях текста, статьях; · имена исторических личностей, политиков, организаторов производства, наименования учреждений и т.д.; · общественные события, факты, случаи и т.д. 3. Выделение единиц анализа, которые являются результатом операционализации понятий. Единицы анализа выделяются на основе содержания гипотез исследования. Единицы анализа могу не совпадать с единицами счета. 4. Единица счета - это количественная характеристика единицы анализа, фиксирующая регулярность, с которой встречается в тексте та или иная смысловая единица (число слов, строк, абзацев, знаков, колонок, длительность звучания, метраж пленки и т.д.). 5. Процедурный подсчет употребления единиц анализа и подсчет частоты встречаемости этих единиц в выборке. Обязательный момент в такой процедуре – использование математико-статистических методов счета. Связь между категориями устанавливается методом совместной встречаемости слов различных категорий: для каждого текста выясняется, слова каких категорий в нем встречаются. После этого подсчитывается коэффициент корреляции, выражающий силу связи между категориями и знак этой связи. Обоснованность (валидность) разработанной методики можно проверить: · при помощи экспертов, · получением аналогичных данных другими методами, · повторным кодированием тех же документов по единой инструкции. Сбор информации, регистрация единиц анализа осуществляется с помощью обязательного инструментария - заранее разработанных макетов таблиц, специальных карточек или при помощи специальных кодировальных матриц. Бланк кодировки составляется в соответствии со схемой операциональных понятий, содержит единицы анализа и все элементы описания проблемной ситуации.
|