Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Модуль 1. Методология статистического анализа в психологии
Цель модуля– сформировать у студентов представления о методологии математического анализа эмпирических данных в педагогике и психологии, выработать навыки выбора стратегии и тактики организации математического анализас возможностью использования этих навыков в формировании научных гипотез в исследовательской работе выработать навыки решения конкретных задач, связанных с необходимостью обобщения результатов эмпирического исследования. Компетенции: 1. Прогностическая – построение модели эмпирических исследований. 2. Информационная - повышение информационной оснащенности при изучении других дисциплин, входящих в блок общепрофессиональной подготовки (психодиагностика, экспериментальная психология) Краткое содержание лекционных занятий. Математическая психология в самом общем виде сегодня решает две основные задачи. Во-первых, с помощью математики разрабатывают различные модели психических процессов, деятельности, взаимодействия и т.д.. Во-вторых, и эта задача является основной, в силу специфики психологии как науки, не имеющей законов и закономерностей, математика в психологии устанавливает определенные закономерности на уровне статистического анализа, которые позволяют, хотя и с определенной долей ошибки, прогнозировать полученные результаты в будущее. Мы остановимся на решении второй задачи, так как первая задача связана с более углубленным математическим анализом, требующей специальной подготовки, которая входит в компетентностные характеристики магистрантов психологии. Выбор стратегии статистического анализа эмпирических данных, заключающийся в подборе адекватных статистических операций и, в конечном итоге, получении качественных выводов на основе количественных показателей определяется двумя основными моментами. Первый и самый важный момент при подборе статистического аппарата оценивания эмпирических данных в психологии – это характер тех задач, которые решает студент, проводя эти эмпирические исследования. В психологии принято выделять семь основных, обобщенных типа исследовательских задач, вокруг которых, и вращаются все частные задачи, решаемые студентами при помощи эмпирических данных. Первый тип. Студент может задаться следующей задачей – установить присутствует ли у испытуемых то или иное свойство, качество и т.д. и, если они присутствует, то какова их мера выраженности? На первом этапе решения этой задачи необходимо подобрать адекватный диагностический инструментарий, который должен отвечать всем требованиям к психодиагностическим процедурам. Но установление наличия или количественного выражения исследуемых свойств, качеств, параметров не дает достаточно полной информации, если мы не сравним с их проявлением у другой качественной выборки (выборка – это вся система событий как исходов психодиагностических или экспериментальных исследований, это ряд случайных значений измеренного признака x1; х2; х3…..хn). Различия по качественному признаку между выборками могут определяться полом, возрастом, уровнем проявления измеряемого параметра (высокий, средний и низкий), «правши» и «левши» и многими другими признаками. Если студент имеет дело с двумя качественно разнородными выборками, то эти выборки в статистике называют независимыми. Важно помнить, студенты к сожалению часто этого не понимают, что полученные выводы в результате сравнения эмпирических данных на двух независимых выборках могут иметь отношение только к тем выборкам, с которой работал исследователь, а на другой выборке, отвечающей данным качественным требованиям, результаты могут быть абсолютно другими. Чтобы снять этот вопрос, на помощь студенту и приходит статистика, которая и дает ответ на вопрос: «Обнаруженные тенденции в результате статистического анализа имеют отношение только к тем испытуемым с которыми он работал (выборка), или они имеют характер «всеобщности» для всех испытуемых, которые отвечают тем качественным требованиям, которые характерны для участников эксперимента (генеральная совокупность, как вся мыслимая совокупность индивидуумов или явлений, отвечающая определенным качественным требованиям, характерным для выборки)?» Например, в результате исследований было установлено, что уровень тревожности у группы юношей выше, чем у группы девушек. Возникает вопрос: «Это характерно для данного возраста в целом, или это специфическая особенность испытуемых, принимавших участие в исследовании?». На языке статистики, мы должны определить, обнаруженные тенденции статистически достоверны или нет, и далее ответить на вопрос: «можно ли распространить обнаруженную тенденцию на данном объеме выборки на всю генеральную совокупность?» Решение такой задачи с применением статистического аппарата сводится к определению значимости различий на уровне исследуемого признака. Второй тип. Этот тип связан с ситуацией, которую мы условно назвали бы «исследовательско-коррекционной». Одной из специфических особенностей педагогического вуза выступает то, что очень часто при написании дипломной работы используются либо формирующий эксперимент, либо психокоррекционные программы направленные на изменение либо какого то отдельного свойства, либо комплекса свойств. Вследствие этого, студенту необходимо на уровне эмпирических данных доказать, что выбранная программа несет позитивные изменения, или, в лучшем случае, «не навредит» в педагогической практике. Тогда студент должен в результате двух замеров (до эксперимента и по его окончании) на одной выборке испытуемых (в статистике выборки называют зависимыми) экспериментально доказать, что данная коррекционная программа несет необходимые позитивные изменения. Например, студента может интересовать, влияет ли содержание мультфильмов на проявление страхов у дошкольников. Для решения этой задачи студент выбирает контрольную группу и показывает в течение некоторого времени мультфильмы определенного содержания. При этом, он делает два замера (до эксперимента и по его окончании), или несколько (до эксперимента, в середине и по его окончании). Если изменения произошли, тогда возникает вопрос, есть ли статистические основания распространять обнаруженные тенденции на всю генеральную совокупность, отвечающей качественным показателям данной выборки. Решение данного типа задачи сводится к определению статистической достоверности сдвига на уровне исследуемого признака. Третий тип. Студента может интересовать вопрос: «Если мы имеем определенные показатели по свойству или качеству А и определенные показатели по свойству или качеству В, то существует ли какая-либо взаимосвязь между А и В?». Мы специально обращаем внимание студентов на слово «взаимосвязь» потому, что связь может быть причинно-следственной, а причина и следствие растянуты во времени (причина не может идти после следствия и наоборот) и возможность определения причинно-следственных задач с помощью статистического анализа будет рассмотрена, когда мы будем характеризовать четвертый тип задач. Взаимосвязь же означает, что изменение одного свойства или качества связано с изменением другого свойства или качества (взаимосвязан ли уровень тревожности с вербальной агрессией, взаимосвязана ли мера доверия ученику с системой его ценностей, взаимосвязан ли социометрический статус с самооценкой испытуемого и т.п.) Данную задачу в статистике решают через определение коэффициента корреляции. Определим те ситуации в которых при статистическом анализе может быть использован коэффициент корреляции. Таких ситуаций четыре: 1) Когда необходимо определить взаимосвязь двух признаков, измеренных на одной и той же группе испытуемых. 2) Когда необходимо определить взаимосвязь индивидуальной и групповой иерархии признаков. 3) Когда необходимо определить взаимосвязь двух групповых иерархий признаков. 4) Когда необходимо определить взаимосвязь двух индивидуальных иерархий признака, выявленных у двух испытуемых по одному и тому же набору признаков. Четвертый тип. Студента может интересовать вопрос: «Может ли проявление или мера свойства или качества А выступать причиной проявления или меры свойства или качества В?». Как мы уже отмечали выше, специфической особенностью причинно-следственных связей выступают два основных момента. Первое, причина всегда предшествует следствию. Второе, если А является причиной В, то необязательно, что В будет причиной А. Конечно наиболее точному установлению причинно-следственных связей в психологии способствует эксперимент, когда мы изменяя независимую переменную, регистрируем изменение зависимой переменной. Но, в решении этой задачи, определенную помощь может оказать и математическая статистика – факторный анализ, или использование некоторых непараметрических статистических критериев. Пятый тип. Этот тип, как показывает практика, встречается достаточно редко в исследовательской практике студентов, но, тем не менее, мы считаем необходимым его привести. Задача такого типа состоит в сравнении полученного эмпирического распределения признака с теоретическим (предполагаемом), как правило, нормальным или равномерным. Например, школьникам было предложено оценить всех учителей работающих в классе по критерию – «обладает педагогическим мастерством – не обладает педагогическим мастерством». Каждый учитель получил определенное число выборов по критерию – «обладает педагогическим мастерством», кто-то больше, кто-то меньше, частота (количество) выбора учениками каждого из педагогов и составит эмпирическое распределение. И, если количество выборов одного из педагогов, или нескольких педагогов выше, чем у основной массы учителей, тогда с помощью статистического анализа можно ответить на вопрос о том, что уровень педагогического мастерства данного педагога статистически достоверно преобладает по сравнению с остальными. В результате определенных статистических операций, мы снижаем элемент случайности в определении уровня педагогического мастерства. Когда студент определился с типом задачи, стоящей перед ним, вторым важным моментом при выборе статистического аппарата оценивания эмпирических данных является учет основных шкал измерения, которые были использованы в сборе эмпирических данных. Шестой тип. Этот тип задач связан с выявлением латентных переменных в некой совокупности психологических признаков. Для решения таких задач используется факторный анализ. В частности, известный во всем мире 16-ти факторный тест-опросник Кеттела был разработан именно с помощью факторного анализа методом вращения корреляционных матриц. В психологии измерения проводятся, как правило, по трем типам шкал: номинативной, порядковой и интервальной. При планировании статистического анализа студентам важно помнить, что чем дальше он «уходит» от номинативной шкалы к шкале интервальной, тем перед ним шире открываются возможности статистического анализа и наоборот, чем дальше «уходит» студент от шкалы интервалов к номинативной шкале, тем больше он сокращает «широту маневра» для статистической обработки экспериментальных данных. Мы обращаем на это особое внимание потому, что как показывает практика, студентов при первичном анализе экспериментальных данных «непреодолимо» влечет перейти к шкале наименований («высокий», «средний «, низкий», «успешный», «неуспешный» и т.п.), несмотря на то, что начальные эмпирические данные были получены по интервальной шкале. Приведем описание вышеназванных шкал, приведем примеры этих типов шкал, и приведем возможные основные статистические операции с данными, полученными по этим трем шкалам. Номинативная шкала получается путем присвоения «имен» объектам, это шкала классифицирующая по названию («высокий», «средний», «низкий», «первый уровень», «второй уровень» «социально-благополучная семья», «социально-неблагополучная семья» и т.д.), но не классифицирующая объекты по признаку «больше – меньше», «больше на – меньше на». Иными словами, объекты сравниваются друг с другом и определяется их эквивалентность – неэквивалентность. Объекты, принадлежащие одному классу, эквивалентны друг другу и отличны от объектов, относящихся к другим классам. Эквивалентным объектам присваиваются одинаковые имена. Единица измерения по номинативной шкале – количество испытуемых имеющих или не имеющих исследуемое качество (частота встречаемости признака у испытуемых) При описании номинативной шкалы мы обращаем особое внимание на разновидность такого типа шкал – дихотомическую шкалу. В основу классификации по такому типу шкал положен принцип – «есть признак – нет признака». Внимание мы обращаем потому, что с этой шкалой исследователь имеет дело, как правило, при работе с проективными методиками (присутствует или не присутствует у испытуемого тот или иной признак), а, как показывает практика, 70% исследовательских работ студентов связаны с использованием именно проективных методик. Порядковая шкала классифицирует объекты по принципу «больше – меньше» относительно выраженности исследуемого признака, но не отвечает на вопрос «на сколько больше – на сколько меньше?». На шкале порядка объект может находиться «между» двумя другими, причем если a «больше» b, b «больше» c, то a «больше c (правило транзитивности отношений). Классы эквивалентности, выделенные при помощи шкалы наименований, могут быть упорядочены по некоторому основанию. Различают шкалу строгого порядка (полное отсутствие связанных рангов) и шкалу слабого порядка (наличие связанных рангов). Достаточно часто исследователь имеет дело с данным типом шкалы в социальной психологии, когда испытуемым предлагается выбирать или оценивать других в порядке предпочтения. Измерения по интервальной шкале наиболее распространены в психологических исследованиях и является метрической шкалой. Шкала интервалов определяет величину различий между объектами в проявлении свойств. Она наиболее удобна и желательна для статистического анализа. Все тест-опросники ориентированы на измерения по интервальной шкале. Основное достоинство данной шкалы по отношению к ранее описанным состоит в том, что измерения по этой шкале позволяют оценить на сколько единиц измерения больше или на сколько меньше выражен измеряемый признак у испытуемых (ММРI, Кэттелл и др.). Второе достоинство состоит в том, что при статистической обработке возможно использование как непараметрических так и параметрических критериев, которые позволяют провести более точный статистический анализ экспериментальных данных. Третье достоинство заключается в том, что измерения по интервальной шкале позволяют осуществить дисперсионный факторный анализ экспериментальных данных, который достаточно часто применяют для установления причинно-следственных связей. Четвертое достоинство данной шкалы заключается в том, что эмпирические данные, полученные по ней можно, при необходимости, всегда перевести в показатели шкалы наименований и шкалы порядка. Очевидно, из всего вышесказанного можно сделать вывод, что статистический анализ эмпирических данных полученных по шкале интервалов может быть использован для решения всех типов выделенных задач. В заключение этого параграфа приведем пример перевода значений шкалы интервалов в шкалу порядка. Это мы делаем потому, что студенту при работе с непараметрическими статистическими критериями, выполнение этой операции обязательно и, как показывает опыт, именно эта операция вызывает затруднения, особенно если имеются связанные ранги. Пример. При исследовании уровня интраверсии-экстраверсии у школьников были получены следующие значения: 12; 13; 14; 14; 15; 16; 16; 16; 16; 18; 18; 18; 18; 18; 19; 19; 19. Необходимо присвоить полученным значениям ранги в порядке возрастания. Наименьшее значение 12, поэтому ему присваиваем 1-ый ранг, значению 13 присваиваем 2-й ранг, а далее мы видим, что значение 14 встречается дважды на 3 и 4 местах в общем ранговом ряду, следовательно, ранги присваиваемые этим значениям усредняем: Значение 15 занимает 5-е место, ему присваиваем 5-й ранг. Значение 16 занимает 6; 7; 8; 9 места, поэтому мы ранги усредняем: В конечном итоге, при переводе измерений по интервальной шкале в шкалу порядковую, последняя примет вид: 1; 2; 3, 5; 3, 5; 5; 7, 5; 7, 5; 7, 5; 7, 5; 12; 12; 12; 12; 12; 16; 16; 16. Когда говорят об уровне значимости важно помнить, что всякий результат, полученный статистическим методом, относителен. Эта относительность исходит из самой методологии статистического анализа. Мы не можем провести исследование на всей генеральной совокупности, поэтому мы всегда должны учитывать, что всякое утверждение) характеризуется мерой вероятности ее справедливости (р). При статистическом анализе экспериментальных данных в психологии используется две меры вероятности равные 95 %(0, 95) и 99 %(0, 99). Другой стороной меры вероятности справедливости гипотезы выступает уровень значимости (a), под которым понимается вероятность того, что мы сочли различия существенными, а они на самом деле оказались случайными. Взаимосвязь между мерой вероятности и уровнем значимости отражено в формуле a=1-р. Соответственно в психологии принято использовать два уровня значимости – 5 % (0, 05) и 1 % (0, 01) и в соответствии с логикой рассуждений, чем меньше выбран уровень значимости, тем достовернее будет наше суждение относительно вскрытых нами феноменов, тенденций и т.д.. Как показывает опыт, студенты в подавляющем большинстве «грешат» при качественном анализе экспериментальных данных оперированием средними значениями, хотя, исходя из законов статистики, делать этого, они не имеют права и, вследствие этого, ценность полученных качественных выводов значительно снижается. Этому способствует и утвердившееся в психологии мнение о том, что при увеличении замеров исследуемого признака до максимально возможного характер распределения будет стремиться к нормальному. А, как показывают последние данные, зачастую этого не происходит. Среднее значение может служить основанием для качественного анализа экспериментальных данных только в том случае, если характер распределения признака является нормальным, или близок к нормальному. В идеальном варианте распределение может считаться нормальным если показатель эксцесса (Е) и коэффициент асимметрии (А) равны 0. Но в силу того, что экспериментатор занимаясь исследованием того или иного признака, свойства имеет дело с некоторой выборкой (определяется на основе каких-либо качественных признаков), а не со всей возможной совокупностью объектов отвечающих этим признакам, то в статистическом анализе он вынужден идти на определенные допущения. Это допущение связано с понятием математической вероятности. Как следствие этого исследователь с определенным уровнем вероятности допускает, что если полученное значение асимметрии и эксцесса не превосходят численно некоторого критического значения, то распределение признака можно считать близким к нормальному и использовать соответствующий статистический аппарат оценивания при количественно-качественном анализе экспериментальных данных (среднее значение, дисперсию, стандартное отклонение). Если значение А, рассчитанное по формуле: где – центральные отклонения; n – объем выборки; s - стандартное отклонение, рассчитанное по формуле: и значение Е, рассчитанное по формуле: равны 0, то характер распределения является нормальным. Если же значения А и Е отличны от нуля, и необходимо определить можно ли считать распределение признака близким к нормальному, тогда можно воспользоваться формулой Н.А. Плохинского (приводим по Е.В. Сидоренко 1996). Он считает, что достоверным отличием эмпирических распределений от нормального выступает ситуация, когда показатели асимметрии (А) и эксцесса (Е) превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз: , где - показатель асимметрии, взятый по модулю; mA – ошибка репрезентативности, рассчитанная по формуле: , где - показатель эксцесса, взятый по модулю; mЕ – ошибка репрезентативности, рассчитанная по формуле Пример 1. Студент провел исследование способности учеников среднего школьного к обобщению по 5-му субтесту ШТУР (в эксперименте приняло участие 12 школьников), и получил следующие результаты: 14; 16; 17; 20; 20; 22; 25; 21;! 9; 16; 18; 20. 1. Рассчитаем среднее значение: 2. Для удобства расчета показателей А и Е построим следующую таблицу (первая строка – индивидуальные значения, вторая – среднее значение).
Далее, опираясь на данные таблицы, произведем расчет показателей s; А и Е Далее рассчитываем ошибку репрезентативности для А и Е.
И, последнее, определяем во сколько раз показатель А и Е превосходят свою ошибку репрезентативности.
Так как 0, 7 и 0, 4 явно меньше 3, то студент имеет все основания при статистической обработке данных пользоваться средним значением, дисперсией (разброс значений относительно среднего), использовать параметрические критерии оценивания и факторный анализ. Формулирование гипотезы систематизирует предположения исследователя и представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не теряет генеральной линии в процессе расчетов и ему легко понять после их окончания, что он, собственно, обнаружил. Статистическая гипотеза – утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики. Перед проведением статистического анализа выдвигают два вида гипотез – нулевую и альтернативную. Нулевая гипотеза – это гипотеза об отсутствии различий, она обозначается в статистике как Н0 и называется нулевой потому, что содержит число 0: Х1-Х2 =0, где Х1 и Х2 – сопоставляемые значения признаков. Нулевая гипотеза – это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий. Альтернативная гипотеза – это гипотеза о значимости различий и обозначается как Н1. Альтернативная гипотеза – это то, что мы хотим доказать. Опровержение нулевой гипотезы и доказательство альтернативной при любом типе исследовательских задач всегда связан с понятием уровень статистической значимости. Когда говорят об уровне значимости важно помнить, что всякий результат, полученный статистическим методом, относителен. Эта относительность исходит из самой методологии статистического анализа. Мы не можем провести исследование на всей генеральной совокупности, поэтому мы всегда должны учитывать, что всякое утверждение) характеризуется мерой вероятности ее справедливости (р). При статистическом анализе эмпирических данных в психологии используется две меры вероятности равные 95 %(0, 95) и 99 %(0, 99). Другой стороной меры вероятности справедливости гипотезы выступает уровень значимости (a), под которым понимается вероятность того, что мы сочли различия существенными, а они на самом деле оказались случайными. Взаимосвязь между мерой вероятности и уровнем значимости отражено в формуле a=1-р. Соответственно в психологии принято использовать два уровня значимости – 5 % (0, 05) и 1 % (0, 01) и в соответствии с логикой рассуждений, чем меньше выбран уровень значимости, тем достовернее будет наше суждение относительно вскрытых нами феноменов, тенденций и т.д.. Когда студент, доказывая альтернативную гипотезу, в результате статистических операций получает некое численное значение, ему необходимо сравнить полученное в результате статистического расчета значение (его называют эмпирическим или наблюдаемым) со значением, которое приводится в таблице (его называют табличным или критическим). В литературе по статистике приводятся таблицы критических значений для различных статистических критериев оценивания, которые всегда, определяются уровнем значимости. И здесь важно помнить о правилах принятия статистических решений при анализе эмпирических данных. Как правило, исключения составляют лишь некоторые критерии, например, U-критерий Манна-Уитни, Т-критерий Вилкоксона, для которых выполняется обратное правило, если полученное (наблюдаемое, эмпирическое) значение, превосходит значение табличное при р=0, 99 (a=0, 01), тогда по правилу принятия решений, принятому в психологии, мы отвергаем нулевую гипотезу (Н0) и принимаем альтернативную (Н1). Проще говоря, можно говорить о статистически достоверных различиях на уровне исследуемого признака, статистически достоверном сдвиге на уровне исследуемого признака, о статистически достоверной взаимосвязи между признаками, статистически достоверной причинно-следственной связи. И с достаточной долей уверенности распространять обнаруженные тенденции при работе с выборкой на всю генеральную совокупность, отвечающую качественным характеристикам выборки. Если полученное (наблюдаемое, эмпирическое) значение находится между табличными значениями при р=0, 95 (a=0, 05) и р=0, 99 (a=0, 01), тогда мы попадаем в зону «неопределенности», т.е. мы не отвергаем нулевую гипотезу (Н0), но не принимаем и альтернативную (Н1) и, чтобы снять эту неопределенность необходимо провести дополнительное исследование на большем объеме выборки. Если же полученное (наблюдаемое, эмпирическое) значение меньше значения табличного при р=0, 95 (a=0, 05), исключения составляют U-критерий Манна-Уитни, Т-критерий Вилкоксона, для которых выполняется обратное правило, тогда однозначно принимается нулевая гипотеза (Н0) и не имеет смысла говорить о наличии статистически достоверного различия на уровне исследуемого признака, о статистически достоверном сдвиге на уровне исследуемого признака, о статистически достоверной взаимосвязи и статистически достоверной причинно-следственной связи, а стоит говорить о том, что обнаруженная тенденция имеет отношение только к тем испытуемым, с которыми имел дело экспериментатор и говорить о ее «всеобщности» не имеет смысла.
|