![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Тема 1.3. Психометрические характеристики психодиагностических методик
План 1.Надежность теста, виды надежности, методы оценки надежности психодиагностической методики. 2.Валидность теста, виды валидности, методы оценки валидности. 3. Стандартизированность теста. Сырые и стандартные баллы. Стандартные психодиагностические шкалы, их параметры и сферы применения. Методики перевода сырых баллов в стандартные психодиагностические шкалы. 4.Репрезентативность психодиагностической методики. Достоверность теста, методы проверки достоверности.
1. Важнейшими показателями качества психодиагностических методик являются надежность и валидиость. Надежность психодиагностических методик свидетельствует о повторяемости, стабильности результатов, об их постоянстве и устойчивости. Она показывает, насколько точно производятся психологические измерения, насколько можно доверять получаемым результатам. Известный специалист в области психодиагностики К. М, Гуре-вич предлагает выделять три типа надежности: надежность самого измерительного инструмента, стабильность изучаемого признака и константность, т. е. независимость результатов от личности экспериментатора. Надежность теста показывает независимость его результатов от действия разных случайных факторов. Разнообразные внешние и внутренние факторы могут вызывать отклонения результатов теста. Следует определить среднее арифметическое значение измерений по формуле где х — результаты отдельных измерений, К — количество измерений. Разброс величин измерений (стандартное отклонение) или дисперсию определяют как где (х. — М) — отклонение каждого отдельного измерения х; среднеарифметического М,., К — количество измерений. Для проверки стабильности изучаемого признака используется метод, получивший название «тест — ретест», который заключается в проведении повторного психодиагностического испытания той же выборки испытуемых (не менее 30 человек) через определенный промежуток времени, в вычислении коэффициента корреляции между результатами первого (X) и второго (Y) тестирования. Этот коэффициент и представляет собой показатель стабильности исследуемого признака, т. е. надежность теста проявляется н том, что одни и те же люди при повторном обследовании дают те же результаты. Коэффициент корреляции вычисляется по формуле где к, у. — величины измерений первого (X) и второго (Y) тестирования. Тест надежен, если R = 0, 8—0, 9. Если значение R низкое, это значит, что случайные факторы сильно влияют, искажают результаты теста, т. е. тест ненадежен. Тогда ошибка измерения покажет, насколько истинный балл испытуемого по тесту мо, жет отклоняться от измеренного балла и можно ли доверять данному тесту. Как правило, повторное обследование проводится через несколько месяцев (но не более чем через полгода). Нельзя проводить повторное испытание слитком скоро после первого, поскольку есть опасность, что испытуемые будут воспроизводить свои ответы по памяти. Однако такой срок не может быть слишком большим, поскольку в этом случае возможно изменение, развитие самой исследуемой функции. Коэффициент стабильности считается приемлемым в Том случае, когда его величина не ниже 0, 8. Коэффициент константности определяется путем корреляции результатов двух психодиагностических испытаний, проведенных на одной и той же выборке испытуемых с соблюдением идентичности условий, но разными экспериментаторами. Он должен быть не ниже0, 8. Качество методики определяется тем, насколько хорошо она составлена, насколько однородна, что свидетельствует о ее направленности на диагностику одного и того же свойства, признака. Для проверки надежности инструмента по показателю однородности используют метод расщепления — для этого все задания психодиагностического инструмента делятся на четные и нечетные (по нумерации), отдельно обрабатываются, а затем подсчитываются коэффициенты корреляции между этими рядами. Чем выше величина коэффициента корреляции, тем однороднее методика, тем выше ее надежность.
2. Другим показателем качества методики является ее валидность. По определению видного американского тестолога А. Анастази, «валидность теста — понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Валидность свидетельствует о том. Пригодна ли методика для измерения определенных качеств, особенностей и насколько эффективно она это делает. Наиболее распространенным способом нахождения теоретической валидности методики является конвергентная валидность, т. е. сопоставление данной методики с авторитетными родственными методиками и доказательство значимых связей с ними. Сопоставление с методиками, имеющими другое теоретическое основание, и констатация отсутствия значимых связей с ними называется дискри-минантной валидностью. Другой вид валидности — прагматическая валидность — проверка методики с точки зрения ее практической значимости, эффективности, полезности. Для проведения такой проверки, как правило, используются так называемые независимые внешние критерии используется независимый от теста внешний источник информации о проявлении в реальной жизни и деятельности людей измеряемого психического свойства. Среди таких внешних критериев могут быть успеваемость, профессиональные достижения, успехи в разных видах деятельности, субъективные оценки (или самооценки). Если, например, методика измеряет особенности развития профессионально важных качеств, то для критерия необходимо найти такую деятельность или отдельные операции, где именно эти качества реализуются. Для проверки валидности теста можно использовать метод известных групп, когда приглашаются люди, про которых известно, к какой группе по критерию они относятся (например, группа «высокоуспешных, дисциплинированных студентов» — высокий критерий и группа «неуспевающих, недисциплинированных студентов» — низкий критерий, а студенты со средними значениями не участвуют в тестировании), проводят тестирование и находят корреляцию между результатами теста и критерием.
Здесь а — число испытуемых, попавших в высокую группу по тесту и по критерию, с — число испытуемых, попавших в высокую группу по критерию и имеющих низкие результаты теста. При полной валидности теста элементы Ь и с должны быть равны нулю. Меру совпадения, корреляции между крайними группами по тесту и критерию оценивают с помощью фи-коэффициента Гилфорда
Если было 30 человек испытуемых, то статистически значимую связь теста с критерием можно констатировать, если Р больше 0, 36. Что касается величины коэффициентов валидности, то она по разным причинам всегда ниже, чем коэффициент надежности. По мнению ведущих психодиагностов, низким признается коэффициент валидности порядка 0, 20-0, 30; средним — 0, 30—0, 50; высоким — выше 0, 60. 1. Валидность «по одновременности», или текущая валидность. Определяется с помощью внешнего критерия, информация wo которому собирается в период проведения испытаний (например, успеваемость, производительность труда и др.). 2. Прогностическая, или «предсказывающая» валидность отличает Для проверки прогностической валидности теста нужно обследовать более 300 человек, например абитуриентов, а через 2—3 года выделить среди этих людей критериальные группы «отличников» и «двоечников» и посчитать корреляцию с прежними показателями теста. Если корреляция выше 0, 4—0, 6, то тест можно использовать для профотбора абитуриентов и прогноза их учебной успешности. 3. Ретроспективная валидность определяется на основе крите
3. Стандартизированность психодиагностической методики предполагает, с одной стороны, единую стандартную процедуру ее проведения и обработки результатов, а с другой стороны, включает перевод «сырых первоначальных результатов теста» в стандартную шкалу тестовых баллов, в результате чего можно сопоставлять результаты у разных испытуемых в разных тестах. Выборка, на которой определяются статистические тестовые нормы, называется «выборкой стандартизации» (она должна быть не менее 200 человек). Процедура нормирования (перевода «сырых результатов теста» в стандартную шкалу) включает ряд операций: I) расчет стандартного балла где х — сырой балл по тесту, Мя — средний балл по выборке стандартизации, Дк — дисперсия, или стандартное отклонение по выборке стандартизации; ♦ 2) перевод стандартного балла Z в любую стандартную тестовую ♦ шкала «стенов», в которой центр М равен 5, 5, а отклонение Д в 2, тогда формула перевода в шкалу «стенов» = 2Z + 5, 5; ♦ Т-шкала, в которой центр М равен 50, а отклонение Д = 10. Обобщенная формула перевода сырого балла в заданную стандартную шкалу имеет вид Y = flZ + М, где Y — стандартный балл по произвольной стандартной шкале с центром М и отклонением Д. Для многих тестов используют более сложную процедуру нелинейной нормализации (переход к нормальному распределению), в результате чего создают «конверсионную таблицу» для перевода сырых баллов в стандартные баллы по заданной шкале, в которой каждому «сырому баллу» указан соответствующий стандартный балл по определенной шкале, например шкале «стенов», причем диагносту уже не надо делать самостоятельных вычислений по нормированию баллов.
4. Следует учитывать репрезентативность тестовых норм — правомерность применения тестовых норм в большой группе людей. Если тестовые нормы были вычислены на выборке школьников, то эти нормы нельзя автоматически переносить на студентов — надо провести рестандартизацию теста, проверить его на студентах и вычислить тестовые нормы для студентов. Кроме статистических тестовых норм часто используют критериальные нормы, т. е. достигли человек критического требуемого уровня развития профессионально важного психологического качества. В критериальных тестах учитывают не степень отклонения баллов от центра шкалы, а достижение или недостижение какого-то критического уровня на шкале. Следует учитывать и достоверность теста — способность теста защищать информацию от мотивационных (сознательных и бессознательных) искажений и социальной желательности ответов {это достигается через введение в тест проверочной шкалы лжи). В случае, если тестирование проводится в интересах и по просьбе самого человека (ситуация консультирования), то ответы человека более правдивы. Если тестирование проводят по инициативе администрации, например в целях профотбора (ситуация экспертизы), то испытуемый склонен давать «социально желательные», нужные, выгодные «ответы», т. е. эти ответы являются сознательно или бессознательно искаженными, и в таких случаях нельзя использовать тесты без шкалы достоверности
Тема 1.4. История развития психодиагностики. План 1.Возникновение психодиагностики. Шкалы Бине. 2. Развитие психодиагностики за рубежом. 3. Развитие психодиагностики в России. Достоинства и недостатки, ограничения психодиагностических обследований. 1. Еще в 1905 году Альфред Бине по поручению министерства образования Франции разработал методики, с помощью которых можно измерять уровень умственного развития ребенка. Для каждого возраста подбирались свои задания, которые могли решить 80—90 % детей из выборки в 300 детей данного возраста. Детям до 6 лет предлагалось по 4 задания, а старше 6 лет — 6 заданий. Показателем интеллекта в шкалах Бине был умственный возраст, который определялся по успешности выполнения тестовых заданий. Испытание начиналось с выполнения заданий, соответствующих хронологическому возрасту ребенка, если он справлялся со всеми заданиями, то ему предлагались задания более старшего возраста (если он решал не все, а некоторые из них, то испытание прекращалось). Максимальный возраст, все задания которого решались испытуемым, является его базовым умственным возрастом. Например, если ребенок решил все задания для 7 лет и 2 задания для 8 лет, то его базовый возраст равен 7, а каждое дополнительно выполненное задание оценивается числом «умственных месяцев» (каждое задание соответствует 2 месяцам, так как 6 заданий = 12 месяцам), следовательно, умственный возраст (УВ) ребенка =" \7 лет 4 месяцам. Несовпадение умственного и хронологического возрастов возрастов считалось либо показателем умственной отсталости (если УВ меньше хронологического), либо одаренности (если УВ больше хронологического). Американский ученый Термен (работал в Стенфордском университете) усовершенствовал тест Бине, возникла шкала Стенфорд — Бине, в которой стал использоваться показатель — коэффициент интеллектуальности, представляющий собой частное, получаемое при делении умственного возраста на хронологический и умноженный на 100. «Коэффициент интеллектуальности», сокращенно обозначаемый IQ, позволяет соотнести уровень интеллектуальных возможностей индивида со средними показателями своей возрастной и профессиональной группы. Можно сравнивать умственное развитие ребенка с возможностями его ровесников. Например, календарный возраст 8 лет, а умственные способности ближе к шестилетней группе, таков, следовательно, и его «умственный» возраст, следовательно, коэффициент интеллекта около 75 %. Среднее значение IQ (умственный возраст соответствует хронологическому) соответствует 100 баллам, а самые низкие могут приближаться к 0, самые высокие — к 200. Стандартное (т. е. среднее для всех групп) отклонение — 16 баллов в каждую сторону. У каждого третьего человека IQ находится между 84—100 баллами, и такова же доля лиц (34 %) с показателем от 100 до 116 баллов. Таким образом, эта основная масса (68 %) и считается людьми со средним интеллектом. Две другие группы (по 16 % в каждой), результаты которых соответствуют крайним показателям шкалы, рассматриваются или как умственно отсталые (люди со сниженным интеллектом IQ от 10 до 84), или как обладающие высокими (выше среднего) интеллектуальными способностями (1Q от 116 до 180). Если результат ребенка выше тестовой нормы, более 116, то ребенок считается интеллектуально одаренным. Шкала Стенфорд-Бине применяется во всем мире, имела несколько редакций (1937, I960, 1972, 1986).
|