Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Технологическая фаза научного исследования
Технологическая фаза исследования заключается в непосредственной проверке построенной научной гипотезы в соответствии с разработанным на стадии конструирования и технологической подготовки исследования комплексом рабочих материалов и оборудования. Технологическая фаза состоит из двух стадий: проведения исследования и оформления результатов. СТАДИЯ ПРОВЕДЕНИЯ ИССЛЕДОВАНИЯ. Стадия проведения исследования, в свою очередь, включает два этапа: теоретический этап (анализ и систематизация литературных данных, отработка понятийного аппарата, построение логической структуры теоретической части исследования) и эмпирический этап – проведение опытно-экспериментальной работы. Анализ и систематизация литературных данных. Постоянная работа с научной литературой – обязательный компонент любой научной деятельности. А сама научная литература является важнейшим средством поддержания существования и развития науки – во-первых, средством распространения и хранения достигнутого научного знания, во-вторых – средством коммуникации, научного общения ученых между собой. Необходимо учитывать разные функции тех или иных видов публикаций, отражающих, как правило, разные этапы развития научного знания. Вначале новые научные факты, идеи, теории появляются в публикуемых тезисах выступлений на научных конференциях, семинарах, съездах, симпозиумах, а также в препринтах и других видах публикаций, осуществляемых наиболее быстро. Затем в уже систематизированном и отобранном виде они переходят в научные статьи, публикуемые в журналах и сборниках. Затем – в еще более обобщенном, систематизированном и проверенном виде факты, идеи, теории публикуются в монографиях. И только фундаментальные, общие и неоднократно проверенные новые компоненты научного знания попадают в учебники – вузовские, а уж самые значительные – в школьные. Эту динамику движения научного знания должен учитывать исследователь в работе с научной литературой, разграничивая литературные источники по степени их важности, достоверности и признанности в научном мире. Начиная работать с литературой, каждый исследователь приступает к составлению библиографии. Подробно методы работы с библиографией описаны в различных пособиях [70, 118 и др.], и здесь мы на них останавливаться не будем. Для каждого научного исследования необходимо определение ведущих научных концепций, теории, которые берутся в основу данной работы. Имеются в виду не те все научные публикации, на которые исследователь ссылается в своей работе – их десятки, сотни. Речь идет об одной, двух, трех, от силы четырех концепциях крупных ученых, которые действительно лежат в основании исследования. Исследователь должен четко разобраться, что же действительно является методологической базой его исследования. Необходимость четкого уяснения – какие теории, концепции берутся за основу, обусловливается еще и тем обстоятельством, что в науке существуют разные научные школы, разрабатывающие подчас одни и те же проблемы, но с разных позиций, в разных направлениях. Эти научные школы могут иметь совершенно разные, подчас противоположные научные взгляды. Существование различных научных школ объективно необходимо для развития науки. Но исследователь, выстраивая свое исследование, должен занять строгую позицию – какие теории, концепции он принимает за базовые, и обосновывает почему, а на какие только ссылается в процессе анализа литературных источников. Важнейшие требования к любой научной работе – это строгость, четкость, однозначность применяемой терминологии. Если в обыденной жизни, в устных выступлениях допускается известная свобода в оперировании терминами, то требования упорядоченности и строгости употребления языка науки обязательны. Каждый раз, когда у исследователя появляется необходимость использовать какой-либо термин, он начинает работу с ним с общих словарей, энциклопедических словарей и энциклопедий. В первую очередь это словари русского языка В.И. Даля, С.И. Ожеговаи Д.Н. Ушакова, Словарь иностранных слов, Энциклопедический словарь. Эти источники дают однозначное толкование общеупотребительных терминов в общенациональном масштабе. При этом, хотя терминология в них трактуется практически одинаково, каждый из них все же вносит свои нюансы в объяснения значений слов, что позволяет лучше ориентироваться при использовании того или иного термина. Полезен бывает Словарь синонимов русского языка, когда нередко приходится мучительно искать, чем можно заменить то или иное слово, чтобы не повторять его много раз в процессе написания текста подряд в одном предложении, в одном абзаце и т.п. Следующий этап – отработка сугубо философских, гносеологических и методологических понятий – работа с соответствующими словарями. В философских словарях любому исследователю полезно познакомиться с содержанием, по крайней мере, таких понятий (категорий), как: абстракция, анализ, знание, значение, качество, количество, модель, наблюдение, норма, объяснение, обобщение, образ, объект, опыт, основание, отношение, практика, предмет, проблема, развитие, рефлексия, семантика, система, системный анализ, свойство, сравнение, сущность, сходство, теория, форма, формализм, эксперимент и др. Кроме того, в этих же целях бывает полезен логический словарь-справочник Н.И. Кондакова[101]: абстрагирование, абстракция, аксиома (аксиоматический метод), алгоритм, аналогия, взаимосвязь, восхождение от абстрактного к конкретному, гипотеза, гносеология, дедукция, закон, знак, знание, идея, инвариантность, индукция, информация, исследование, класс (не в смысле школьного класса), классификация, композиция, компонент, контекст, концепция, кортеж, логика, логическое и историческое, мера, метатеория, непосредственное знание, непротиворечивость, обобщение понятия, обратного отношения закон, общее понятие, объем понятия, определение понятия, особенное, отношение, оценка, параметр, понятие, постулат, правила определения понятия, синтез, признак, принцип, проблема, противоречие, процедура, содержание понятия, сравнение, структура, термин, тип, условие, факт и др. И, наконец, следующий этап, когда речь идет о терминах, имеющих существенное значение для конкретного исследования – анализ их толкования в научной литературе: монографиях, статьях и т.д. В первую очередь изучаются фундаментальные публикации тех авторов, чьи теории, концепции берутся в основу исследования (см. выше). По этим публикациям целесообразно составить тезаурус – словарь используемых данными авторами терминов с раскрытием их толкований и соотношений между ними. В дальнейшем, при написании отчетных материалов, статей, книг, диссертаций используется терминология преимущественно из этого тезауруса, а остальные термины применяют только в случае необходимости, когда уже нельзя обойтись без них. Но каждый раз, применяя тот или иной термин, исследователь контролирует себя: для не столь существенных для его работы терминов – в чьей трактовке он их используют, а для существенных – обосновывается, почему берется трактовка именно этого (этих) авторов. Каждого исследователя подстерегает «опасность» введения каких-либо новых терминов. Подчас это очень хочется сделать. Но ученые крайне неохотно и настороженно воспринимают новые термины в науке. Это понятно – ведь язык, в том числе научный язык – это общенациональное достояние, к которому нужно относиться крайне бережно. И если каждый пишущий, публикующийся начинает использовать свою новую терминологию, ученые, а вслед за ними и все люди, вообще перестанут понимать друг друга. Поэтому введение новых терминов (слов и словосочетаний) допустимо только в крайних случаях, когда ни один из имеющихся терминов не может описать соответствующее явление, процесс. И уж совсем недопустимо вкладывать какой-то новый смысл, давать какие-то новые «авторские» определения устоявшейся терминологии (подчеркнем, что это требование относится именно к устоявшейся, общепринятой терминологии). В работе с понятийным аппаратом необходимо отметить еще одно обстоятельство, имеющее важное значение. Отбор и систематизация понятийного аппарата, используемого в каждом конкретном исследовании, определяется его предметом, поставленными целями и задачами. Поэтому сущность явлений и процессов, выражаемых через постоянную систему понятий, определяется авторской позицией, а сама понятийная система в каждом исследовании является в той или иной мере авторской (другое дело, она может быть четкой, стройной или наоборот – расплывчатой и противоречивой). Построение логической структуры теоретического исследования. За исключением процесса построения логической структуры создаваемой научной концепции, теории, на чем мы остановимся подробнее ниже, построение логической структуры теоретического исследования, так же как и построение структуры теоретической части эмпирического исследования, весьма вариативно и целиком определяется предметом, целями и задачами каждого конкретного исследования. Общими являются лишь некоторые моменты, которые мы здесь и рассмотрим. При построении логической структуры исследования часто возникает необходимость использования различных классификаций и введения своих собственных классификаций. Более того, они даже желательны, поскольку придают работе определенную стройность. Основные требования, предъявляемые к классификации [25] [101]: 1. Каждая классификация может проводиться только по одному основанию. Это, пожалуй, самое главное требование, наиболее часто нарушаемое. Вводя какую-либо классификацию, сразу необходимо оговорить – а по какому основанию она вводится? Основание классификации – это признак, который дает возможность разделить объем родового понятия (всю совокупность классифицируемых по данной классификации объектов) на виды (видовые понятия – члены, части этой совокупности). Например, основанием для деления общеобразовательной школы на начальную, неполную среднюю и среднюю служит уровень общего образования, даваемый учащимся на каждой ступени. В то же время нельзя, к примеру, в одной классификации разделить учащихся какой-то школы по возрасту и успеваемости или, скажем, посещению факультативных занятий. 2. Объем членов классификации должен быть в точности равен объему всего классифицируемого класса. Это значит, к примеру, что если мы разделили все треугольники на основании величины углов: остроугольные, прямоугольные, тупоугольные, то никаких других треугольников по этому основанию быть не может. 3. Каждый объект может попасть только в один подкласс. Нельзя, например, расклассифицировать все целые числа на четные, нечетные и простые. Тогда числа 5, 7, 11 и т.д. попадают одновременно в два класса – они являются и нечетными и простыми. 4. Члены классификации должны взаимно исключать друг друга; это значит, что ни один из них не должен входить в объем другого. К примеру, научные книги нельзя подразделить на монографии, учебники, справочники и по математике. Книги по математике могут быть и монографиями, учебниками, справочниками. 5. Подразделение на подклассы должно быть непрерывным, то есть необходимо брать ближайший подкласс и не перескакивать в более отдаленный подкласс. Допустим, те же научные исследования можно классифицировать как исследования в области физики, химии, биологии, экологии и т.д., но нельзя – как исследования в области химии, биологии, экологии и электродинамики (раздел физики). В последнем случае мы «перескочили» из ближайшего подкласса (физика) в более отдаленный подкласс – раздел физики. Можно еще добавить, что к одному и тому же классу объектов, явлений, процессов могут быть применены разные классификации по разным основаниям-признакам. Так мебель может быть классифицирована: – по основанию материала, из которого она изготовлена: деревянная, металлическая, пластмассовая и т.д.; – по основанию стиля дизайна: классическая, ампир, викторианская, модерн и т.д.; – по основанию цвета: черная, белая, коричневая и т.д.; – по основанию функционального назначения: столы, стулья, шкафы и т.д. То есть одни и те же объекты могут быть классифицированы по множеству оснований. В процессе построения логической структуры работы исследователь неизбежно попадает в положение «витязя на распутье», натыкаясь на «логические развилки» – можно пойти и в таком направлении, и в таком, и в таком. Таких «развилок» на пути исследователя бывает много, а пройти все пути, естественно, он не сможет, для этого не хватит и всей жизни. Поэтому выбирается единственная дорога, которую исследователь считает основной, перспективной. Если «развилка» имеет принципиальное значение для всей работы в целом, в таких случаях дается обоснование, почему выбрано именно это направление. Но не стоит оправдываться, почему не сделано чего-то другого. Ведь все научные работники, имеющие опыт построения логики научных работ, о таких «логических развилках» знают по себе, и такой выбор, если он оправдан, является вполне естественным. Нередко исследователь сталкивается с ситуацией, когда ему необходимо свои логические построения распределить по разным классификациям, в разных аспектах. И здесь каждый пишущий неизбежно попадает в «тупик» – как описать все эти аспекты без повторов. Но сделать это невозможно! Приходится брать один аспект, одну классификацию за основные, а материал по всем остальным излагать внутри, теряя при этом значительную часть всего богатства содержания. Но иного способа нет. Наконец, отметим, что совокупность классификаций по разным основаниям, для выделения которых, в свою очередь, существуют свои основания, называется системой классификаций. Построение и анализ систем классификаций играют важную роль в логической структуре теоретического исследования, так как позволяют четко ограничить соответствующую предметную область (которая определяет основание классификации оснований системы классификаций) – см. Рис. 9, выделить в этой предметной области взаимосвязанные подобласти, обозначить «белые пятна» – перспективные предметы или методы исследования. Кроме того, исследование всех классов некоторого основания позволяет производить обобщение – см. Рис. 10. Рассмотрим простейший пример. Предположим, что предметом исследования являются свойства некоторого нового химического соединения. Основаниями классификации являются типы веществ, с которыми оно взаимодействует (по этому основанию выделим кислоты и щелочи), и температуры взаимодействия (низкие, высокие и нормальные). Предметная область (свойства нового соединения при взаимодействии с другими веществами) включает шесть взаимосвязанных подобластей (переходящих друг в друга при изменении значений одного из соответствующих признаков) – см. Табл. 6. Если в результате исследования изучены случаи, отмеченные символом «+» в Табл. 6, то исследование не полно – не изучен случай взаимодействия нового вещества с щелочами при высоких температурах. Если обнаружено, что новое соединение одинаково взаимодействует с кислотами при низких, высоких и нормальных температурах, то (так как были выделены только три значения признака «температура») можно сделать обобщение – взаимодействие нового химического соединения с кислотами одинаково при всех температурах.
Табл. 6 Пример системы классификаций взаимодействия
Система классификаций может модифицироваться за счет удаления части существующих оснований классификации и/или добавления новых. Так, в рассмотренном выше примере можно добавить классификацию по основанию «концентрация веществ, с которыми взаимодействует исследуемое соединение». Соответственно, станет более широким и предмет исследования. Таким образом, системы классификаций являются эффективным логическим инструментом обеспечения цельности предмета исследования и его полноты. Они удобны для самого исследователя (для использования в процессе организации научной деятельности, когда необходимо упорядочить предметную область, понять, что сделано, и что предстоит сделать). Кроме того, они удобны и как форма представления результатов научного исследования, чтобы, например, коллега – читатель соответствующей статьи или книги – мог быстро охватить всю совокупность полученных результатов. Построение логической структуры теории (концепции). Для начала разделим понятия «теория той или иной науки» и «научная теория». Под теорией науки понимается вся совокупность теоретических знаний в той или иной отрасли науки – физике, биологии и т.д. В то же время, в каждой научной области существует множество научных теорий (концепций) – ведь по сути дела каждая докторская диссертация, по крайней мере, каждая добротная диссертация представляет собой целостную теорию (концепцию). Здесь мы будем говорить о построении научных теорий (концепций). Процесс построения логической структуры теории (концепции) состоит из двух этапов. Первый этап – этап индукции – восхождения от конкретного к абстрактному, когда исследователь должен определить центральное системообразующее звено своей теории: концепцию, систему аксиом или аксиоматических требований, или единый исследовательский подход и т.д. Следует отметить, что термин «концепция»используется в двух смыслах. Во-первых, как ведущая идея, основная мысль чего-либо. Во-вторых, как синоним теории. Здесь мы используем этот термин в обоих смыслах: в первом случае, когда говорим о концепции как о короткой емкой формулировке; во втором – когда говорим о том, что концепция (как краткая формулировка) разворачивается, развивается в совокупности концептуальных положений, принципов, факторов, условий, механизмов и т.д. – то есть в концепцию как синоним теории. На этом индуктивном этапе в отраслях наук «слабой версии», очевидно, единственной основой для обобщения является классификационный подход – исследователь ищет соответствующие основания классификаций, которые могут объединить, «стянуть», обобщить имеющиеся результаты. В процессе обобщения, «стягивания» результатов исследователю приходится, с одной стороны, все время обращаться к своей предметной области в аспекте требований полноты теории – какие при этом «пустоты» образовались в предметной области – их надо будет в дальнейшем заполнять, в том числе, возможно, дополнительной опытно-экспериментальной работой или заимствованием результатов у других авторов. С другой стороны – постоянно соотносить получаемые обобщения и предметную область с совокупностью получаемых теоретических результатов опять же в аспекте требования полноты, а также непротиворечивости строящейся теории, концепции. На этапе индукции, исследователь детально выписывает все имеющиеся у него результаты, все, что представляет интерес. И начинает группировать, «стягивать» по определенным основаниям классификаций в первичные обобщения, затем – в обобщения второго порядка (опять же по определенным основаниям), и так далее, – происходит индуктивный процесс – абстрагирование – восхождение от конкретного к абстрактному – пока все результаты не сведутся в авторскую концепцию – короткую, буквально на 5-7 строк емкую формулировку, отражающую в самом общем сжатом виде всю совокупность результатов, всю суть работы. Или в систему аксиом, или в единый исследовательский подход и т.д. По завершении этапа индукции – определения и формулирования центрального системообразующего звена – концепции, исследовательского подхода, системы аксиом и т.п., наступает дедуктивный процесс – конкретизации – восхождения от абстрактного к конкретному. На этом этапе формулировка концепции развивается, разворачивается в совокупности принципов, факторов, условий (групп условий), моделей, механизмов и т.д. Иногда, если проблема исследования расчленяется на несколько относительно независимых аспектов, концепция развивается в несколько концептуальных положений – а те уже, далее развиваются в совокупности принципов и т.п. В свою очередь, допустим, принципы могут развиваться в классы моделей, типы задач и т.д. Так выстраивается логика, логическая структуратеории. Этот процесс представлен на Рис. 10. Эту схему исследователю чаще всего приходится циклически проходить несколько раз, проверяя и перепроверяя, уточняя логику своего исследования.
Рис. 10. Построение логической структуры теории В довольно-таки обширной литературе по гносеологии авторы не нашли какого-либо иерархического упорядочения структурных элементов теории. К примеру, что выше (ниже) по уровню абстракции (конкретизации) – принцип или модель? правило или требование? механизм или процедура? и т.д. Так что, очевидно, исследователь имеет возможность самостоятельно выстраивать их иерархию в соответствии с решаемыми в своем исследовании задачами (естественно в соответствии с традициямитой научной организации, где он работает).
Перечислим структурные элементы теории, так как это может оказаться полезным для исследователей: алгоритм, аппарат (дидактические, понятийные аппараты и т.д.); классификации; критерии; методики; методы; механизмы (классы механизмов); модели (базисные, прогностические, графовые, открытые, закрытые, динамические, комплексы моделей и т.д.); направления; обоснования; основания; основы; парадигмы; параметры; периодизации; подходы; понятия (развивающиеся понятия, системы понятий и т.д.); приемы; принципы; программы; процедуры; решения; системы (иерархические системы, генерализованные системы и т.д.); содержание; способы; средства; схемы; структуры; стратегии; фазы; сущности; таксономии; тенденции; технологии; типологии; требования; условия; фазы; факторы (системообразующие факторы и т.д.); формы (совокупности форм и т.д.); функции; характеристики (сущностные характеристики и т.д.); цели (совокупности целей, иерархии целей); этапы и т.д. В отраслях наук сильной версии добавляются еще теоремы, леммы, утверждения. А в качестве центрального системообразующего элемента (звена) могут выступать теория, концепция, идея, единый исследовательский подход, система аксиом или система аксиоматических требований и т.д. В ряде отраслей науки, например в химии, фармации, микробиологии и т.д., в качестве центрального системообразующего звена может выступать факт получения нового химического вещества, нового лекарства, новой вакцины и т.п., что является нередко плодом многолетних трудов исследователя. А затем раскрываются условия, принципы их применения и т.д. Но в целом вполне обоснованно можно утверждать, что общая логическая структуратеорий (концепций) едина. Опытно-экспериментальная работа. Специфика научного исследования состоит в том, что опытно-экспериментальная работа, хотя она и занимает значительную, а подчас и большую часть бюджета времени исследователя, служит лишь для подтверждения или опровержения предварительно сделанных им теоретических построений, начиная с гипотезы. Хотя, казалось бы, опытно-экспериментальная часть исследования начинается лишь тогда, когда исследователем закончены, выявлены и выведены все теоретические построения, тем не менее, как правило, исследователь включается в опытно-экспериментальную работу намного раньше. Ведь прежде, чем будет организована и проведена именно та опытная работа, и именно те эксперименты, которые подтвердят или опровергнут гипотезу исследователя, необходимо приобрести первоначальные умения планирования и организации опытно-экспериментальной работы, анализа и обобщения ее результатов. Кроме того, этот предварительный этап позволяет подобрать нужные подходы, отработать инструментарий и т.д. Как уже говорилось, собственно опытно-экспериментальная работа в каждом конкретном исследовании сугубо специфична, поскольку целиком определяется содержанием конкретного исследования и вряд ли может быть описана в общем виде. Необходимо остановиться лишь на применении методов математической статистики при обработке эмпирических результатов. Важно подчеркнуть, что как массовое явление в науках «слабой версии» распространена статистическая неграмотность. Так, в медицине, педагогике, психологии, социологии и т.д. как повсеместное явление применяется вычисление «среднего балла» при использовании ранговых шкал оценок. Что повергает в ужас любого человека мало-мальски знакомого с математикой: ведь на этих шкалах операция суммы не определена, а усреднение предполагает суммирование «баллов» и затем деление «суммы» на объем выборки! Об этих и других ошибках в манипулировании результатами писалось многократно (см., в том числе, обсуждение шкал измерений выше и в [168, 169, 183]). Но ошибки эти, к сожалению, укоренились и фактически перешли в традицию. Поэтому рассмотрим кратко типовые задачи анализа данных (результатов наблюдения и/или эксперимента) и используемые при решении этих задач статистические методы. Статистические методы. При планировании и подведении результатов эксперимента существенную роль играют статистические методы, которые дают возможность: - компактно и информативно описывать результаты эксперимента; - устанавливать степень достоверности сходства и различия исследуемых объектов на основании результатов измерений их показателей; - анализировать наличие или отсутствие зависимости между различными показателями (явлениями); - количественно описывать эти зависимости; - выявлять информативные показатели; - классифицировать изучаемые объекты и прогнозировать значения их показателей и характеристик, и др. Рассмотрим следующую модель эксперимента [168, 169]. Пусть имеется некоторый объект, изменение состояния которого исследуется в ходе эксперимента. В качестве объекта в медицине может выступать группа лабораторных животных, в педагогике – группа обучающихся, в экономике – множество предприятий отрасли или региона и т.д. Состояние объекта измеряется[26] теми или иными показателями (характеристиками) по критериям, отражающим его существенные характеристики. Примерами критериев являются: - в медицине: выраженность интоксикации, выживаемость в группе животных на определенный период после начала опыта и т.д. Примерами характеристик – температура, активность тех или иных ферментов в биологических жидкостях, количественные показатели структуры внутренних органов и т.д.; - в педагогике: успешность выполнения учащимися тестов, скорость выполнения контрольных заданий и т.д. Характеристики – число правильно решенных задач, время выполнения заданий и т.д.; - в экономике: эффективность функционирования промышленного предприятия, темпы развития региональной экономики и т.д. Характеристики – годовая прибыль, уровень капитализации, валовой доход на душу населения и т.д. Эксперимент заключается в целенаправленном воздействии на объект, призванном изменить его определенным образом. Примерами воздействия являются: любые методы воздействия на болезнь с целью ее излечения, хирургические манипуляции – в медицине; новые методы и/или средства обучения – в педагогике; параметры госрегулирования и/или управленческая политика руководства предприятия – в экономике и т.д. Следовательно, при проведении эксперимента необходимо обосновать, что состояние объекта изменилось, причем в требуемую сторону. Но этого оказывается недостаточно. Ведь нужно доказать, что изменения произошли именно в результате произведенного воздействия (так называемая задача изучения сходства/различий – см. ниже). Действительно, например, на утверждение о том, что в ходе медико-биологического эксперимента температура тела у экспериментального животного снизилась в результате использования нового испытуемого вещества, можно всегда возразить, – а, может быть, она снизилась бы сама, без каких-либо нововведений, или в результате каких-либо других воздействий? Аналогично, на утверждение о том, что скорость и степень снижения температуры у животных, которым вводился новый препарат, отличаются от того, как это происходило у животных, которых лечили с применением традиционных препаратов, можно возразить, – а, может быть, сама группа имела до начала эксперимента какие-то внутренние отличия, позволившие ей продемонстрировать подобные «успешные» результаты. Таким образом, для того, чтобы выделить в явном виде результат целенаправленного воздействия на исследуемый объект, необходимо взять аналогичный объект и посмотреть, что происходит с ним в отсутствии воздействий. Традиционно эти два объекта называют соответственно экспериментальной группой (иногда основной) и контрольной группой (или группой сравнения). На Рис. 11 представлена в общем виде структура эксперимента (двойными пунктирными стрелками отмечены процедуры сравнения[27] характеристик объектов).
Рис. 11. Структура эксперимента
Констатации (в результате сравнения III – см. Рис. 11) различий начального и конечного состояний (динамики) экспериментальной группы недостаточно – быть может, аналогичные изменения происходят и с контрольной группой, что может быть установлено сравнением IV. Поэтому алгоритм действий исследователя заключается в следующем: 1) На основании сравнения I установить совпадение[28] начальных состояний экспериментальной и контрольной группы; 2) Реализовать воздействие на экспериментальную группу[29] по экспериментальной методике; 3) Реализвать воздействие на контрольную группу по традиционной методике; 4) На основании сравнения II установить различие конечных состояний экспериментальной и контрольной группы. После выполнения четырех перечисленных шагов можно приступать к изучению зависимостей между различными характеристиками объектов (см. ниже). Легко видеть, что, выполняя перечисленные шаги[30], мы, фактически, косвенным образом реализуем процедуру сравнения III, исключая влияние общих для экспериментальной и контрольной группы условий и воздействий. Итак, мы описали задачу определения сходства/различий. На самом деле спектр задач анализа данных гораздо шире. Можно выделить следующие общие группы этих задач (см. Табл. 7): 1. Описание данных –компактное описание имеющихся данных с помощью различных агрегированных (обобщенных) показателей и графиков. К этому классу можно отнести также задачу определения необходимого объема выборки [31] (минимального числа исследуемых объектов), необходимого для того, чтобы сделать обоснованные выводы. В практике научных исследований обычно имеется совокупность наблюдений(десятки, сотни, а иногда – тысячи результатов измерений индивидуальных характеристик), поэтому возникает задача компактного описания имеющихся данных. Для этого используют методы описательной статистики – описания результатов с помощью различных агрегированных показателей и графиков. Перечислим некоторые из них.
Табл. 7 Задачи анализа экспериментальных данных
Для результатов измерений в шкале отношений (см. описание шкал измерений выше) показатели описательной статистики можно разбить на несколько групп: - показатели положения описывают положение экспериментальных данных на числовой оси. Примеры таких данных – максимальный и минимальный элементы выборки, среднее значение [32], медиана [33], мода [34] и др.; - показатели разброса описывают степень разброса данных относительно своего центра (среднего значения). К ним относятся: выборочная дисперсия [35], разность между минимальным и максимальным элементами (размах, интервал выборки) и др. - показатели асимметрии: положение медианы относительно среднего (величина разности их значений) и др. - гистограмма [36] и др. Данные показатели используются для наглядного представления и первичного («визуального») анализа результатов измерений характеристик экспериментальной и контрольной группы. 2. Изучение сходства/различий (сравнение двух выборок).Например, требуется установить, достоверно ли различие конечных состояний экспериментальной и контрольной группы в эксперименте (см. выше). Или, например, задача заключается в установлении совпадений или различий характеристик двух выборок (например, требуется установить, что средние значения доходов населения в двух регионах (или средние значения производительности труда в двух отраслях народного хозяйства и т.д.) совпадают или различаются). Для этого формулируются статистические гипотезы: - гипотеза об отсутствии различий (так называемая нулевая гипотеза); - гипотеза о значимости (достоверности) различий (так называемая альтернативная гипотеза). Для принятия решения о том, какую из гипотез (нулевую или альтернативную) следует принять, используют решающие правила – статистические критерии [37]. То есть, на основании информации о результатах наблюдений (характеристиках членов экспериментальной и контрольной группы) по известным формулам (см., например, [183, 241]) вычисляется число, называемое эмпирическим значением критерия. Это число сравнивается с известным (например, заданным таблично в соответствующих книгах по математической статистике [183, 241]) эталонным числом, называемым критическим значением критерия. Критические значения приводятся, как правило, для нескольких уровней значимости. Уровнем значимости называется вероятность ошибки, заключающейся в непринятии нулевой гипотезы, когда она верна, то есть вероятность того, что различия сочтены существенными, а они на самом деле случайны. Обычно используют уровни значимости (обозначаемые a), равные вероятности 0, 05, или 0, 01, или 0, 001. Или, переводя в проценты, выборки не различаются с вероятностями 5 %, 1 %, 0, 1 %. Соответственно, вероятности того, что выборки различаются составят 0, 95, 0, 99, 0, 999, или в процентах – 95 %, 99 % и 99, 9 %. В экономических, педагогических, психологических, медико-биологических экспериментальных исследованиях обычно ограничиваются значением 0, 05, то есть допускается не более чем 5 %-ая возможность ошибки (95 % уровень достоверности различий). В естественных, технических науках чаще требуются уровни достоверности различий 99 % или 99, 9 %. Если полученное исследователем эмпирическое значение критерия оказывается меньше или равно критическому, то принимается нулевая гипотеза – считается, что на заданном уровне значимости (то есть при том значении a, для которого рассчитано критическое значение критерия) характеристики экспериментальной и контрольной групп совпадают. В противном случае, если эмпирическое значение критерия оказывается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза – характеристики экспериментальной и контрольной группы считаются различными с достоверностью различий 1 – a. Например, если a = 0, 05 и принята альтернативная гипотеза, то достоверность различий равна 0, 95 или 95%. Другими словами, чем меньше эмпирическое значение критерия (чем левее оно находится от критического значения), тем больше степень совпадения характеристик сравниваемых объектов. И наоборот, чем больше эмпирическое значение критерия (чем правее оно находится от критического значения), тем сильнее различаются характеристики сравниваемых объектов. Итак, если мы ограничимся уровнем значимости a = 0, 05, то, если эмпирическое значение критерия оказывается меньше или равно критическому, то можно сделать вывод, что «характеристики экспериментальной и контрольной групп совпадают на уровне значимости 0, 05». Если эмпирическое значение критерия оказывается строго больше критического, то можно сделать вывод, что «достоверность различий характеристик экспериментальной и контрольной групп равна 95%». Приведем алгоритм выбора статистического критерия (см. Табл. 8). Во-первых, необходимо определить какая шкала измерений используется – отношений, порядковая или номинальная (см. выше). Табл. 8 Алгоритм выбора статистического критерия
Для шкалы отношений целесообразно использовать критерий Крамера-Уэлча. Если число различающихся между собой значений[38] в сравниваемых выборках велико (более десяти)[39], то возможно использование критерия Вилкоксона-Манна-Уитни. Более подробные рекомендации по выбору критериев в том или ином конкретном случае, а также описание этих критериев можно найти в [168, 183, 241]). Для порядковой шкалы целесообразно использовать критерий Вилкоксона-Манна-Уитни, возможно также использование критерия c2. Для номинальной шкалы следует использовать критерий c2. Для дихотомической шкалы (номинальной шкалы с двумя возможными значениями) следует использовать критерий Фишера. 3. Исследование зависимостей. Следующим шагом после изучения сходства/различий является установление факта наличия/отсутствия зависимости между показателями и количественное описание этих зависимостей. Для этих целей используются, соответственно, корреляционный и дисперсионный анализ, а также регрессионный анализ [168, 241]. Корреляционный анализ. Корреляция (Correlation) – связь между двумя или более переменными (в последнем случае корреляция называется множественной). Цель корреляционного анализа – установление наличия или отсутствия этой связи, то есть установление факта зависимости каких-либо явлений, процессов друг от друга или их независимости. В случае, когда имеются две переменные, значения которых измерены в шкале отношений[40], используется коэффициент линейной корреляции Пирсонаr, который принимает значения от -1 до +1 (нулевое его значение свидетельствует об отсутствии корреляции[41]) – см. Рис. 12, на котором каждая точка соответствует отдельному объекту, описываемому двумя переменным – x и y. Термин «линейный» свидетельствует о том, что исследуется наличие линейной связи между переменными – если r (x, y)= 1, то одна переменная линейно зависит от другой (и, естественно, наоборот), то есть существуют константы a и b, причем a > 0, такие что y = a x + b. На Рис. 12а) и в) изображены ситуации, когда все экспериментальные точки лежат на прямой (абсолютное значение коэффициента линейной корреляции равно единице). В ситуации, изображенной на рисунке Рис. 12б), однозначно провести прямую через экспериментальные точки невозможно (коэффициент линейной корреляции равен нулю).
Рис. 12. Величины коэффициента линейной корреляции
Если экспериментальные точки сгруппированы около некоторой прямой – см. Рис. 12г) и д), то коэффициент линейной корреляции принимает значения, отличные от нуля, причем чем «ближе» точки к прямой, тем выше абсолютное значение коэффициента линейной корреляции. То есть, чем выше абсолютное значение коэффициента Пирсона, тем сильнее исследуемые переменные линейно связаны между собой. Для данных, измеренных в порядковой шкале, следует использовать коэффициент ранговой корреляции Спирмена (он может применяться и для данных, измеренных в интервальной шкале, так как является непараметрическим и улавливает тенденцию – изменения переменных в одном направлении), который обозначается s и определяется сравнением рангов – номеров значений сравниваемых переменных в их упорядочении.
Отметим, что большое (близкое к плюс единице или к минус единице) значение коэффициента корреляции говорит о связи переменных, но ничего не говорит о причинно-следственных отношениях между ними. Так, например, из высокой корреляции температуры воздуха за окном и времени суток нельзя делать вывод о том, что движение солнца обусловлено изменениями температуры воздуха. Поэтому для установления причин связей между какими-либо явлениями, процессами необходимы дополнительные исследования по содержательной интерпретации этих связей. Дисперсионный анализ. Изучение наличия или отсутствия зависимости между переменными можно также проводить и с помощью дисперсионного анализа. Его суть заключается в следующем. Дисперсия характеризует «разброс» значений переменной. Переменные связаны, если для объектов, отличающихся значениями одной переменной, отличаются и значения другой переменной. Значит, нужно для всех объектов, имеющих одно и то же значение одной переменной (называемой независимой переменной), посмотреть, насколько различаются (насколько велика дисперсия) значения другой (или других) переменной, называемой зависимой переменной. Дисперсионный анализ как раз и дает возможность сравнить отношение дисперсии зависимой переменной (межгрупповой дисперсии) с дисперсией внутри групп объектов, характеризуемых одними и теми же значениями независимой переменной (внутригрупповой дисперсией). Другими словами, дисперсионный анализ «работает» следующим образом. Выдвигается гипотеза о наличии зависимости между переменными: например, между возрастом и уровнем образования сотрудников некоторой организации. Выделяются группы элементов выборки (сотрудников) с одинаковыми значениями независимой переменной – возраста, то есть сотрудников одного возраста (или принадлежащих выделенному возрастному диапазону). Если гипотеза о зависимости уровня образования от возраста верна, то значения зависимой переменной (уровня образования) внутри каждой такой группы должны различаться не очень сильно (внутригрупповая дисперсия уровня образования должна быть мала). Напротив, значения зависимой переменной для различающихся по возрасту групп сотрудников должны различаться сильно (межгрупповая дисперсия уровня образования должна быть велика). То есть, переменные зависимы, если отношение межгрупповой дисперсии к внутригрупповой велико. Если же гипотеза о наличии зависимости между переменными не верна, то это отношение должно быть мало. Регрессионный анализ. Если корреляционный и дисперсионный анализ дают ответ на вопрос, существует ли взаимосвязь между переменными, то регрессионный анализ предназначен для того, чтобы найти «явный вид» функциональной зависимости между переменными. Для этого предполагается, что зависимая переменная (иногда называемая откликом) определяется известной функцией (иногда говорят – моделью), зависящей от зависимой переменной или переменных (иногда называемых факторами) и некоторого параметра. Требуется найти такие значения этого параметра, чтобы полученная зависимость (модель) наилучшим образом описывала имеющиеся экспериментальные данные. Например, в простой [42] линейной регрессии предполагается, что зависимая переменная y является линейной функцией y = a x + b от независимой переменной x. Требуется найти значения параметров a и b, при которых прямая a x + b будет наилучшим образом описывать (аппроксимировать) экспериментальные точки (x1, y1), (x2, y2), …, (xn, yn). Можно использовать полиномиальную регрессию, в которой предполагается, что зависимая переменная является полиномом (многочленом) некоторой степени от независимой переменной (напомним, что линейная зависимость является полиномом первой степени). Например, полиномом второй степени (знакомая всем из школьного курса алгебры парабола) будет зависимость вида y = a x2 + b x + c и задачей регрессии будет нахождение коэффициентов a, b и c. Выше мы рассмотрели простую регрессию (по одной независимой переменной) – линейную и нелинейную. Возможно также использование множественной регрессии – определения зависимости одной переменной от нескольких факторов (независимых переменных). Регрессионный анализ, помимо того, что он позволяет количественно описывать зависимость между переменными, дает возможность прогнозировать значения зависимых переменных – подставляя в найденную формулу значения независимых переменных, можно получать прогноз значений зависимых. При этом следует помнить, что построенная модель «локальна», то есть, получена для некоторых вполне конкретных значений переменных. Экстраполяция результатов модели на более широкие области значений переменных может привести к ошибочным выводам. 4. Снижение размерности. Часто в результате экспериментальных исследований возникают большие массивы информации. Например, если каждый из исследуемых объектов описывается по нескольким критериям (измеряются значения нескольких переменных – признаков), то результатом измерений будет таблица с числом ячеек, равным произведению числа объектов на число признаков (показателей, характеристик). Возникает вопрос, а все ли переменные являются информативными. Конечно, исследователю желательно было бы выявить существенные переменные (это важно с содержательной точки зрения) и сконцентрировать внимание на них. Кроме того, всегда желательно сокращать объемы обрабатываемой информации (не теряя при этом сути). Чем тут могут помочь статистические методы? Существует целый класс задач снижения размерности, цель которых как раз и заключается в уменьшении числа анализируемых переменных либо посредством выделения существенных переменных, либо/и построения новых показателей (на основании полученных в результате эксперимента). Для снижения размерности используется факторный анализ, а основными методами являются кратко рассматриваемый ниже метод главных компонент и многомерное шкалирование [183]. Метод главных компонент заключается в получении нескольких новых показателей – главных компонент, являющихся линейными комбинациями исходных показателей (напомним, что линейной комбинацией называется взвешенная сумма), полученных в результате эксперимента. Главные компоненты упорядочиваются в порядке убывания той дисперсии, которую они «объясняют». Первая главная компонента объясняет бó льшую часть дисперсии, чем вторая, вторая – бó льшую, чем третья и т.д. Понятно, что чем больше главных компонент будет учитываться, тем большую часть изменений можно будет объяснить. Преимущество метода главных компонент заключается в том, что зачастую первые несколько главных компонент (одна-две-три) объясняют бó льшую часть (например, 80-90 %) изменений большого числа (десятков, а иногда и сотен) показателей. Кроме того, может оказаться, что в первые несколько главных компонент входят не все исходные параметры. Тогда можно сделать вывод о том, какие параметры являются существенными, и на них следует обратить внимание в первую очередь. Решив задачи описания данных, установления сходства/отличий, проанализировав качественно и количественно зависимости между переменными и выявив существенные переменные, можно анализировать соотношение групп переменных и пытаться прогнозировать значения одних переменных в зависимости от значений других переменных или времени развития того или иного процесса. 5. Классификация. Обширную группу задач анализа данных, основывающихся на применении статистических методов, составляют так называемые задачи классификации. В близких смыслах (в зависимости от предметной области) используются также термины: «группировка», «систематизация», «таксономия», «диагностика», «прогноз», «принятие решений», «распознавание образов». Обсудим некоторые различия между этими терминами. В [183] предложено выделить три подобласти теории классификации: дискриминация (дискриминантный анализ), кластеризация (кластерный анализ) и группировка. Здесь мы кратко остановимся на сути этих методов. Тех же читателей, которые заинтересуются, как ими пользоваться, мы адресуем к соответствующей литературе [183, 241]. В дискриминантном анализе классы предполагаются заданными (например, обучающими выборками, для элементов которых известно, каким классам они принадлежат: например, больной-здоровый, правильно-неправильно, легкая степень заболевания – средняя – тяжелая и т.д.). Задача заключается в том, чтобы каждый вновь появляющийся объект отнести к одному из этих классов. У термина «дискриминация» имеется множество синонимов: диагностика (например, в медицине требуется поставить диагноз из конечного списка возможных диагнозов, если известны определенные характеристики пациента и известно, какие диагнозы ставились пациентам, вошедшим в обучающую выборку), распознавание образов с учителем, автоматическая (или статистическая) классификация с учителем и т.д. Если в дискриминантном анализе классы заданы, то кластеризация и группировка предназначены для выявления и выделения классов. Синонимами являются: построение классификации, таксономия, распознавание образов без учителя, автоматическая классификация без учителя и т.д. Задача кластерного анализа заключается в выделении по эмпирическим данным резко различающихся групп (кластеров) объектов, которые схожи между собой внутри каждой из групп. При группировке, когда резких границ между кластерами не существует, исследователю приходится самому вводить границы между группами объектов. Использование компьютера при анализе результатов эксперимента, несомненно, целесообразно[43]. С одной стороны, ряд статистических методов реализован в такой популярной программе, как Microsoft Excel для Window, входящей в стандартный комплект Microsoft Office, и установленной, наверное, на любом современном компьютере. С другой стороны, на сегодняшний день существует множество специальных профессиональных программ, позволяющих осуществлять статистический анализ данных. Среди последних можно выделить и рекомендовать к использованию такие наиболее распространенные пакеты статистического анализа как: Statistica, StatGraphics и SPSS. Однако, упомянутые программы достаточно сложны и требуют значительных временн ы х затрат для их освоения. Поэтому можно рекомендовать следующее: если для решения задач исследования хватает возможностей Excel, то можно ограничиться использованием этой программы (недостатком ее, правда, является практически полное отсутствие вразумительных объяснений, которые помогли бы неподготовленному пользователю понять, что получилось в результате расчетов). Если возможностей Excel недостаточно, то нужно обращаться к профессиональным статистическим программам. Каждая из них обладает своими достоинствами и недостатками (в одной более полно реализованы одни методы, в другой другие и т.д.). С методической точки зрения можно рекомендовать использовать программу StatGraphics (версии 5.0 и выше). Ее достоинством с позиций непрофессионального статистика является наличие «советчика», который разъясняет, что означает та или иная вычисленная величина, и что исследователю следует делать дальше. Необходимо подчеркнуть, что при описании статистических методов нами даны лишь вводные соображения. Заинтересованному читателю можно порекомендовать обратиться к более добротной и профессиональной литературе по этой тематике – см. [168, 169, 183, 241], а также ссылки в этих работах. Завершив описание статистических методов, отметим, что часто при организации исследования сложных явлений и процессов и обработке его результатов возникает необходимость использования агрегированных (комплексных) и/или векторных оценок. Рассмотрим кратко их специфику. Агрегированные оценки. Во многих экспериментах имеется значительное число (десятки, сотни, а иногда и тысячи) объектов (субъектов). В результате измерения их показателей получается набор их частных оценок. Понятно, что сравнивать между собой и анализировать одновременно все частные оценки не всегда возможно и целесообразно, так как всегда существует их разброс, обусловленный неконтролируемым различием объектов эксперимента. Поэтому для того, чтобы, во-первых, получить обозримое число характеристик и, во-вторых, для того, чтобы сгладить индивидуальные колебания, используют так называемые агрегированные (коллективные, групповые, производные) оценки. Например, если имелись частные (индивидуальные) оценки отдельных индивидуумов, то агрегированной оценкой будет «среднее» значение для их группы. Использование кавычек не случайно, так как получение агрегированных оценок на основании частных является их преобразованием, и преобразование это следует выполнять корректно. Приведем некоторые корректные процедуры агрегирования для наиболее распространенных в экспериментальных исследованиях показателей. Для величин, измеренных в шкале отношений, наиболее типичным является вычисление среднего арифметического по группе. Эта процедура вполне корректна, и обычно ее реализация не вызывает затруднений. Наибольшее число ошибок возникает при агрегировании показателей, измеренных в порядковых шкалах. Отметим, что не следует складывать, вычитать, умножать или делить баллы друг на друга, да и на чтобы то ни было – все это абсолютно бессмысленные операции. В порядковой шкале для «усреднения» обычно используют медиану [169, 183]. Если имеется набор индивидуальных баллов, то агрегированной характеристикой группы будет число ее членов, получивших тот или иной балл[44]. Аналогичным образом агрегируется и информация о выделении уровней – если введены три уровня (например, уровни знаний: низкий, средний и высокий) и имеется информация о распределении всех членов нескольких групп (контрольных или экспериментальных) по этим уровням, то агрегированной информацией об объединенной группе будет число ее членов, обладающих тем или иным уровнем (вычисляемое как сумма по всем группам числа их членов, обладающих данным уровнем) – соответствующие примеры можно найти в [168, 169]. Если агрегирование частных оценок по группе экспериментальных объектов (субъектов) производится с целью получения характеристик группы в целом, то для описания различных аспектов, свойств и т.п. одного и того же объекта используются так называемые векторные оценки. Векторные оценки. Нередко встречаются случаи, когда какое-либо изучаемое явление, процесс характеризуется несколькими показателями – вектором показателей. Например, при оценке труда какого-нибудь рабочего используются показатели качества труда (точности обработки деталей) и производительности труда (время выполнения операций). При этом часто возникает вопрос о возможности однозначной оценки этого явления, процесса или изучаемых их свойств одной величиной – комплексной оценкой. Например, во многих спортивных состязаниях победитель выявляется по комплексной оценке – сумме очков, баллов, набранных на отдельных этапах состязания или в отдельных играх, в многоборье – в отдельных видах спорта. На практике комплексные оценки встречаются довольно часто и, очевидно, без них не обойтись, хотя способы их определения нередко и вызывают множество недоуменных вопросов. Но в любом случае такие комплексные оценки, применяемые в повседневной жизни, являются либо результатом определенных общественных соглашений, которые признаются всеми участниками, либо установлены каким-либо нормативным актом определенного директивного органа – министерства, ведомства и т.д. и в силу этого также признаются всеми заинтересованными лицами. Другое дело – применение комплексных оценок в научном исследовании. Здесь сразу на первое место встает вопрос о научной, в том числе математической, строгости применяемой оценки. В частности, например, не вызывает сомнений возможность использования в организации труда такой комплексной оценки, как суммарные затраты времени на выполнение тех или иных технологических операций. Здесь суммируются однородные величины, измеренные в шкале отношений. Между тем, при использовании шкалы рангов (порядковой шкалы) суммирование баллов довольно часто встречается в исследованиях по педагогике, психологии, медицине, биологии и другим наукам (см. анализ корректности использования методов анализа данных в диссертациях по педагогике [169] и медицине [168]). Так, в одной «методологической» публикации для оценки эффективности деловой игры была использована следующая «формула»: Р = 50 – К – (В – 40), где Р – «комплексная» оценка в баллах, 50 – максимально возможное количество баллов, К – количество замечаний, сделанных ведущим, В – время в минутах. Как видим, здесь уж, что называется, «смешались в кучу кони, люди...». Под знак суммы (разности) поставлены совершенно разнородные величины: баллы, количество замечаний, время, безразмерные числа. До
|