![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Теория однофакторного дисперсионного анализа
При сформулированном выше допущении наш «чёрный ящик» выглядит (см. рисунок) очень просто. Здравый смысл и очевидные соображения подсказывают, что для вы- явления влияния фактора А на величину от- ИССЛЕДУЕМАЯ СИСТЕМА клика следует несколько раз (например, n раз) измерить этот отклик при разных уровнях Фактор А Отклик У фактора А (например, при а1, а2,.. а i,..., а n), получив при этом n штук (y 1, y 2, ….. yi…, yn), Рис. 7.3 по всей видимости, разных значений отклика. Очевидно, что каждое yi из этих значений будет определяться реальным средним значением Y (n) Ср = Фиксируем этот факт математически: yi = Y Ср ± Δ yi ± έ ип. Далее Y (n) Ср будем обозначать символом Yn, а έ ип – символом έ n Соотношение yi = Yn ± Δ yi ± έ n равносильно (yi – Yn) = ± Δ yi ± έ n и говорит о том, что дисперсия σ 2 Генеральной совокупности слагается из двух составляющих: - σ έ 2 – дисперсии, обусловленной неточностью измерений έ n и - σ А2– дисперсии, обусловленной возможным влиянием фактора А. Аддитивность дисперсии позволяет записать: σ 2 = σ А2+ σ έ 2 или σ А2= σ 2– σ έ 2. На базе множества (yi – Y n), где i = 1, 2, 3… n, можно сформировать упомянутую выше исправленную выборочную дисперсию sи2 = Для нахождения выборочной оценки s2иέ для дисперсии σ έ 2 необходимо создать такую выборку { ykj } m из Генеральной совокупности { yij }, в которой разброс значений был бы обусловлен только ошибками измерений. Это мог бы быть, например, набор { ykj } m из m значений отклика, полученных в одинаковых условиях эксперимента, включая и постоянство уровня фактора А (один из столбцов: а i = а k = Const, а j=1, 2, 3,.., m). Эта выборзка позволяет вычислить её (выборки) параметры Y k= Однако, найденную на базе такой выборки по соответствующей формуле исправленную выборочную дисперсию s2иέ m уже нельзя вычитать из sи2, ибо они не есть слагаемые одной оценки Генеральной дисперсии. Они – параметры разных выборок. Из этого следует, что в ходе эксперимента необходимо получить ещё одну выборку { yij }q – такую, на базе которой можно вычислить и s2иqέ , и sq2. Реализовать это можно следующим образом. Выполнив эксперимент, который был выше представлен первым и предполагал, что ykj = Y k ± Δ kj ± έ kj, и получив m значений отклика, нужно проделать эту же операцию n раз и получить n малых выборок типа{ yij } m, где j=1, 2, 3,.., m, и i=1, 2, 3,.., n. Получившаяся новая большая выборка { yij }q – выборка из Генеральной совокупности с объёмом q = nm. то есть для неё теперь Y(nm) Ср ≡ Yq = В итоге мы можем записать: σ q2 = σ А 2 + σ έ 2, где: - σ έ 2 – дисперсия, обусловленная инструментальной погрешностью, которая не зависит от индекса измеряемого параметра, а σ q2 ≡ σ 2– общая дисперсия большой Генеральной совокупности { y }, выборочной оценкой для которой теперь будет s q2 = (Σ q): f q= (Σ nm): fnm = = - f q= nm–1 ≡ fnm, - (Σ q) = СК nm– КЧ nm ≡ СКq – КЧq = (Σ nm) - СКq = - КЧq = Общая дисперсия σ 2, как и всегда, выглядит составленной из дисперсии σ qип2 ≡ σ έ 2, которая обусловлена только случайными факторами, и дисперсии σ А2, которая обусловлена только изменениями уровня фактора А, то есть: σ 2= σ А2 + σ έ 2. Если теперь на базе любой части { ykj) m общей выборки { yij }q, которая получена при одном и том же значении фактора А, то есть на базе малой выборки { ykj) m при i=k, вычислить исправленную выборочную дисперсию s 2έ m = Таких оценок здесь будет n штук, и каждая из них будет характеризовать разброс значений отклика, обусловленный внутри своей малой выборки только случайными факторами. Но n штук малых выборок образуют большую выборку из единой Генеральной совокупности всех возможных значений отклика. В таких случаях математическая статистика позволяет усреднять групповые оценки s 2έ m, а результат усреднения s 2έ q – рассматривать в качестве выборочной оценки s 2έ q дисперсии σ έ q2≡ σ έ 2≡ σ вэ2, которую ещё называют дисперсией воспроизводимости эксперимента (s 2έ q ≡ s 2вэ ~ σ έ 2). Итак, s 2έ q ≡ s 2вэ = То есть s 2 вэ = = Количество степеней свободы дисперсии воспроизводимости f έ в= n (m- 1). Особо подчеркнём, что СКq= Действительно, КЧq= Всё это означает, что мы можем переписать выражение для выборочной оценки дисперсии воспроизводимости (повторим, что именно так в теории эксперимента часто называют дисперсию, обусловленную множеством сопровождающих эксперимент случайных факторов, включая ошибки измерений): s 2вэ ≡ s 2έ q = - (Σ έ )q = [СКq – КЧА] - СКq = - КЧА = В этих условиях, в условиях одной большой выборки, где σ 2 = σ А 2 + σ έ 2, а σ έ 2 ≡ σ έ q, полученные выборочные оценки уже можно комбинировать, то есть выразить: s 2 – s 2вэ ~ σ qА2, то есть s 2 – s 2вэ ~ σ А 2, где s 2 ~ σ 2, s 2вэ ~ σ έ 2 и s 2 = - s 2 = s q2 = (Σ q): f q = (Σ): f при (Σ q)≡ (Σ) = [СК – КЧ] и f q ≡ f = nm– 1; - s 2вэ≡ s 2έ q= (Σ έ q): f έ q = (Σ έ ): f έ при (Σ вэ) =[СКq – КЧq] = [СК – КЧА] и f вэ = n (m– 1). Таким образом, составляющие смешанной оценки для σ 2 разделены, а
Но это ещё не вся информация, которую можно извлечь из результатов только что представленного здесь теоретически (мысленного) однофакторного эксперимента, в котором использовалась выборка объёмом q = m х n. На базе каждой из n введённых в рассмотрение выше малых выборок, кроме представленной выше собственной групповой дисперсии s 2έ m, можно вычислить групповое среднее значение отклика Ykm = s 2нвыб = ( при вычислениях по формуле Ymk = При справедливости соотношений:
S мг ~ σ А2 + Переписав последнее соотношение в несколько ином виде, получаем: s 2 мг = откуда следует более точная по сравнению с полученной на предыдущем листе выборочная оценка s 2А дисперсии σ А2, обусловленной возможным влиянием исследуемого фактора А:
Приглядимся более внимательно к выборочной оценке s 2мг для σ мг 2 s 2мг = Во-первых, как обычно, s 2 мг = (Σ мг): f мг) Здесь f мг = n– 1, следовательно, (Σ мг) = m Во-вторых, В-третьих, =[ В итоге имеем: (Σ мг) = m [ Вспомним теперь ранее полученные соотношения: (Σ q) ≡ (Σ) = [СК – КЧ] и (Σ έ ) = [СК – КЧА]. Сопоставив их с только что полученным (Σ мг) = [КЧА – КЧ], обнаруживаем: (Σ q) – (Σ έ ) = [СК – КЧ – СК + КЧА] = [КЧА – КЧ] = (Σ мг). Мы, следовательно, выяснили, что после вычисления выборочных оценок дисперсий mσ А2 + σ έ 2 и σ 2 можно непосредственно вычислить остаточную сумму (Σ мг), которая потребуется для последующего нахождения выборочной оценки s2вэ дисперсии воспроизводимости σ вэ2 и уточнить оценку для σ А2. Всё это означает, что представленный выше теоретически однофакторный эксперимент позволяет найти две (одна из которых уточняет другую) выборочные оценки для дисперсии σ А2, обусловленной влиянием фактора А. Следовательно, такой эксперимент способен решить основную задачу дисперсионного анализа – задачу разделения составляющих общей дисперсии, а только что рассмотренные соотношения позволяют выполнить все необходимые вычисления, используя измеренные в ходе опытов значения { ylj } отклика. Проблему решают три промежуточных интегральных параметра одной и той же выборки СК, КЧ, КЧА.
Планирование эксперимента при однофакторном дисперсионном анализе. Представленные в предыдущем параграфе теоретические соображения, казалось бы, полностью определяют план эксперимента при однофакторном дисперсионном анализе. Этот план должен выглядеть в форме прямоугольной таблицы (см. таблицы ниже), в План-матрица однофакторного эксперимента при дисперсионном анализе Уровни фактора А
соответствующие клеточки которой по ходу эксперимента будут вписываться измеренные значения отклика – элементы множества { yij }. Подготовка план-матрицы представляет собой очень малую (только формализованную в рамках приведённых в предыдущем параграфе теоретических рассуждений) часть планирования эксперимента. Большую часть планирования составляют операции, связанные с подготовкой объекта эксперимента, средств измерения, с обеспечением необходимых условий проведения опытов и сохранения их неизменными в ходе всего эксперимента, а также с правильным оформлением сопровождающей эксперимент документации (соответствующим образом оформленная методика, журнал регистрации хода и данных опытов, передача смен и т. п.). Эти аспекты планирования (традиционные и рутинные) здесь не рассматриваются. Более существенными для нас выглядят вопросы технологии обработки данных, которые получают в ходе опытов, и оформления итогов эксперимента в целом. Такие итоги оформляются в таблицу, макет которой приведён на следующем листе. Вначале представлены форма и содержание Итоговой таблицы, но не её окончательный вид и не тот вид, в котором она предстанет перед экспериментом. План эксперимента и Итоговую таблицу (см. следующий лист) целесообразно подготовить заблаговременно в форме единой электронной (например, в Exzele) рабочей таблицы. Первые слева колонки таблицы (в объёме представленной выше план-матрицы) следует оставить («зарезервировать») для последующего внесения в них (перенос из рабочего журнала после окончания эксперимента) измеренных в опытах значений { yij } отклика. До окончания эксперимента все m строк в n столбцах исходной таблицы будут оставаться незаполненными. Незаполненными до конца эксперимента будут оставаться третий и пятый столбцы Итоговой таблицы, (её макет представлен ниже), предназначенные для внесения Макет итоговой таблицы однофакторного эксперимента
Примечаие: f έ = flj - f А j = nm-1- n+1 = n (m-1) в нихпромежуточных и окончательных результатов обработки экспериментальных данных. Поэтому заготовленная в рамках единой электронной таблицы Итоговая таблица будет выглядеть иначе (См. ниже). В ней заполнены только те колонки, данные для которых уже известны на момент составления плана, – известны из представленного в параграфе 7.1 теоретического анализа, который, конечно же, всегда предшествует эксперименту. Что касается “ пустых» клеток таблицы, то они пусты только внешне. На самом деле в них в ходе программирования эксперимента и вносятся (в режиме записи «невидимых» формул) представленные выше на макете соотношения. По этим соотношениям электронная таблица подсчитает и автоматически внесёт в соответствующую клетку таблицы получившийся там результат обработки данных. Итоговая таблица однофакторного эксперимента
В нижней правой клетке должна «сработать» формула: s А2 = Однако, такой автоматизм следует программно подготовить. Рассмотрим, что для этого следует предусмотреть в этой же электронной таблице. В первой сроке третьего столбца Итоговой таблицы, как это показано на её макете, должна находиться итоговая сумм всеобщей дисперсии (Σ uj), которая вычисляется по формуле: (Σ lj) = [СК lj– КЧ lj ]. Именно эта формула и должна быть записана в этой, якобы “ пустой ” ячейке электронной таблицы. Тогда сумма появится в Итоговой таблице автоматически. Но для записи этой формулы в электронную таблицу нужно знать номера двух ячеек этой же электронной таблицы, в которых предварительно заготовлены СК lj и КЧ lj. Следовательно, в ходе подготовки плана следует предусмотреть ещё две рабочие ячейки, и в одну из них записать формулу СКi j = Такие же рассуждения справедливы и относительно формул, которые где-то надо записать, чтобы нужные во второй и третьей строках этого же столбца итоговые формулы ((Σ έ ) = [СК lj– КЧА] и (Σ мг) = [КЧА – КЧ lj ]) «сработали ” соответствующим образом. Все подобные формулы сложны и громоздки для использования в электронных таблицах. Поэтому на практике следует действовать иначе: вначале “ запасаться ” промежуточными величинами, которые считаются по относительно простым формулам. В данном случае поступают следующим образом. В строке электронной таблицы, следующей сразу после план-матрицы (на приведённой ниже таблице план-матрица обведена «жирной» линией, а строка помечена символом Аl) в каждой из n ячеек размещается одна та же формула А l = Ниже в рабочей таблице следует продублировать ячейки основной план-матрицы, разместив в каждой из них алгоритм возведения в квадрат значений отклика, измеренного в каждом опыте. Эти квадраты ({ yij 2}) потребуются в формуле, по которой электронная таблица в (n +2)ой ячейке этой последней строки вычислит и здесь же “ запасёт ” СК ij. Присмотревшись внимательно к дополненной таким образом исходной план-матрице, легко обнаружить, что в ней уже присутствуют не только все промежуточные величины, но и необходимые для вычисления представленных выше трёх итоговых сумм ((Σ ij), (Σ έ ) и (Σ мг)) их основные слагаемые КЧ ij, СК ij и КЧА. Номера именно этих трёх ячеек должны фигурировать в алгоритмах вычислений, которые будут вписываться в якобы «пустые» ячейки третьей колонки Итоговой таблицы эксперимента, подготавливаемой в ходе его планирования. Подготовка электронной таблицы для учёта и автоматизированной обработки опытных данных в ходе эксперимента при однофакторном дисперсионном анализе n– количество уровней фактора А, m – количество опытов на каждом уровне. Уровни фактора А
Рабочие оценки дисперсии (s 2 – s 2вэ) ~ σ А 2– грубая оценкаи
|