Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Общие теоретические соображения. При проведении двухфакторного дисперсионного анализа опираются на более сложную модель «чёрного ящика»






При проведении двухфакторного дисперсионного анализа опираются на более сложную модель «чёрного ящика», (см. рисунок) исследуемой системы.

 


Здравый смысл и очевидные соображения

ИССЛЕДУЕМАЯ подсказывают, что для выявления одновремен-

СИСТЕМА ного влияния факторов А и В на величину отк-

Фактор А Отклик У лика y следует несколько раз измерить этот

отклик при разных уровнях фактора А (на при-

Фактор В мер: а1, а2, а3, а4,....аn) при одном и том же

(например, при bj) уровне фактора В, получив

Рис. 7.4 при этом n штук (y 1j, y 2j, y 3j, y 4j,.. y nj), по всей видимости, разных, значений отклика, а потом проделать это же ещё m – 1 раз, изменяя каждый раз уровень фактора В. Очевидно, что каждое конкретное значение yij из множества { yij } измеренных значений отклика будет складываться из реального среднего значения Y, прибавки к нему ± Δ yi, обусловленной влиянием (если такое влияние имеет мес- то) фактора А на данном уровне, (уровне аk) такой же прибавки ± Δ yu, обусловленной влиянием (если такое влияние имеет место) фактора В, на очередном (b j) уровне и ошибки ± έ ипизмерительного прибора.

Фиксируем этот факт математически: yij = Y ± Δ y i ± Δ y j ± έ ип. Это равносильно

(y ij Y) = (± Δ yi ± Δ yj ± έ ип) и говорит о том, что дисперсия σ 2 Генеральной совокупности { y } реальных значение отклика слагается из трёх составляющих:

- σ έ 2 – дисперсии, обусловленной неточностью измерений ( σ έ 2≡ σ ип2 );

- σ А2 – дисперсии, обусловленной ожидаемым влиянием фактора А;

- σ В2 – дисперсии, обусловленной ожидаемым влиянием фактора В.

Аддитивность дисперсии позволяет записать: σ 2 = σ А2 + σ В2 + σ έ 2.

Таким образом, и здесь при обработке данных эксперимента, как и раньше, встаёт задача разделения составляющих общей дисперсии.

Рассмотрим способы такого разделения.

Прежде всего заметим, что для обозначения количества уровней второго фактора мы здесь используем символ m, которым в первом разделе было обозначено количество повторных измерения при одном и том же значении фактора А. Это «старое» значение символа m наряду с «новым» сохраняется и здесь, что позволяет сохранить «старую» форму записи основных математических соотношений для случая двух факторов.

Теперь продолжим рассмотрение.

Предварительно следует найти выборочную оценку (s έ 2s 2ип) для дисперсия σ έ 2, а потом s В2 и s А2 и отделить их друг от друга.

Начнём с вычисления общей выборочной дисперсии s lj 2s q 2s2 на базе полученной в ходе представленного выше эксперимента выборки { yij }, объёмом q = nm.

На базе множества разностей (yij Y), где Y= (ylj), i = 1, 2, 3…k,, n, иj =1, 2, 3,.l,, m можно сформировать исправленную выборочную дисперсию

s ij 2s 2mns 2q s 2 = [ (yij)2 ( yij)2] =

= ( ij): fij = [СК ij КЧ ij ]: fij ,, где:

- q = nm – объём выборки и потому fijf 2 = nm –1,

- СК ij ≡ СК= (yij)2 сумма квадратов всех откликов, а

- КЧ ij ≡ КЧ = ( yij ) 2 – усреднённый по всей выборке

квадрат суммы откликов.

Величина s 2 является выборочной оценкой (s 2 ~ σ 2) дисперсии σ 2 Генеральной совокупности реальных значений отклика. Но и здесь (в случае двух факторов) это –

смешанная оценка (s 2 ~ σ А 2+ σ В 2+ σ έ 2).

Задача разделения дисперсий остаётся актуальной и усложняется. Решать её мы начнём, введя (как и раньше) в рассмотрение n малых выборок { ykj } из общего массива измеренных значений отклика, которые получены при неизменных значениях фактора А. На базе каждой из таких малых выборок, кроме собственной групповой дисперсии s k 2 можно вычислить групповое среднее значение отклика Yk: = yij. Их (и групп, и средних) будет по n штук, все они будут разными, а средние ещё и отличающимися от всеобщего среднего Y = yij . Это означает, что будут существовать n штук разностей типа (Yk –Y), на базе которых для большой выборки можно вычислить некую выборочную дисперсию (Yk –Y)2. А она является оценкой (s 2(Yk) ≡ s 2 ks Аε 2 )

межгруппового разброса разброса значений групповых средних Yk относительно всеобщего среднего Y. Очевидно, что этот разброс обусловлен как влиянием фактора А, так и влиянием случайных факторов (потому и индекс «Аε»).

Математически это можно записать так: (Yk –Y)2 ~ σ А 2 + σ Аип 2 .

Влияние случайных ошибок σ 2Аип = σ έ 2 здесь уменьшено в m раз потому, что они входят в левую часть этого соотношения через вычисления (по формуле Yk = yij) группового среднего, при которых (при вычислениях) такие ошибки усредняются. Переписав обсуждаемое соотношение в целом в несколько ином виде (умножив обе его части на m), получаем: s 2 ks Аε 2 = (Yk–Y)2 ~А 2 + σ έ 2.

 

Из этого следует, что роль итоговой суммы (∑ k) в выражении для выборочной дисперсии s 2Аε = (∑ Аε 2): f Аε , обусловленной ожидаемом в этом эксперименте фактора А, играет величина m (Yk–Y)2, a fkf Аε = n – 1.

Это нам уже встречалось в параграфе 7.1, где мы получили:

(∑ k) = m [ (Yi)2 ( Y)2] = m { КЧА КЧ ij },

то есть (∑ k) ≡ (Σ Аε ) = КЧА– КЧ ij = КЧА– КЧ.

Проведём точно такие же рассуждения относительно малых выборок { yi l } из общего массива { yij }, измеренных значений отклика, каждая из которых получена при неизменных значениях (например, при J = l) фактора В. Обнаруживаем, что таких выборок (строчных) будет m и что на их базе можно получить ещё одну выборочную оценку соответствующего межгруппового разброса групповых средних разброса Y l относительно всеобщего среднего Y, обусловленного ожидаемым влиянием фактора В.

s 2Вε = (Yl –Y) 2 ~ n σ В2 + σ έ 2.

Из этого следует, что роль итоговой суммы (∑ l)) ≡ (Σ Вε ) в выражении для выборочной дисперсии s 2 l = (∑ Вε ): f Вε , обусловленной ожидаемом в этом эксперименте фактора B, играет величина

n (Yl–Y)2 a f Вε = m– 1.

И здесь в итоге имеем:

Вε ) = n [ (Yl)2 ( Y)2] = n { КЧВ КЧ ij } = [КЧВ – КЧ].

Обобщаем: s 2Аε = (Yk–Y)2 = [КЧА– КЧ] ~А 2 + σ έ 2 и

s 2Вε = (Y l –Y)2 = [КЧB – КЧ] ~ nσ В2 + σ έ 2.

С одой стороны, очевидно, что мы нашли раздельные выборочные оценки для дисперсий, обусловленных влияниями каждого фактора. С другой стороны, обе эти оценки – смешанные, в них присутствуют (замешаны) случайные ошибки. Всё это, казалось бы, заставляет нас продолжить поиск несмешанной выборочной оценки для дисперсии воспроизводимости s вэ2 = (Σ вэ): f вэ.

Но, похоже, что делать дальше ничего не нужно. Ведь у нас есть (см. выше) опыт непосредственного нахождения остаточной суммы квадратов дисперсии воспроизводи-мости путём вычитания (вспомните однофакторный эксперимент, для которого мы получили (Σ вэ) = [СК КЧА].

Конструируя аналогичным образом (Σ вэ) для двухфакторного эксперимента, получаем: (Σ вэ) = (Σ ij) – (Σ Вε ) – (Σ Аε ), а при подробном развёртывании составляющих находим: (Σ вэ) = [СК ij КЧ ij КЧА+ КЧ ij КЧB + КЧ ij ], то есть

вэ) = [СК ij КЧА КЧB + КЧ ij ].

При таком подходе количество степеней свободы f вэ для выборочной дисперсии воспроизводимости (s вэ2) должно быть f вэ= flj – (f А+ f B) =

= nm-1- (n -1 + m-1) = nm-1- n +1- m+1 =

= nm-1- nm = n (m-1) - (m-1) =(m-1) (n -1).

Следовательно, несмещённой выборочной оценкой для дисперсии воспроизводимости двухфакторного эксперимента должна стать величина

s вэ2 = (Σ вэ): f вэ = [[СК ij КЧА КЧB + КЧ ij ] =

= [[СК КЧА КЧB + КЧ].

.Всё это говорит о том, что и при планировании двухфакторного эксперимента можно воспользоваться точно такой же прямоугольной план-матрицей, которая строилась при планировании однофакторного эксперимента, с тем, однако, отличием, что вместо m –кратного повторения опытов при каждом значении фактора А проводятся те же m опытов при разных уровнях фактора В (см. макет план-матрицы на следующем листе). В связи с этим, немного изменятся и алгоритмы обработки данных.

Наглядным образом-аналогом макета таблицы для данных двухфакторного эксперимента могла бы послужить m -этажная стеллаж-этажерка, на полках которой (друг под другом) размещены по n штук ячеек, по которым «разложены» результаты измерений отклика: весь массив { yij }, мощностью nm.

Изменения алгоритмов обработки данных мы рассмотрим в следующем параграфе, а сейчас вспомним, что последнюю формулу мы «сконструировали по аналогии», опираясь на теоретический анализ однофакторного эксперимента. Убедительней было бы найти подтверждение правомерности такой аналогии путём анализа условий двухфакторного эксперимента, что явилось бы основанием для опоры на эту же аналогию и при трёх-, и при четырёх- (и т. д.) факторном эксперименте. При многофакторном эксперименте вообще. Ниже мы таким анализом и займёмся.

Обратимся ещё раз к малым выборкам. Ещё раз взглянем на одну из n уже рассмотрены выше малых выборок (вертикальный столбец) из общего массива { yij } измеренных значений отклика, которые получены при неизменных значениях фактора А. Но теперь взглянем уже под другим углом зрения: рассмотрим разброс измеренных значений yij относительно группового среднего Yi (Yi = yij) внутри каждой малой выборки.

При однофакторном анализе такой разброс был обусловлен только случайными ошибками, но здесь при смене номера опыта одновременно изменяется и уровень факто-ра В (этим и объясняется наличие индекс «В» у выборочной дисперсии s 2 Вls 2 В ε ). Следовательно, только что представленная выборочная дисперсия является смешанной оценкой для суммы двух дисперсий такой малой выборки:

- дисперсии σ В, обусловленных изменениями уровня фактора В, и

- дисперсии σ έ , обусловленной случайными ошибками измерений.

В связи с этим можно записать: s 2Вэ = (yijYi) 2 ~ σ В 2 + σ έ 2.

Легко заметить, что это соотношение справедливо для любой и, следовательно, для каждой малой выборки (столбца) рассматриваемого здесь типа. Следовательно, усреднив это соотношение по всем таким выборкам, мы получим более точную выборочную оценку, для которой уже не нужен исходный «столбиковый» индекс.

s 2Ввэs 2вэ = s 2В i = (yljYl)2 ~ σ В2 + σ έ 2.

Или: s 2вэ ~ σ В 2 + σ έ 2, то есть (yijYl) 2 ~ σ В 2 + σ έ 2.

Это – хороший промежуточный результат в наших стараниях разделить дисперсии разного происхождения, потому, что он даёт возможность, рассмотрев два разных соотношения: (yijYi)2 ~ σ В 2+ σ έ 2 и (Yj –Y)2 ~ σ В 2 + σ έ 2,

и разность левых ( (yljYl)2 (Yj –Y)2) их частей. При этом, разность левых частей сравниваемых нами здесь оценочных соотношений:

[ (yijYl)2n (Yj –Y)2] остаётся выборочной оценкой разности правых их частей:

Σ В 2 + σ έ 2 – σ В2 σ έ 2 = σ έ 2 σ έ 2 = σ έ 2 (1 – ) = σ έ 2().

Это, в свою очередь, позволяет (не «конструировать», а математически точно выразить раздельную (несмешанную) оценку для дисперсии σ έ 2, обусловленной только случайными ошибками.

Действительно, умножив обе только что представленные разности на ,

получаем: έ 2) = σ έ 2 – с одной стороны, и

[ (yijYl)2 (Yj – Y)2] =

= [ (yljYl)2n (Yj – Y)2] с другой.

Всё это означает, что сконструированная здесь оценка

s 2вэ= [ (yijYl)2n (Yj –Y)2], которая вычисляется только по данным эксперимента, является несмешанной выборочной оценкой для дисперсии воспроизводимости эксперимента (s 2вэ ~ σ 2вэ ≡ σ έ 2).

По аналогии с предыдущим параграфом, этот же результат можно представить в несколько иной форме:

s 2вэ = ( вэ): f Ввэ= [СК вэ КЧ вэ], где

( вэ ) = [СК вэ КЧ вэ ] – пока удобные и чисто формальные обозначения,

в которых: СК вэ= (yijYl)2, а КЧ вэ= n (Yj –Y)2.

С каждым из этих соотношений будем разбираться отдельно.

СКвэ= (yijYl) 2 = [ (yijYi) 2] = [ (yij)2 ( yij)2] =

= (ylj)2 ( yij)2 = СК ij (A l)2 = СК –КЧА.

Второе: КЧвэ= n (Yj –Y)2 = n [(Yj)2 2 YjY + n ( yij)2] =

= n (Yj)2 2 n ( ylj)( yij) + n ( yij )2 1 ] =

= ( yij)2 2 ( yij)2 + nm ( yij)2]=

= КЧB ( yij)2] = КЧB КЧ.

Таким образом, записанное выше формально, соотношение:

( вэ) = [СК вэ КЧ вэ] = (yijYi)2 – n (Yj –Y)2 уточняется:

( вэ) = [СК вэ КЧ вэ] = СК –КЧА КЧB + КЧ.

Теперь вспомним, что при однофакторном эксперименте

вэ) = [СК ij КЧА] = (Σ lj) – (Σ А) = [СК ij КЧ ij КЧА+ КЧ lj ] и сопоставим с тем результатом, который получили только что.

С одной стороны, здесь (в двухфакторном эксперименте), действуя по аналогии, мы получили: (Σ вэ) = [СК–КЧА КЧ B + КЧ].

С другой стороны, только что строго показали (Σ выб) = (Σ lj) – (Σ А) – (Σ B).

Но последнее можно переписать:

вэ) = (Σ lj) – (Σ А) – (Σ B) = [СК ij КЧ ij ] – [КЧА– КЧ ij ] – [КЧB– КЧ ij ] или

вэ) = [СК КЧА КЧB + КЧ].

Оба результата совпадают. Следовательно, приведённые выше математические упражнения показали, что и при однофакторном, и при двухфакторном экспериментах остаточная сумма квадратов (Σ вэ), необходимая для вычисления дисперсии воспроизводимости, может быть вычислена по данным эксперимента непосредственно путём вычитания остаточных сумм факторных дисперсий из остаточной суммы общей дисперсии.

Мы убедились, что выделенные ранее промежуточные величины (СК и КЧ) оказались полезными и при рассмотрении двухфакторного эксперимента. Пригодятся они нам и далее.

При обобщении на случай многих (S) факторов полученный выше результат будет

выглядеть следующим образом: ( вэ) = [СК КЧ i + КЧ].

В этом выражении у величин: ( вэ), СКи КЧ не проставлены (из-за громоздкости) полагающиеся там по S штук индексов.

Вспомним теперь полученные ранее смешанные оценки:

s 2Аε ~А2 + σ έ 2 и s 2 В = ~ n σ В2 + σ έ 2

Вычислив s 2вэ можно записать:

s2Аε ~А2 + s2вэ и s2 Вε ~ n σ В2 + s2вэ или

{(s 2Аε s 2вэ): m} ~ σ A2 и {(s 2Вε s 2вэ): n } ~ σ В 2

Таким образом, представленный в данном параграфе теоретически двухфакторный эксперимент способен представить достаточно данных для вычисления раздельных выборочных оценок для всех слагаемых общей дисперсии (σ ij 2 = σ А 2+ σ В2 + σ έ 2) Генеральной совокупности возможных значений отклика исследуемой системы.

Планирование эксперимента при двухфакторном дисперсионном анализе

Представленные в предыдущем параграфе теоретические соображения определяют форму плана эксперимента при двухфакторном дисперсионном анализе. Этот план должен выглядеть в форме прямоугольной таблицы, в клеточки которой по ходу эксперимента будут вписываться измеренные значения отклика множество { yij }. Она (матрица), как и в случае однофакторного эксперимента, станет, основой рабочей электронной таблицы, способ построения и использования, которой в основном уже известны, но ещё раз будут рассмотрены ниже, а сейчас уместно начать с Итоговой таблицы двухфакторного эксперимента (её макет представлен на следующем листе).

На этом макете в клетках-ячейках показаны теперь уже (после теоретического анализа) очевидные соотношения, которые должны быть внесены в них в виде формул для вычисления окончательных итогов.

Такую таблицу, как и в предыдущем случае, следует подготовить на основе изложенных выше теоретических соображений в рамках единой электронной таблицы совместно с план-матрицей двухфакторного эксперимента.

 

Макет план-матрицы двухфакторного эксперимента

n уровней фактора А

m уровней фактора В a1 a2 a 3 a l an
b1 y11 y21 y31 ….y l 1…. уn1
b2 y12 y22 y32 ….y l 2…. yn2
b3 y13 y23 y33 ….y l 3…. yn3  
…. bj ….. ….. y1j ….. … y2j….. …. y3j….. ……. ….y l j… …... ….. ynj …..
bm y1m ym2 y3m ….y l m…. ynm


Эта таблица, как и план (который и теперь будет похож на стеллаж-этажерку), будет выглядеть несколько сложнее, чем при однофакторном эксперименте. Это связано с дополнительной необходимостью вычисления построчных промежуточных величин (Bj, Bj2 КЧB, и др.) для появившегося здесь второго фактора В.

Такая рабочая таблица может выглядеть и иначе. Важно только, чтобы в ней была предусмотрена возможность вычисления в определённых ячейках используемых в ней промежуточных величин:

СК lj = (yij)2, КЧA = (A l)2, КЧB = (Bj)2 и КЧ lj = ( yij)2.

Сославшись в формулах соответствующих ячеек-клеток Итоговой таблицы на номера ячеек рабочей электронной таблицы, в которых приведены только что перечисленные формулы, мы тем самым обеспечиваем возможность автоматического заполнения Итоговой таблицы двухфакторного эксперимента в момент записи в план-матрицу результата последнего измерения.


 


Макет рабочей электронной таблицы

для сопровождения двухфакторного эксперимента

n – количество уровней варьирования фактора А.

m – количество уровней варьирования фактора В.

 

Уровни Фактора В (m с трок) Уровни фактора А a1, a2, …a l, …………an (n колонок) Полная сумма откликов ylj Общий корректирующий член КЧ lj = ( yij)2
b1 b2 b3 ….. bj ….. bm ….y l 1…. ….y l 2…. ….y l 3… ….. ….y l j… …..y l m Сумма откликов в каждой строке …. …. Bj = ylj …. ….. Квадрат суммы в каждой строке …. …. (Вj)2 = ( yij)2 …. …..
  Сумма откликов в каждом столбце А l = yij Полная сумма сумм квадратов (A l)2 Корректирующий член для А КЧA= (A l)2
n Квадрат суммы в каждом столбце (A l)2 = ( yij)2 Полная сумма сумм квадратов j)2 Корректирующий член для В КЧB = (Bj)2
b1 b2 b3 ….. bj ….. bm ….y2 l 1…. ….y2 l 2…. ….y2 l 3… ….. ….y2 l j… ….. ….y2 l m Сумма квадратов в каждой строке …. …. …. (yij)2 ….   Сюда вписывать ничего не нужно
m Сумма квадратов в каждом столбце (yij)2 Сумма сумм квадратов (yij)2 Сумма всех квадратов СК ij = (yij)2

 

 

 

Макет итоговой таблицы двухфакторного эксперимента

Источник дисперсии Матема-тическое ожидание дисперсии Итоговая сумма квадратов дисперсии (Σ) = СК КЧ Кол-во степеней свободы f дисперсии Выборочная оценка дисперсии
Эксперимент в целом σ А2 lj) = СК ij КЧ ij fij = nm-1 ij)
Случайные факторы σ έ 2 έ ) = СК ij КЧА КЧB–КЧ lj f έ = = (n- 1 ) (m-1) έ ) (n -1 ) (m-1)
Исследуемый фактор А А2 + σ έ 2 Аε ) = КЧА–КЧ ij f Аε = n-1 Аε )
Исследуемый фактор B n σ B2 + σ έ 2 Вε ) = КЧB–КЧ ij f Вε = m-1 Вε )
s А2выборочная оценка дисперсии σ А2  
s В2выборочная оценка дисперсии σ В2  

Примечаие: f έ = fij – (f А+ f B) = nm-1- (n -1 + m-1) = nm-1- n +1- m+1

= nm-1- nm = n (m-1) - (m-1) =(m-1) (n -1)

После этого остаётся только проинтерпретировать эти итоги, проведя проверку статистических гипотез о значимости факторных дисперсий.


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.04 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал