Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Однофакторный дисперсионный анализ






Дисперсионный анализ

Основные понятия

Дисперсионный анализ – это информационная технология технология работ на начальном этапе экспериментального исследования заинтересовавшей субъект системы или ситуации. На этом этапе у субъекта об этой системе имеются лишь самые общие представления, сложившиеся на базе обыденного (иногда – случайного) с нею (системой или ситуацией) общения. С этих представлений, воплощённых в простейшую исходную модель, которую принято ящиком» (см. модель-схему ниже.), и начинается дисперсионный анализ.

х 1 y1 Прямоугольник изображает систему,

х 2 y r = f (x 1, x 2, .. , y2 стрелки справа – её проявления, эффек-

…...xr -1, xr…..xL) … ….. ты, которыми система обнаруживает

х L yR себя вовне, т.е. внешние эффекты её

Рис. 7.1 деятельности (функционирования).

Количественной мерой каждого из этих эффектов является значение yr) значениетого параметра, которым этот эффект характеризуется. Субъект (исследователь) обычно интересуется одним таким параметром, количественно оценивающим потенциально полезный (или опасный) для него эффект системы (исход ситуации), интересуется, чтобы научиться управлять системой (овладеть ситуацией). Стрелки слева от прямоугольника изображают внешние причины (воздействия), которые, по первым впечатлениям субъекта, способны оказать влияние на выходные параметры (yr)системы. Эти стрелки тоже помечены символами – символами х i – численными значениями соответствующих параметров.

Схема предполагает, что при изменениях любого из параметров хi хотя бы один из параметров yr системы определённым образом изменится. При наличии причинно-следственной связи между входными воздействиями и внешними проявлениями системы взаимозависимость между характеризующими их параметрами могла бы быть описана некой функцией. Однако, при первом знакомстве с системой конкретный вид этой функции и даже её характер неизвестны. Поэтому на фоне прямоугольника, изображающего собой систему на этом этапе знакомства с нею, эта (пока гипотетическая потому, что совсем неизвестная) зависимость представлена в общем виде – в форме произвольной функции yr= f(x 1, … xi, …, xL), где индексамиi =1, 2, 3…. L помечены нарастающие значения параметров, характеризующих уровень входных воздействий (в теории эксперимента их обычно называют факторами), а yr (при r =1, 2, 3…. R) соответствующие значения параметров, характеризующих уровень выходных эффектов системы (в теории эксперимента их обычно называют откликами).

Здесь L – количество факторов, влияющих на поведении системы и R количество параметров (откликов), которыми характеризуется (полностью описывается) это поведение.

Отклики, следовательно, в этой модели выглядят набором из R многомерных функций типа y r = f(x 1, … xi, …, xL), где i =1, 2, 3…. L и r =1, 2, 3. …., R.

Их (эти функций) ещё называют операторами системы.

Субъект, как отмечалось выше, обычно интересуется одним определённым откликом или конструирует для себя некий обобщенный отклик, адекватно отображающий поведение системы в целом. Например, вместо таких нескольких привлекательных для человека выходных параметров злаковой культуры как количество стеблей у одного растения, количество колосков на каждом стебле, количество зёрен в каждом колосе и вес зернышка, можно рассматривать один обобщённый параметр: вес урожая с единицы засеянной культурой площади. Поэтому в начале знакомства с теорией дисперсионного анализа мы будем рассматривать приведённый ниже предельно упрощенный вариант «чёрного ящика».

Исследуемая материальная система

x 1 …… y=f(x 1, …, xL).

…..

xL

 

Рис. 7.2

Цель дисперсионного анализа состоит:

- в выявлении среди множества x i, …, xL , первоначально заподозренных в способности повлиять на величину y, (выходных) факторов-откликов, тех xl, xn и xm, которые наверняка на неё (на величину y) влияют, и

- в уточнении диапазона изменений каждого выявленного фактора, в пределах которого такие влияния наиболее заметны (например, для xn: влияние обнаружено при его значениях от min x3 до max 5).

Подходы к достижению этих целей начнём с упоминания о том, что у любой системы естественного происхождения параметры, характеризующие её внутренние состояния и внешние проявления, чаще всего представляют собой непрерывныенормально распределённые случайные величины.

Интересующий нас единственный отклик y – одна из таких величин, множество { y } её возможных (в разные моменты «истории» системы) значений yj образуют Генеральную совокупность. Она исчерпывающим образом определяется (характеризуются) Математическим ожиданием М{ y } случайной величины y и теми отклонениями от него (от М{ y }) отдельных значений (yj), мерой которых (отклонений) является Генеральная дисперсия σ 2. Конкретизация этих двух (М{ y } и σ 2) параметров нормального распределения однозначно определяет Генеральную совокупность. Однако, такая конкретизация принципиально невозможна. Судить о значениях этих параметров можно только приблизительно по результатам наблюдения за поведением системы, например, по полученным экспериментально (измеренным прибором) нескольким значениям отклика yj. Подмножество { yj } таких случайных величин yj при j =1, 2, 3, …, m образуют выборку из Генеральной совокупности { y } объёмом (или мощностью m)и должно быть помечено этим индексом { yjm. Величина Y (m)Ср, которую вычисляют по формуле Y (m)Ср = yj, называется выборочной средней для Генеральной совокупности { y } и при достаточно больших m является практически терпимоточной выборочной оценкой математического ожиданияМ{ y } (YСр ~ М{ y }). Символ «~» далее будет всегда обозначать: «является выборочной оценкой», асимвол Ym будет обозначать: Y (m)Ср. На базе этой же выборки { ym } с объёмом m могут быть вычислены

выборочная дисперсия s 2 m = (yj –Ym) 2 и

исправленная выборочная дисперсия s 2и m = (yj –Y) 2.

Последняя является несмещённой выборочной оценкой дисперсии σ 2 Генеральной совокупности { y }: (s 2 ~ σ 2).

В более общей форме, пригодной для вычисления любой исправленной выборочной дисперсии s 2и m и в удобной при использовании компьютера в ходе планировании эксперимента) это выглядит так:

- s 2 = s 2и m = (Σ s): f s, где сложным символом (Σ s) m обозначена (обычно предварительно вычисляемая) сумма квадратов отклонений типа (yj –Ym), то есть в примере выше

s) m = (yj –Ym) 2, , а f s параметр исправленной дисперсии s 2, который характеризует количество её степеней свободы (здесь f s m = m – 1).

Практически для суммы квадратов отклонений удобнее (для компьютерного планирования эксперимента) пользоваться другим выражением (Σ s) m = (yj – Ym)2 =

= [(yj) 2 –2 (yj) Y + Y 2] = [(yj) 2 – 2 (yj)( yj) + ( y ) 2] =

= (yj)2 [ 2 ( y)( yj) + ( yj)2] = СК m КЧ m, где СК m = (yj)2 есть сумма квадратов откликов, а КЧ mкорректирующий член (так в вычислениях подобного рода принято называть поделённый на общее количество измерений квадрат суммы откликов КЧ m = ( yj)2.

Действительно: [ – 2 ( yj)( yj) + [( yj)2] =

= [ –2 ( yj)2 + ( yj)2 1 ] =

= [ –2 ( yj)2 + ( yj)2 m ] = ( yj)2 = КЧ m.

Корректирующий член всегда представляет собой квадрат суммы всех значений выборки, поделённый на объём этой выборки (здесь m).

Величины СК m и КЧ m интегральные параметры выборки объём m. Они здесь вспомогательные промежуточные величины, а выделены и особо обозначены в связи с возникающими при таких выделениях удобствами технологического характера, которые проявляются при компьютерном планировании эксперимента.

Далее везде любую исправленную выборочную дисперсию s 2 илюб мы будем считать по такой «стилизованной» формуле:

s 2илюб = (Σ илюб): f илюб = [СКилюб КЧилюб]: f илюб, заменяя индекс «люб» конкретным (соответствующим объёму выборки) индексом.

Смысл и удобства введения в рассмотрение и специального обозначения промежуточных величин выявятся позже при рассмотрении планирования эксперимента при дисперсионном анализе.

Однофакторный дисперсионный анализ

С представленными выше воспоминаниями из математической статистики обратимся к теории неизбежного при дисперсионном анализе эксперимента. Для более выпуклого представления («для ясности») теоретических обоснований методики его проведения предельно упростим ситуацию. В учебных целях предполагаем, что отклик У один и зависит он от одного-единственного фактора А. Реально таких ситуаций почти не бывает, но упрощение ситуации облегчает усвоение основных принципов построения рабочих методик. А это создаёт надёжную теоретическую базу для усвоения более сложных реальных методик.


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.009 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал