![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Оценки параметров распределений случайных величин и процессов
Величина, которая в результате некоторого эксперимента с заранее непредсказуемым исходам каждый раз принимает одно из возможных значений, называется случайной. Пусть исход эксперимента (опыта, наблюдения) представляется некоторой случайной величиной Для наиболее полной характеристики случайной величины (процесса) необходимо знать функцию ее распределения, устанавливающую связь между возможными значениями случайной величины в ее генеральной совокупности и соответствующими вероятностями появления каждого значения случайной величины. Существуют две основные формы функции распределения: интегральная и дифференциальная. Важными характеристик случайной величины являются математическое ожидание и дисперсия. Интегральная функция F(x) = P{
Рис. 4.1. Интегральная функция распределения F(x)
Для дискретной случайной величины он будет иметь ступенчатый вид. Основные свойства интегральной функции распределения следующие: - F(x) — неотрицательная функция, т. е. при любых
- F(х) — неубывающая функция, т. е. при xi > xl F(xi) > F(xl). З нак равенства может возникнуть, если в интервале (xi, xl) нет ни одного элемента статистической совокупности); - lim F(x) = 0; (х® -¥) - lim F(x) = 1; (х® ± ¥) Дифференциальная функция распределения φ (x) — это производная от интегральной функции распределения
Дифференциальную функцию распределения φ (x) называют также плотностью распределения непрерывной случайной величины. На рис. 4.2, а показан примерный вид дифференциальной кривой распределения непрерывной случайной величины, а на рис. 4.2, б дискретной случайной величины. На практике чаще используют дифференциальную форму записи закона распределения как более наглядную.
Рис. 4.2. Дифференциальная функция распределения φ (x): а – для непрерывной случайной величины; б —для дискретной случайной величины.
Основные свойства дифференциальной функции распределения: - функция - Математическое ожидание случайной величины Мх характеризует положение некоторого среднего значения случайной величины из генеральной совокупности, возле которого группируются возможные ее значения: а) для непрерывной случайной величины
где φ (x) – дифференциальная функция распределения случайной величины б) для дискретной случайной величины
Геометрической интерпретацией математического ожидания является абсцисса центра тяжести фигуры, ограниченной кривой распределения
где xj — j -е значение случайной величины Степень рассеяния случайной величины относительно Мх характеризуется ее дисперсией. Дисперсия генеральной совокупности случайной величины
Dx=M{ (x-Mx)
Для непрерывной случайной величины Для случайной величины где Дисперсия выборочной совокупности (выборочная дисперсия) является оценкой дисперсии и рассчитывается по ограниченному числу измерений случайной величины по формуле
где Однако при малых выборках N пользуются несмещенной оценкой дисперсии
Оценка называется несмещенной, если ее математическое ожидание равно оцениваемому параметру при любом конечном, в том числе и малом объеме выборки N. Для того чтобы знать, в какой мере и в каком направлении влияет одна случайная переменная
где
N — общее число наблюдений;
sx — выборочная оценка среднеквадратического отклонения переменной sy — выборочная оценка среднеквадратического отклонения переменной
где s2x и s2y — соответственно выборочные дисперсии переменных Коэффициент парной корреляции является показателем тесноты и направления корреляционной связи двух случайных переменных, и его значение находится в пределах -1 ≤ Rxy ≤ +1. При отсутствии корреляционной связи между двумя случайными переменными коэффициент парной корреляции Rxy = 0, в этом случае корреляционная связь между переменными
Планирование и обработка результатов пассивного эксперимента методами регрессионного анализа Допустим, что объект проектирования характеризуется следующими параметрами: Х= {х1 х2> .... xh} — входные величины; Под моделью объекта по i -му каналу будем понимать функцию yi = f(x1, x2,..., xR). (4.3) Так как имеют место неконтролируемые случайные возмущения, то изменение Если объект исследования по техническим, технологическим или экономическим соображениям не допускает преднамеренного варьирования входных переменных в необходимом диапазоне, то для накопления статистического материала применяется пассивный эксперимент, заключающийся в наблюдении и регистрации значений входных и выходных переменных в режиме нормального функционирования исследуемого объекта. Применение метода пассивного эксперимента может быть успешным, если при его проведении соблюдаются необходимые условия, к которым относятся такие, как правильное определение времени регистрации данных, обеспечение независимости соседних измерений и входных переменных друг от друга; достаточный с точки зрения математической статистики объем экспериментальных данных. Выбор структуры модели является наиболее неформализуемой процедурой, так как исследователь до начала эксперимента, как правило, не располагает необходимой априорной информацией. Построение модели существенно упрощается, если в качестве ее составляющих используются полиномы, которые следует включать в уравнение регрессии. Модели полиномиального вида имеют преимущество в связи с тем, что с их помощью аналитическая функция (4.3) может быть описана достаточно точно. Однако при этом нужно иметь в виду, что с увеличением степени полинома весьма существенно возрастает число оцениваемых параметров модели, что влечет за собой увеличение объема эксперимента и затрат на его реализацию. Но прежде чем приступить к проведению эксперимента, необходимо выделить наиболее существенные входные величины (факторы) из всей совокупности входных величин, оценить степень корреляции между ними и исключить из числа подлежащих регистрации те из них, которые сильно коррелированы с другими. Выделение наиболее существенных входных переменных производят, например, методом априорного ранжирования. Как известно, любую функцию, если она не имеет бесконечных разрывов, можно разложить в степенной ряд Тейлора. Поэтому в теории эксперимента чаще всего математическое описание представляется в виде полинома путем разложения в ряд Тейлора (уравнение регрессии):
где b0, bj, bij, bjj - постоянные коэффициенты уравнения, оценки которых необходимо определить в результате постановки и проведения данного пассивного эксперимента; n — число наиболее существенных входных величин, полученных в результате отсеивающего эксперимента. Так как для обработки данных с целью отыскания оценок коэффициентов уравнения и для статистической оценки результатов пассивного эксперимента применяются методы регрессионного анализа, то должен быть выполнен ряд предпосылок: 1) результаты наблюдений уи у2,..., yN выходной величины в точках факторного пространства представляют собой независимые случайные величины, распределенные по нормальному закону, а процесс изменения 2) дисперсия Dyi (l= 3) все значения входных величин xj (j= 4) входные величины xj (j= 5) все соседние измерения по каждой j -и входной величине должны быть независимы. Число коэффициентов уравнения (4.4) определяет объем эксперимента. Поэтому выбирают такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованию простоты и адекватности, под которой понимается способность модели предсказывать результаты эксперимента и некоторой области с требуемой точностью. Так как чаще всего исследователь не располагает достаточной информацией, то на предварительной стадии исследовании объекта обычно выбирают полином первой степени, предполагая, что параметры объекта лежат в области, в которой расположен экстремум исследуемой функции, и поэтому объект описывается линейной моделью. Если же эта линейная модель оказывается неадекватной, то в нее включают члены парного взаимодействия xixj, а при необходимости увеличивают степень полинома до тех пор, пока модель не окажется адекватной. В большинстве практических случаев квадратичная модель оказывается достаточно работоспособной в пределах имеющихся ограничений. В результате регрессионного анализа результатов пассивного эксперимента находятся оценки коэффициентов уравнения регрессии β 0, β j, β ij, β jj,... Пассивный эксперимент с учетом условий накопления статистических данных может применяться для получения математического описания технологических процессов в производстве РЭА (изготовление печатных плат, оксидирование анодной фольги для электролитических конденсаторов, синтез ферритовых антенн, гальванические покрытия и т. п.), а также для моделирования процессов функционирования радиоэлектронных устройств. Если объект исследования (конструкции РЭА, технологические процессы) допускает целенаправленное изменение всех наиболее существенных входных переменных (факторов) по заранее определенным образом составленной программе (матрице планирования) в требуемых диапазонах варьирования, то применяется активный эксперимент, частности, для построения математической модели объекта. По результатам активного эксперимента, обработанными методами регрессионного анализа получают, как при пассивном эксперименте, полиномиальную математическую модель. Факторами будем называть наиболее существенные входные величины, полученные в результате отсеивающих экспериментов, принимающие в некоторый момент времени определенное значение. Область определения фактораможет быть непрерывной и дискретной. В задачах планирования активного эксперимента всегда используются дискретные области определения, а для факторов с непрерывной областью определения (температура, время и т. п.) выбираются дискретные множества уровней. Кроме того, фактор должен быть управляемым (поддерживаемый постоянным в течение опыта или меняющимся по заданной программе), однозначным (не являющимся функцией других факторов), измеряемым с достаточно высокой точностью. В совокупности факторы должны быть совместимы (их комбинации осуществимы и безопасны), между ними не должно быть линейной корреляции. Как правило, при активном эксперименте факторы варьируются на двух уровнях (верхнем «+» и нижнем «–»), отличающихся от так называемого базового уровня xбj (j= Эксперимент, в котором реализуются все возможные неповторяющиеся сочетания уровней факторов, называется полным факторным экспериментом (ПФЭ). Число точек наблюдений в этом плане N=2n, где n — число факторов, варьируемых на двух уровнях. Условия эксперимента представляют в виде таблицы, называемой матрицей планирования, где строки соответствуют различным опытам, а столбцы — значениям факторов. Например, в табл. 4.1 представлена матрица планирования ПФЭ 22 для двух независимых факторов, где «+» соответствует верхнему уровню варьирования фактором, а «-» - нижнему, число опытов N=4.
Таблица 4.1 Матрица планирования ПФЭ для двух независимых факторов
В план эксперимента введена фиктивная переменная х0, которая служит для определения свободного числа уравнения регрессии b0. Для того чтобы получить план эксперимента для трех факторов x1, x2, x3 к плану ПФЭ 22 добавляют один столбец, в котором фактор х3 варьируется на нижнем уровне («-»), и повторяют этот план с варьированием фактора xз на верхнем уровне («+») (табл. 4.2).
Таблица 4.2 Матрица планирования ПФЭ для трех независимых факторов
Такая же процедура повторяется для числа факторов n=4 и так далее. В тех случаях, когда эффект фактора xj зависит от уровня, на котором находится другой фактор xi, имеет место взаимодействие двух факторов xji, для оценки которого вводят в матрицу планирования столбец произведений этих факторов (см. табл. 4.3). Поскольку изменение выходной переменной носит случайный характер, то эксперимент проводится с т параллельными опытами и определяется среднее значение выходной переменной Чтобы исключить влияние систематических ошибок, вызванных наличием помех, используется случайная последовательность при постановке опытов, запланированных матрицей, т. е. опыты рандомизируются во времени.
Таблица 4.3 Матрица планирования ПФЭ с взаимодействующими факторами
Число опытов в ПФЭ значительно превосходит число определяемых коэффициентов модели, что приводит к большой избыточности опытов. Кроме того, с помощью ПФЭ можно получить только либо линейную, либо неполноквадратичеекую математическую модель, так как из полного факторного эксперимента нельзя извлечь информацию о квадратичных членах полинома. В первом случае избыточность опытов используют для формирования планов дробного факторного эксперимента (ДФЭ), а во втором — при необходимости переходят к планам более высокого порядка, например композиционным планам второго порядка, в которых используются принципы ортогональности и ротатабельность и планирования. В композиционных планах чаще всего используется критерий ортогональности и ротатабельности (рис. 4.3). Критерий ортогональности используется для упрощения вычислений и получения независимых оценок коэффициентов модели. Это значит, например что, замена нулем любого коэффициента в уравнении модели не изменит значений оценок оставшихся коэффициентов, что весьма существенно, когда точный вид модели неизвестен и приходится использовать экспериментальные данные для отбора переменных, существенно влияющих на выходную переменную, путем проверки статистической значимости коэффициентов уравнения регрессии.
Рис. 4.3. Композиционный план второго порядка для n = 3
Критерий ротатабельности требует такого расположения экспериментальных точек в области планирования, при котором дисперсия s2. оценки значений выходной переменной в точке наблюдения зависит только от расстояния от этой точки до центра плана и хорошо согласуется с требованием равнозначности всех направлений от центра плана. В ортогональном центральном композиционном планировании критерием оптимальности плана является ортогональность столбцовматрицы планирования. В силу ортогональности планирования все коэффициенты регрессии определяются независимо друг от друга. Ядро плавна составляет план ПФЭ (при n ≤ 4) либо ДФЭ 2n-p (при п > 4). Число «звездных точек» выбирается равным 2n, а число центральных (нулевых) точек; N0 = l. В отличие от ортогональных планов ротатабельные центральные планы оптимальны в том смысле, что они позволяют минимизировать систематические ошибки, связанные с неадекватностью представления результатов исследования полиномом второго порядка, и дают возможность получить математическое описание, обеспечивающее одинаковую точность во всех направлениях на одинаковом расстоянии от центра планирования. Ротатабельный центральный композиционный план строится аналогично ортогональному плану. Рассмотрим основные расчетные выражения для полного и дробного факторного эксперимента. 1. Преобразование факторов xj (j=
где xj — верхний или нижний уровень варьирования; xbj — базовый уровень j -го фактора;
В матрице планирования верхнему уровню xjВ соответствует «+1», а нижнему xiH — «-1» (для упрощения записи «+» и «-»). 2. После проведения опытов производится проверка воспроизводимости опытов с использованием критерия Кокрена:
где
где ylg — значение выходной величины по 1-й строке матрицы планирования (
Если вычисленное значение G maxокажется меньше критического G крит при числе степеней свободы f1 = (m - 1) и f2=N и заданном уровне значимости q, %, то гипотеза об однородности дисперсий принимается. 3. Оценки коэффициентов уравнения регрессии рассчитываются по формулам:
где индекс j принимает значения 1, 2,..., n (n — число линейных эффектов); индекс ij принимает значения, соответствующие оцениваемым взаимодействиями;
4. Гипотеза о статистической значимости коэффициентов регрессии проверяется с помощью t -критерия Стьюдента, который формируется как
где
а оценка дисперсии воспроизводимости
Если найденный t -критерий для соответствующей оценки коэффициента регрессии окажется больше критического t крит, при числе степеней свободы f = N(m —1) и уровне значимости q %, то данный коэффициент регрессии является статистически значимым. Незначимы будут коэффициенты регрессии, которых t расч < t крит, и они из уравнения регрессии исключаются. 5. Проверка гипотезы об адекватности математического описания результатам эксперимента с использованием F -критерия Фишера в виде отношения
где s2 ад — оценка дисперсии неадекватности; s2y — оценка дисперсии воспроизводимости. Оценка дисперсии неадекватности
где d — число членов аппроксимирующего полинома. Рассчитанное значение F -критерия по формуле (4.14) сравнивается с критической величиной при заданных уровне значимости q, %, и степенях свободы f1 = N—d, f2=N(m—1). Если F расч < F крит, то гипотеза об адекватности математического описания результатам эксперимента принимается. Ортогональное центральное композиционное планирование включает поиск следующих величин. 1. Общее число точек плана эксперимента
где No — число центральных (нулевых) точек; п — число факторов Xj
2. Величина
где а — размер «звездного плеча», зависящий от числа факторов п. 3. Проверка гипотезы воспроизводимости опытов проводится по G -критерию (4.15), а адекватности математического описания — с помощью F критерия Фишера (4.14), так же как при обработке результатов наблюдений ПФЭ и ДФЭ. 4. Оценки коэффициентов уравнения регрессии: N _ β i = c1 Ʃ z li Y lср l=1
N _ β ij = c2 Ʃ z li z lj Y lср l=1 (4.16) N _ β ii = c3 Ʃ z li 2 Y lср l=1
где c 1, c 2, c 3, — элементы дисперсионной матрицы плана, значения которых зависят от числа факторов n, а статистическая значимость коэффициентов уравнения регрессии оценивается по t -критерию Стьюдента (4.11) со степенями свободы f=N(m- 1 ) при оценках дисперсии соответствующих коэффициентов уравнения регрессии:
6. Уравнение регрессии записывается в следующей форме:
где коэффициент уравнения регрессии
N n _ β 0 = 1 Ʃ Y lср - γ Ʃ β ii, N l=1 i=1 (4.19)
дисперсия которого
где Рассмотрим основные расчетные выражения для ротатабельное центрального композиционного планирования. План эксперимента строится аналогично ортогональному плану. Проведение эксперимента, проверки воспроизводимости, статистической значимости коэффициентов уравнения регрессии, адекватности математического описания производятся аналогично ортогональному центральному композиционному планированию. Оценки коэффициентов уравнения регрессии рассчитывают по следующим формулам:
При этом оценки дисперсий коэффициентов регрессии определяются следующим образом:
со степенями свободы N (m—1). Остальные формулы для расчета такие же, как при ортогональном центральном композиционном планировании.
|