![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Статистической обработки результатов наблюдений ⇐ ПредыдущаяСтр 3 из 3
Обработка результатов наблюдений (выборки), имеющихся у обра- ботчика в том порядке, в каком они были получены в ходе наблюдений, то есть в случайном (хаотичном), проводится в следующей последовательно- сти: I) упорядочивание значений ряда наблюдений по возрастанию; 2) проверка результатов наблюдений на анормальность; 3) пересчет параметров статистических оценок; 4) выбор закона распределения, выравнивание ряда по выбранному и проверка согласия эмпирического и теоретического распределений. Перечисленные пункты отражены в ГОСТ Р 50779.6* «Статистические методы обработки результатов измерений и испытаний» и ГОСТ Р 50779.2*Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным». Знак * определяет конкретный номер соответствующей рубрики ГОСТа. Например, ГОСТ Р 50779.21-96 «Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным. Часть 1. Нормальное распределение». Упорядочивание результатов наблюдений осуществляется посредством размещения их значений по возрастанию, от меньшего к большему. Проверка на анормальность проводится в предположении, что ошибки наблюдения подчиняются нормальному закону распределения. Результат наблюдений является грубым или анормальным, если он существенно отличается по значению от остальных значений наблюдений в выборке. Причинами появления подобных результатов могут быть сбои в работе измерительной аппаратуры, ошибки (промахи) наблюдателя, природная анормальность и пр. Вполне естественно, что для предотвращения искажения в описании статистическими данными сущности объекта грубые результаты должны быть исключены из выборки. Для этого выполняются следующие действия. Если проверка проводится по критерию Греббса (существуют также критерии Ирвина и Романовского), определяются среднее арифметическое выборки
и выборочное среднее квадратическое S = Затем, поскольку более вероятны существенные отклонения для крайних значений выборки, оценивается принадлежность первого и последнего элементов выборки (x 1- минимальное и хп - максимальное значения) к выборочной совокупности. Процедура оценки осуществляется посредством вычисления так называемых u- статистик: Здесь u1 и u n характеризуют относительные величины наибольших отклонений от среднего, которые подчиняются В ряде случаев, когда определены предварительно частоты, для определения где xi –i- й вариант для дискретной случайной величины или середина интервала x i = (хi -1+ хi)/2 для непрерывной случайной величины; ni - частота i-го варианта или интервала; k количество вариантов или интервалов. Выборочная дисперсия - статистическая оценка дисперсии - определяется как сумма квадратов отклонений вариантов или середин интервалов от среднего арифметического, деленная на объем выборки п минус единица: Единица, вычитаемая из объема выборки п в выражении (2.30), учитывает одну степень свободы, использованную на вычисление среднего арифметического, и позволяет получить несмещенную оценку дисперсии для случаев, когда среднее арифметическое предварительно (априорно) неизвестно. Средиеквадратическое отклонение определяется по выражению S= И последний, завершающий, этап обработки производственной информации и случайного характера - это выбор закона распределения. Данная процедура позволяет в дальнейшем не занимать долговременную память компьютеров и не хранить записи с таблицами эмпирических данных. Выбранный закон распределения представляется в удобном формульном виде и позволяет в любой момент получать теоретические (сглаженные), более широко представляющие выборку, значения случайной величины и ее статистических оценок. Графически законы распределения интерпретируются в виде графиков плотностей распределения (дифференциальной функции) и графиков функций распределения (интегральной функции) (см. рис. 2.2). График кривой плотности распределения представляет собой предельное положение гистограммы при стремлении объема выборки п Поскольку законов распределения существует определенное множество, то при выборе конкретного закона и выравнивания по нему эмпирического ряда необходимо пользоваться общим алгоритмом, приведенным ниже и определяющим порядок проведения данной процедуры. 1. Ha основе выборочных данных определяются статистические оценки матожидания (среднее арифметическое), дисперсии (выборочная дисперсия), среднего квадратического отклонения, если они не определены. 2. Построение многоугольника распределения для дискретной или гистограммы для непрерывной случайных величин. Методика и правила построения многоугольников и гистограмм в частотах и частностях (относительных частотах) приведены в [29]. По оси ординат гистограмм откладываются частоты, в скобках, и соответствующие им плотности частот для гистограммы частот или частости (относительные частоты), в скобках, и соответствующие им плотности частостей для гистограммы частостей. По графической интерпретации эмпирического распределения в виде гистограммы (многоугольника) и физической сущности рассматриваемой случайной величины подбирается соответствующий закон распределения на основе сравнительного анализа графиков плотностей известных законов распределения (см. рис. 2.2). Следует отметить, что это не единственный путь выбора закона распределения. При соответствующем опыте или наличии априорной информации нет необходимости в построении гистограмм (многоугольников), однако при отсутствии оных без гистограмм и многоугольников не обойтись. 3. В выражение плотности выбранного закона распределения подставляют вычисленные ранее статистические оценки (среднее арифметическое, среднее квадратическое отклонение или выборочная дисперсия) параметров (математического ожидания, дисперсии) выборки. 4. Подстановкой значений границ интервалов х i-1 и хi в качестве пределов интегралов от выражения плотности выбранного закона распределения либо используя таблицы, вспомогательные функции (функция Лапласа для нормального распределения) [29], вычисляют теоретические вероятности pi попадания случайной величины х в соответствующий i -й интервал. Для дискретной случайной величины при вычислении рi текущие значения xi подставляют непосредственно в выражение плотности выбранного закона распределения. Для сопоставимости теоретической кривой с экспериментальной на гистограммах частостей и частот (многоугольниках для дискретной случайной величины) строят, соответственно, кривую плотности в вероятностях (посредством откладывания вычисленных значений рi на оси ординат для i -х интервалов непрерывной случайной величины или для i -х значений вариантов дискретной случайной величины) и в теоретических частотах, которые определяются из выражения n '= пр i, и откладываются на оси ординат гистограммы частот для i -х интервалов непрерывной случайной величины или для i -x вариантов дискретной случайной величины. 5. Проводят проверку согласия эмпирического распределения с выбранным теоретическим, где в качестве меры расхождения между теоретическим и эмпирическим распределениями может быть выбран один из следующих критериев: Колмогорова, Пирсона Сущность перечисленных критериев согласия заключается в том, что они определяют допустимую случайную меру расхождения между теоретическим и эмпирическим распределениями. Если найдены закон и параметры случайной величины, то она перестает быть неизвестной. Для анализа статистическое (эмпирическое) распределение необходимо заменить теоретическим. Теоретическое распределение свободно от тех случайных колебаний, которые наблюдаются в статистических распределениях вследствие ограниченного числа наблюдений и других погрешностей. Однако как бы хорошо ни была подобрана теоретическая кривая распределения, между нею и статистическим распределением неизбежны некоторые расхождения. Возникает вопрос: объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений в статистическом ряду, или расхождения являются существенными и связаны с неправильным выбором теоретического закона распределения? Процедура оценки расхождения напоминает ситуацию, когда покупатель взяв костюм при его предполагаемой покупке, находится в стадии его примерки и принятия решения относительно покупки. При проведении проверки на согласие необходимо соблюдение ряда условий: исследуемая выборочная совокупность должна быть однородна, то есть наблюдения случайной величины должны проводиться в одинаковых условиях; для критериев Колмогорова и Пирсона объем выборки должен быть не менее 100, для ω 2 не менее 50; приборы и инструменты, фиксирующие наблюдаемую случайную величину, должны иметь цену деления не более 0, 2 предполагаемой величины среднего квадратического отклонения исследуемого распределения. Схема применения критерия А.Н. Колмогорова следующая: строятся статистическая и предполагаемая теоретическая функции распределения случайной величины, и определяется максимум модуля разности между ними R. Далее определяется максимальное значение модуля разности (рис. 2.4, а) между эмпирической функцией распределения Fэ(x) и теоретической Fm(x): R =max | F э (х) - Fm (х)| (2.32) и величина l0= Далее по табл. 2.1 определяют вероятность р (l0) Таблица 2.1 Вероятность р (l0)
Это есть вероятность того, что если случайная величина действительно распределяется по предполагаемому закону, то за счет чисто случайных причин максимальное расхождение между теоретической и статистической функциями будет не меньше фактически полученного. Если вероятность р (l0) весьма мала, гипотезу следует отвергнуть как неправдоподобную; при сравнительно больших р (l0) ее можно считать совместимой с опытными данными. Минимальное значение р (l0) принимается равным 0, 01. Однако, если точность выбора закона распределения может в последующих расчетах повлиять на надежность работы особо ответственных систем, связанных, например, с безопасностью работы людей, минимальное значение р (l0) должно быть заведомо выше. Этот критерий применяется в случаях, когда распределение обрабатываемой случайной величины известно из априорной информации, то есть предварительно известны вид и статистики (оценки параметров) Функции распределения. Более подробно о методике применения данного критерия можно ознакомиться в [29, 30].
В тех случаях, когда предварительно не известны ни вид распределений, ни статистики - оценки математического ожидания и дисперсии, - используется более мощный критерий согласия - критерий Пирсона (хи- квадрат):
х2= t\h-mtlm\ или= с2-34) > =1L J i=i Ji где и, - (F,) - количество элементов выборки, попавших в г'-й интервал для непрерывной случайной величины (частота г'-го интервала) или количество элементов i-го варианта для дискретной случайной величины (частота 1-го варианта); п - объем выборки; к - количество интервалов или вариантов; Pi - теоретическая вероятность для г'-го варианта или интервала (вычисляется для каждого интервала или варианта по формуле плотности принятого закона распределения); fi = пр— значения частоты теоретического распределения. Графическая интерпретация критерия представлена на рис. 2.4, 6. Проверка согласия выбранного закона распределения с эмпирическим проводится в следующей последовательности: а) определяется х2-критерий по выражению (2.34); б) определяется число степеней свободы г = к-с - 1, где с - количество параметров (оценки математического ожидания, дисперсии), вычисленных на основе эмпирического распределения и подставленных в выражение плотности выбранного закона распределения; в) задается уровень значимости а (обычно в отрасли а принимают равным 0, 05) и с помощью таблиц для ^-распределения [29, 31] определяется табличная величина xVm характеризующая предельную величину расхождения для данного числа степеней свободы г и уровня значимости а. г) если х2 ^ Х2крит, то гипотеза о согласии выбранного закона распределения принимается, в противном случае отвергается, и в дальнейшем необходимо рассматривать какой-либо другой закон распределения с той же самой процедурой проверки его согласия. 2.4.2. УСТАНОВЛЕНИЕ ЗАВИСИМОСТЕЙ Одна из основных задач обработки экспериментальных данных заключается в установлении зависимости между значением параметра у и воздействующими на него факторами хь Хг... В общем виде такая зависимость записывается как y = f(x„x2,...., xm), (2.35) где m - общее количество воздействующих факторов. При однофакторном эксперименте имеем у -fix). II. iiiiifuM информация для моделирования Установление зависимости между эмпирическими значениями пара- iri|'" У и воздействующим фактором х выполняется на основе корреляции но анализа. Две случайные величины х и у называются корреляци- i вязанными, если математическое ожидание одной из них меняется при и 1менении другой. Теснота связи между этими величинами характери- цен " коэффициентом корреляции Если = 0, то говорят, что величины I и V ие коррелируют. Если rxy= 1, то между ними имеется прямолинейная функциональная зависимость. (уществует и другой метод оценки тесноты связи между опытными > то построение доверительной зоны для выявленной эмпириче- • I nil шиисимости [29, 32]. Коэффициент корреляции между величинами х hi I н фгделяется по формуле и-1 Z х'У> \ ху г*> = (2.36) Ст.о, | и п количество опытов; > и г, значения величин в г'-м опыте; in г средние значения (математические ожидания) величиях и у\ I. нн просматривается взаимосвязь между величинами, то следующим 11ином становится выявление уравнения, описывающего эту взаимо- ни н Ни уравнение называют эмпирической зависимостью, или уравне- и in Общепринятым при решении подобных задач является метод наименьших квадратов, при котором требования наилучшего согласования ф. нкI(Ни (кривой в общем случае) у = j{x) и экспериментальных точек сво- юму, чтобы сумма квадратов отклонений экспериментальных то- |-|.и 1Мнирической зависимости обращалась в минимум. Дня линейной зависимости вида у = а + Ьх необходимо составить • уравнений na + bYjyi = J у,; ; =i 1=1 п п л > (2.37) | 'мириI ичнойу = а + Ьх + сх2 - систему вида Раздел 2 п п п
п п п п (2.38)
и п п п где a, b к с - коэффициенты эмпирической зависимости, определяемые в результате решения системы данных уравнений. Для выявления зависимости рекомендуется расположить в таблице значения у в порядке возрастания значений аргументов х или изобразить значения в координатной сетке. Далее необходимо выбрать тип уравнения связи между функцией и аргументом. В качестве такого уравнения связи принимают прямую линию, параболу, гиперболу, степенную функцию или многочлен. Выбор той или иной теоретической зависимости производят, учитывая физическую сущность явления, диапазон и характер изменения величин. Например, следует выбрать уравнение связи для зависимости времени перемещения автопогрузчика t от расстояния его перемещения 1 на площадке лесного склада. Экспериментальные данные будут, естественно, показывать возрастание времени t с увеличением расстояния I. Если подходить чисто математически, то теоретическим уравнением могут быть прямая линия t = а + Ы, парабола типа t = а + Ы + cl2 и др. Здесь и далее a, b и с - коэффициенты, которые после выбора уравнения связи рассчитываются методом наименьших квадратов. Однако оценка этих зависимостей показывает, что они далеко не отвечают реальному процессу: при / = 0 t = а, хотя в этом случае время должно быть, разумеется, равным нулю. При малых значениях I средняя скорость перемещения автопогрузчика будет меньше, чем при больших расстояниях. Это связано с тем, что при большом расстоянии снижается относительное влияние времени на разгон и замедление хода автопогрузчика. Поэтому уравнение прямой линии не подходит и по этой причине. Достовернее будет отражать реальный процесс - зависимость t = alb: при 1 = 0 t = 0, а с ростом / время t возрастает по кривой линии; естественно, что а> 0 и Ь> 0. После выбора теоретического уравнения связи необходимо определить значения входящих в него коэффициентов. Их значения, как отмечалось, рассчитывают методом наименьших квадратов. Суть этого метода заключается в том, чтобы выявить такие значения коэффициентов, при которых сумма квад- It hum информация для моделирования I отклонений фактических значений функции от устанавливаемой эмпири- > 11 зависимости - уравнение связи с численными значениями коэффициен- была бы минимальной. В математической статистике приводятся много- IMI и иные примеры расчета этих коэффициентов для различных типов урав- м(ми11 связи. В настоящее время такие расчеты выполняют, как правило, на 'ИМ, идя чего разработаны стандартные программы. ('недует оговорить некоторые особенности определения эмпирических имостей. В ряде случаев для последующего упрощения расчетов ис- 1уют уравнения связи типа прямой линии или разделяют всю зону зави- ■ MMiiciH w f{x) на отдельные характерные участки, рассматривая зависимо- и них как прямолинейные. Так поступают, если предполагают при по- и г, минем моделировании процесса применить линейное программирова- шп п имеется уверенность, что отход от физической сущности взаимосвязи мгельно скажется на точности конечных результатов. I iни физическую сущность явления установить трудно, то принимают in 11 •■ ним> типов уравнений связи и методом наименьших квадратов выби- г ".и ю, которое дает минимальное значение суммы квадратов отклонений. им > ммирическая зависимость действительна при конкретных ограничении. определять значения исследуемого параметра по ней можно только в и'М г ир! ументов, в которой проводились экспериментальные измерения. Ili.i • " I in ни зоны (экстраполяция эмпирической зависимости) имеет возрас- риск неточности результата с увеличением удаления от границ ус- | in иной экспериментом зоны. Пример определения коэффициента корреляции и корреляционной швт н мости. На лесосеке были проведены наблюдения за работой валоч- нмчирующей машины. При этом определялись следующие пары вели- iiiii и)и, ем спиливаемого дерева qw и время цикла валки-пакетирования tu и о дерева. Результаты наблюдений сведены в табл. 2.2. Исчисления по ранее приведенным формулам дают следующее: средние значения Чх" 21 h =(0, 29 + 0, 43 +... + 0, 71)^- = 0, 527 м3; и in Персия 72 Раздел 2 средние квадратические отклонения о, => /0, 019194 = 0, 1385 м3; о, 8, 25 =9, 91с. Таблица 2.2 Результаты наблюдений
Коэффициент корреляции по формуле (2.36) равен гя, = 0, 8485. Его значение свидетельствует о достаточно тесной связи между объемом хлыста и временем цикла. Таблица 2.3 Результаты вычислений
На примере экспериментальных данных, приведенных в табл. 2.2, применим метод наименьших квадратов для выявления линейной зависи- II. iiiiifuM информация для моделирования мости вида tu = а + bqxn. Для этого производим ряд вычислений, и i.i к в табл. 2.3. В соответствии с формулой (2.37) имеем f21a+l 1, 076 = 755; 1, 07а + 6, 216 = 421, 15. Решив эту систему уравнений, получаем: а = 4, 14; 6 = 60, 3. Таким образом, искомое уравнение имеет вид tn= 4, 15+60, З^хл- Построив график уравнения (3.40), можно убедиться, что проходит через поле точек, разделяя его примерно пополам. Дня углубленной проработки рекомендуем [19, 32]. 2.4.3. ОБРАБОТКА СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ В КОМПЬЮТЕРНЫХ ПРОГРАММНЫХ СРЕДАХ Изложенные выше теоретические положения и методики обработки и гической информации, полученной в ходе различных эксперимен- | ■ 'и, реализуются в различных математических программных средах. К ним и • н гея Excel, Mathcad, Maple [33-35] и другие. Однако перечисленные | ррлы лишь частично используют методики статистических процедур об- 1»иГи. | к и случайной величины и определения статистических зависимостей. I»! •, например, в них не предусмотрена возможность сравнения теоретиче- in распределения с эмпирическим и, соответственно, выбор или под- «и наиболее подходящего распределения к реальным данным и пр. 11олностью отвечают требованиям ГОСТа по обработке статистиче- imih минных лишь специализированные программные среды, например, I A KiRAPHICS или STATISTICA [36]. Наибольшее распространение в |' |, Ке статистических результатов получила последняя из названных I |if I Поэтому далее приводится пример компьютерной обработки и кмПпри шкона распределения в среде STATISTICA. П результате наблюдений за работой ВПМ ЛП-19 получена выборка»Hrt'n 11IIIt ирсмени цикла объемом п, равным 192. Наблюдения проводи- н|| I при запасе на гектар, равном 275 м3, и среднем объеме хлыста, рав- 'I м'. Последовательность обработки наблюдений в математической .•I hi рммммой среде STATISTICA представлена на рис. 2.5-2.8. Анормальна р. i\ IIм аты исключаются лицом, принимающим решение (ЛПР), по- i и I ним сравнения рассчитанного им же критерия Греббса и его таблич- н нии, при программном пересчете статистических оценок. сведен- (3.39) (3.40) прямая Раздел 2 средние квадратические отклонения а? = >, 019194 =0, 1385 м3; 25= 9, 91с. Таблица 2.2 Результаты наблюдений Номер наблюдений 9хл, м3 '№ с Номер наблюдений ? хл, м3 1№ с Номер наблюдений Я™, м3 с 0, 29 0, 44 0, 53 0, 43 0, 36 0, 66 0, 55 0, 52 0, 64 0, 58 0, 33 0, 29 0, 64 0, 41 0, 61 0, 74 0, 61 0, 71 0, 53 0, 49 0, 71 Коэффициент корреляции по формуле (2.36) равен rql = 0, 8485. Его значение свидетельствует о достаточно тесной связи между объемом хлыста и временем цикла. Таблица 2.3 Результаты вычислений п 9хл А 'ц Яхя 'и п ? хл А 'в ? хл'ц 0, 29 0, 0841 5, 22 0, 41 0, 1681 15, 58 0, 43 0, 1849 10, 32 0, 61 0, 3721 25, 62 0, 55 0, 3025 14, 85 0, 49 0, 2401 15, 19 0, 58 0, 3364 22, 04 0, 53 0, 2809 18, 02 0, 64 0, 4096 28, 80 0, 66 0, 4356 36, 30 0, 74 0, 5476 34, 04 0, 64 0, 4096 24, 32 0, 53 0, 2809 21, 73 0, 29 0, 0841 7.25 0, 44 0, 1936 13, 64 0, 61 0, 3721 29, 89 0, 36 0, 1296 9, 36 0, 71 0.5041 28, 40 0, 52 0, 2704 19, 24 0, 71 0, 5041 34, 08 0, 33 0, 1089 7, 26 I 11, 07 6, 2193 421, 15 На примере экспериментальных данных, приведенных в табл. 2.2, применим метод наименьших квадратов для выявления линейной зависи- II. iiiiifuM информация для моделирования мости вида tu = а + bqxn. Для этого производим ряд вычислений, сведенных в табл. 2.3. В соответствии с формулой (2.37) имеем f21a+l 1, 076 = 755; 1, 07а +6, 216 = 421, 15. (3.39) Решив эту систему уравнений, получаем: а = 4, 14; 6 = 60, 3. Таким образом, искомое уравнение имеет вид V=4, 15+60, 3q„. (3.40) Построив график уравнения (3.40), можно убедиться, что прямая приходит через поле точек, разделяя его примерно пополам. Для углубленной проработки рекомендуем [19, 32]. 2.4.3. ОБРАБОТКА СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ В КОМПЬЮТЕРНЫХ ПРОГРАММНЫХ СРЕДАХ Изложенные выше теоретические положения и методики обработки it" чи гической информации, полученной в ходе различных эксперимен- , ревизуются в различных математических программных средах. К ним и шея Excel, Mathcad, Maple [33-35] и другие. Однако перечисленные • ремы лишь частично используют методики статистических процедур об- mi случайной величины и определения статистических зависимостей. I ак, например, в них не предусмотрена возможность сравнения теоретиче- miMi распределения с эмпирическим и, соответственно, выбор или под- I наиболее подходящего распределения к реальным данным и пр. 11олностью отвечают требованиям ГОСТа по обработке статистиче- |п. минных лишь специализированные программные среды, например, I \ KIRAPHICS или STATISTICA [36]. Наибольшее распространение в • -i.p.имккс статистических результатов получила последняя из названных I pr I Поэтому далее приводится пример компьютерной обработки и йыП| ipa шкона распределения в среде STATISTICA. И результате наблюдений за работой ВПМ ЛП-19 получена выборка жим! null ирсмени цикла объемом п, равным 192. Наблюдения проводниц I при запасе на гектар, равном 275 м3, и среднем объеме хлыста, рав- ним (I ' I м'. Последовательность обработки наблюдений в математической ч риммной среде STATISTICA представлена на рис. 2.5-2.8. Анормаль- р. iv иматы исключаются лицом, принимающим решение (ЛПР), по- i I | ним сравнения рассчитанного им же критерия Греббса и его таблич- н ния, при программном пересчете статистических оценок. Раздел 2 TEXT VALU Рис. 2.5. Фрагменты выборки значений времени цикла ВПМ: слева - неупорядоченная; справа - после исключения анормальных результатов и упорядоченная После исключения анормальных результатов объем выборки для рассматриваемого примера составил 187 значений. Исключению подверглись пять последних значений упорядоченного ряда. Окончательные статистические оценки представлены на рис. 2.6. Здесь даны доверительный интервал [19, 15, 21, 46] для среднего, равного 20, 3, минимальное (3) и максимальное (47) времени цикла в выборке, а также СКО, равное 8, 02. На рис. 2.7 представлены разбивка на восемь интервалов, заданная ЛПР (STATISTICA может также выполнять разбивку на интервалы без вмешательства ЛПР) и частоты соответствующих интервалов (по каждому и накопленные) в абсолютном и процентном выражении. Процентное выражение частот, деленное на сто, является частостью. |S IATISTJCA: Basic Statistics and Tables [Descriptive Statistics |1ц_чп sta)] £ te £ < ft Йая fripht Options tfnda* Help Continue. Kini»u* Valid N 19.14848 21.46115 3.000000 47.00000 8.015317.586138 jOiiptirOFF |S«iOff |W«0*CHT Г Рис. 2.6. Значения статистических оценок выборки Процедура этапов построения гистограммы, таблиц вычисления значений теоретических и эмпирических частот для расчета критерия Пирсона, гистограммы и кривой плотности наиболее подходящего закона распределения, окна задания количества интервалов (категорий) и их границ II. iiiiifuM информация для моделирования представлена на рис. 2.8. На рис. 2.8 английский текст преобразован с ав- шрекой редакцией в русский. НКЕЗ MATISTICA Basic Stalistics and Tables [ВР_ЦИК11А (tu„sn sta)] In £ •» E< * yew fenafcros firapht Qptiont tfndow ЦФ Границы иниерВал 9 4.81283422 I 4, 8128342 ! 39 16.04278075 20.8556150 109 37.43315508 58.2887701 153 23.52941176 81.8181818 173 10.69518717 92.5133690 180 3.74331551 96.2566845 185 2, 67379679 98.9304813 187: 1.06951872 100.0000000 187 0, 00000000 100.0000000 ').00000< -x< 15, 0000 iS.0000< -»< 21.QP00 21, 0000< -x< 27.0000; 7.0000<»ж< 33.0000 J 3.0000< *x< 39, 0000 l i, 0000< -x< 45.0000 4l., 0000< -»< 51, 0n00 И Using ISetOFF |W«j*itOFF [ I'm, 2.7. Таблица границ интервалов и частот в абсолютном и процентном выражениях По результатам компьютерной подгонки теоретического распределении к > мпирическому определено: выбранный закон - нормальный, критерий ия (хи-квадрат) - равен 15, 626 при уровне значимости а = 0, 001 (среда го а выводит обозначение р) и числе степеней свободы сс = 5. Далее точно сравнить полученное значения хи-квадрат критерия при • • - 0, 001 с табличным [29], равным 18, 5, и принять гипотезу о приемлемо- | I и нормального распределения. Более эффективно сравнивать, на предмет iiintOopa, несколько распределений между собой. Эта возможность весьма т." фо реализуется в среде STATISTICA. УПРАЖНЕНИЯ К разделу 2.3 11роведите подготовку к наблюдению любой случайной величины, не тре- шачительных временных затрат для обработки. В качестве случайной «. пинии можно выбрать: при нахождении на производственной или учебной н,..и тис объем хлыста, диаметр сортимента, время цикла лесозаготовительной iHHiiiiii.i, интервалы времени между прибытиями автопоездов; при нахождении в пуча или дома - времена циклов лабораторных установок, другие техноло- щи факторы лабораторных установок и процесса их функционирования. Раздел 2 МЫИ1М.|р|х| jfSEte ЕЛ бпг^гё fiwphi Options tfndon tt*> jjiljsl JiJx| '/ALU Рис. 2.5. Фрагменты выборки значений времени цикла ВПМ: слева - неупорядоченная; справа - после исключения анормальных результатов и упорядоченная После исключения анормальных результатов объем выборки для рассматриваемого примера составил 187 значений. Исключению подверглись пять последних значений упорядоченного ряда. Окончательные статистические оценки представлены на рис. 2.6. Здесь даны доверительный интервал [19, 15, 21, 46] для среднего, равного 20, 3, минимальное (3) и максимальное (47) времени цикла в выборке, а также СКО, равное 8, 02. На рис. 2.7 представлены разбивка на восемь интервалов, заданная ЛПР (STATISTICA может также выполнять разбивку на интервалы без вмешательства ЛПР) и частоты соответствующих интервалов (по каждому и накопленные) в абсолютном и процентном выражении. Процентное выражение частот, деленное на сто, является частостью. SIATISTICA: Basic Statistics and Tables - (Descnptive Statistics |tu_yn, sta)] £ te Ed* уам finifcm fitwm Options tfndow Help 1 Continue... | Valid H BF_UilKJU ^Jil 1 Ке„> Confid. -95.ООО* 19.14848 Conf id. +95, 000% 21.46115 Kin lmua Max1»и»! 1 Std.Dev. Standard Error идти 3.01 10000 47, 00000 8.015317.586138 " |Oulput: OFF (SetOfF |Wcitf<: OFP f~ Рис. 2.6. Значения статистических оценок выборки Процедура этапов построения гистограммы, таблиц вычисления значений теоретических и эмпирических частот для расчета критерия Пирсона, гистограммы и кривой плотности наиболее подходящего закона распределения, окна задания количества интервалов (категорий) и их границ 11. \одная информация для моделирования представлена на рис. 2.8. На рис. 2.8 английский текст преобразован с ав- трской редакцией в русский. III/03422459893 4.6128342 IS tATISl 1СА Basic Statistics and Tahlns [BPJIMKIIA (1ц an stall Г! I to EtS y«w Дп*ш Graphs Qptiont Window t№ Границ интервал Частота 4, 81283422 9.00000< -х< 15.0000 16, 04278075 15. 0000< *ж< 21. 0000 37.43315508 Л.0000< -х< 27, 0000 23.52941176 17.0000< вх< 33, 0000 10.69518717 П, 0000< -х< 39-, 0000 3.74331551 |), 0000< -х< 45.0000 2, 67379679 4S.0000< =х< 51, 0000 2: 1, 06951872 Kissing 187 } 0.00000000 Hi 20.8556150 58.2887701 81.8181818 92.5133690 96.2566845 98.9304813 ЮО.ООООООО ЮО.ООООООО " |0utpUt0FF |S«tOFF |W«s*tQFF f I'm. 2.7. Таблица границ интервалов и частот в абсолютном и процентном выражениях По результатам компьютерной подгонки теоретического распределении I. > мпирическому определено: выбранный закон - нормальный, критерий теня (хи-квадрат) - равен 15, 626 при уровне значимости а = 0, 001 (среда и» h i го а выводит обозначение р) и числе степеней свободы сс = 5. Далее ни ни очно сравнить полученное значения хи-квадрат критерия при н ■ 0, 001 с табличным [29], равным 18, 5, и принять гипотезу о приемлемо- | I н нормального распределения. Более эффективно сравнивать, на предмет нпцПора, несколько распределений между собой. Эта возможность весьма hi н ipo реализуется в среде STATISTICA. УПРАЖНЕНИЯ К ра зделу 2.3 I (роведите подготовку к наблюдению любой случайной величины, не тре- ell шачительных временных затрат для обработки. В качестве случайной можно выбрать: при нахождении на производственной или учебной ч н пни' объем хлыста, диаметр сортимента, время цикла лесозаготовительной • шиши интервалы времени между прибытиями автопоездов; при нахождении в пут или дома - времена циклов лабораторных установок, другие техноло- к иг факторы лабораторных установок и процесса их функционирования. II. iiiiifuM информация для моделирования К разделу 2.4.1 * Определите частоты, частости и вид случайной величины - дискретная или мощи рывная - для примера к разделу 2.3. * 11ро ведите упорядочивание и представьте ряд распределения для этого же примера. * 11роведите проверку результатов наблюдений - для случайной величины и их, полученных в упражнении к разделу 2.2, - на анормальность. * Нычислите среднее арифметическое, выборочную дисперсию и среднее | ни чрншчсское отклонение на основе выражений (2.11), (2.12), (2.13) для данных исключения анормальных результатов. * 11остройте гистограмму или многоугольник на основе данных, полученных и предыдущих упражнениях. * 11а основе гистограммы (многоугольника) и графиков плотности (см. рис. '! I подберите наиболее приемлемый закон распределения. * 11роведите проверку согласия выбранного закона распределения по наибо- находящему критерию (Пирсона, Колмогорова) К разделу 2.4.2 * Определите наличие зависимости, вычислив коэффициент корреляции ме- + и пшметром и объемом хлыста. ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ I Какие способы могут быть использованы для обработки экспериментальна шиш, IX лесопромышленного комплекса? ! С какой целью проводится упорядочивание результатов наблюдений? I В чем заключается сущность проверки результатов наблюдений на анор- Ми н.пость? 4. Как рассчитываются статистики выборки - среднее арифметическое, вы- гшрн'ниш дисперсия, среднее квадратическое отклонение? " | Какова последовательность выбора закона распределения? 6. Каким образом проводится построение гистограмм и многоугольников для нмнпрпческих распределений? /.В чем заключается сущность критериев согласия (раскройте, используя ■ рифичсскую интерпретацию критериев на рис. 2.4)? К Каким образом определяются вероятности и теоретические частоты вы- иго шконараспределения? Ч, С какой целью - применительно к лесопромышленным объектам - прово- рудоемкая процедура выбора закона распределения? IО В чем сущность метода наименьших квадратов и что является мерой рас- и I н пня в этом методе?
|