Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Отбраковка сомнительных данных
Массовые наблюдения и эксперименты, полученные в лесу на пробных площадях, опытных делянках, лесных культурах или в лесном питомнике, представляют собой набор цифр. Чтобы статистически обработать цифровой материал, необходимо составить вариационный ряд (или ряды). Довольно часто возникает ситуация, когда в ранжированном ряду оказываются числа, вызывающие сомнения (из-за ошибки наблюдателя, прибора, патологии данного растения или его части и т. п.). Их следует проверить на принадлежность к данной совокупности. Эта работа выполняется перед обработкой вариационных рядов. В случае значительного «отскока» они должны быть отбракованы, т. е. исключены из дальнейших расчетов. Для этого используют формулы для проверки сомнительных значений. Если сильно отклоняется одно минимальное значение в ряду, то применяется критерий , вычисляемый по уравнению = (Х2 - Х1) / (Хn- Х1), где Х1 – первое (сомнительное) значение в ранжированном ряду, Х2 – второе, Хn – последнее. Полученное значение после этого сравнивают с табличным (табл. 4.1) при Р0, 95или Р0, 99. Пример. Измерена длина побегов, см: 3, 7; 5, 2; 5, 4; 5, 4; 5, 5; 5, 5; 5, 8; 5, 9; 6, 0. В данном ряду измерений вызывает сомнение первое значение (3, 7). Вычисляем: = (5, 2-3, 7) / (6, 0-3, 7) = 0, 652, что больше табличного значения (n= 9) 0, 437. Следовательно, первое значение должно быть отбраковано, т.е. не должно включаться в расчет. Таблица 4.1 Критические значения и для исключения крайних вариант (1 – одного значения, 2 – двух значений)
Для проверки одной максимальной варианты используется критерий: = (Хn- Хn-1) / (Хn- Х1), где Хn – последнее значение (варианта), Хn-1 – предпоследнее значение (варианта). Пример. Измерена длина листьев у дерева, см: 4, 9; 5, 2; 5, 4; 5, 4; 5, 5; 5, 5; 5, 8; 5, 9; 6, 0; 6, 5. В данном ряду измерений вызывает сомнение последнее значение (6, 5). Вычисляем: = (6, 5–6, 0) / (6, 5–4, 9) = 0, 5: 1, 6 = 0, 312, что меньше 0, 412. Следовательно, последнее значение следует включить в расчеты, т.е. оно не должно отбраковываться. Если сомнительными являются два крайних значения и при этом оба находятся в одном из концов ранжированного ряда, то их оценка производится по или : = (Х3 –Х1) / (Хn - Х1) (для Х1 и Х2); или = (Хn –Xn-2) / (Хn - Х1) (для Хn и Хn-1). Пример. Измерена толщина коры у деревьев на высоте 1, 3 м, см: 0, 6; 0, 6; 0, 9; 1, 2; 1, 4; 1, 4; 1, 5; 1, 5; 1, 8; 1, 9; 2, 0; 2, 1. Вызывают сомнения первые два значения вариационного ряда. Вычисляем: = (0, 9-0, 6) / (2, 1 - 0, 6) = 0, 3 / 1, 5 = 0, 200. Полученный результат меньше табличного значения (0, 376), поэтому первые два значения ряда относятся к данной совокупности, а потому не требуют исключения в дальнейших расчетах. Пример. Измерена толщина коры у деревьев на высоте 1, 3 м, см: 1, 2; 1, 4; 1, 4; 1, 5; 1, 5; 1, 8; 1, 9; 2, 0; 2, 1; 2, 8; 2, 9. В этом рядувызывают сомнение два последних значения. Также вычисляем: = (2, 9 -2, 1) / (2, 9 -1, 2) = 0, 8 / 1, 7 = 0, 470. Полученный результат больше табличного значения (0, 392), поэтому последние два значения ранжированного ряда не относятся к данной совокупности и потому должны быть исключены при его дальнейшей обработке. При двух сомнительных значениях в ранжированном ряду, когда одновременно одно из них минимальное, а другое максимальное, для их проверки употребляют критерий или: = (Х2 –Х1) / (Хn-1 - Х1) (для оценки Х1) или = (Хn –Хn-1) / (Хn – Х2) (для оценки Хn). Для оценки используется табл. 4.2. Пример. Измерена высота подроста на участке одной породы и одного возраста, м: 0, 3; 0, 9; 1, 2; 1, 4; 1, 4; 1, 6; 1, 8; 1, 9; 1, 9; 2, 4; 3, 5. В данном ряду вызывают сомнение начальное и конечное значения. Вычисляеми: = (0, 9 – 0, 3) / (2, 4 – 0, 3) = 0, 6 / 2, 1 = 0, 286; = (3, 5 – 2, 4) / (3, 5 - 0, 9) = 1, 1 / 2, 6 = 0, 423. Таблица 4.2 Критические значения идля исключения крайних вариант
Полученные результаты и для n = 11 оказались меньше табличных значений для Р0, 95и Р0, 99(0, 450 и 0, 566). Следовательно, оба крайних значения относятся к данной совокупности и не должны исключаться при дальнейшей обработке ряда. Более надежным способом проверки принадлежности вариант к рассматриваемому рядуявляется вычисление по формуле с использованиемосновного отклонения σ: = I xi – М I: σ где М – среднее арифметическое значение (вычисляется без отбрасывания сомнительных вариант); σ – основное отклонение вариант; xi – сомнительная варианта. Полученное значение сравнивают с табличным при Р0, 95или Р0, 99(табл.4.3). Для сравнения воспользуемся уже рассмотренным примером. Сопоставим результат проверки принадлежности сомнительной варианты к одному ряду на примере измерения длины побегов, приведенного выше. М= 5, 4 см; σ = 0, 68 см; = I3, 7 – 5, 4 I/ 0, 68 = 2, 50. При п = 9 Р0, 95= 2, 35, Р0, 99= 2, 53. Таким образом, значение 3, 7 см на уровне Р0, 95 следует исключить при дальнейшей обработке, а на уровне Р0, 99гипотеза принадлежности первой варианты к другой совокупности не подтверждается. Таблица 4.3 Критические значения для исключения крайних вариант при Р0, 95и Р0, 99
Примечание. Значение исключается из ряда при > 0, 05 или 0, 01. Если в указанной формуле среднее значение и коэффициент варьирования выводятся при исключении сомнительной варианты, тогда полученное значениесравнивается с критическим по критерию Стьюдента (табл.4.4). Число степеней свободы берется равным п– 1. Таблица 4.4 Критические значения критерия Стьюдента при Р0, 95и Р0, 99
Примечание. Значение исключается из ряда при > 0, 05или0, 01. Пример. Вычислимиз данных предыдущего примера (измерения длины побегов) при исключении сомнительной варианты: = I3, 7 – 5, 6 I/ 0, 28 = 6, 79. Полученное значение указывает, что первая варианта превосходит табличные значения критерия Стьюдента, а потому не должна включаться в данный ряд. По каждому вариационному ряду выводятся показатели: среднее значение с ошибкой, среднее квадратичное отклонение с основной ошибкой (характеризует степень рассеянности ряда), коэффициент изменчивости (применительно к древостою, по А.В. Тюрину: до 10 % – малая изменчивость, 10-30 % –средняя и свыше 30 % – большая, по И.В. Семечкину: до 5 % – слабая, 6-10 % – умеренная, 11- 20 % – значительная, 21-50 % – большая, более 50 % – очень большая), точность опыта (показывает процент расхождения между средними значениями генеральной и выборочной совокупностей).
|