Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Теоретические сведения. Предварительная обработка данных
Предварительная обработка данных. Для того чтобы оценить воспроизводимость анализа и провести статистическую обработку, необходимо прежде всего получить по одной и той же методике n результатов прямых измерений. Ими могут быть объемы титранта для нескольких одинаковых аликвот, значения аналитического сигнала при его повторных измерениях и т.п. Соответствующие величины (варианты выборки) должны относиться к одному и тому же объекту исследования и быть записаны в порядке их получения. В записи каждой варианты последняя значащая цифра должна соответствовать по разряду абсолютной погрешности измерения, в частности цене деления, а все варианты должны быть равноточными. Статистическую обработку выборки нельзя вести при наличии грубых промахов, поэтому их надо заранее выявить и исключить. Из нескольких методов их выявления рекомендуется пользоваться наиболее простым - проверкой данных с помощью Q-теста (приложение 8). Если переписать варианты в порядке увеличения измеряемой величины (провести ранжирование), то грубыми промахами могут оказаться крайние варианты, т.е. наибольший или наименьший результаты. Для проверки сомнительного X1 (наименьшего результата) рассчитывают Qэксп по формуле: Qэксп = , (32) а при проверке сомнительного Xn (наибольшего результата) пользуются формулой: Qэксп = , (32а) где xn и x1 - крайние варианты в ранжированной выборке, а x2 и xn-1 - ближайшие к ним.В любом случае величина Qэксп должна быть положительной. Сомнительная варианта (х1 или xn) отбрасывается, если значение Qэксп оказывается больше, чем Qтабл для выбранного уровня значимости и данного числа вариант (см. пример 1), в противном случае считают, что промах не выявлен, и сомнительный результат оставляют. Вместо Q-теста можно использовать более строгие критерии отбраковки грубых промахов. Так, при одновременном присутствии двух сомнительных результатов рекомендуется пользоваться методом максимальных относительных отклонений (пример 2). Статистическая обработка не проводится и при наличии дрейфа - особого вида систематической погрешности данных, обычно связанной с изменением состава исследуемой пробы или реагентов во времени. Наличие дрейфа можно предположить, если при достаточно большом количестве вариант (не менее пяти) каждая из них последовательно оказывается больше (или меньше) предыдущей. В этом случае после отбраковки грубых промахов следует провести статистическую проверку значимости дрейфа. В выборке выделяют две группы вариант, взяв их в начале и в конце серии измерений. Затем сравнивают средние значения по обеим группам, пользуясь t-критерием (см. пример 7). Величину tтабл выбирают с учетом числа вариант в каждой из групп и требуемой достоверности выводов. Если tэксп > tтабл, считают дрейф доказанным. Никакая статистическая обработка полученных данных в этом случае не производится, а исследуются и устраняются причины дрейфа. Проверка характера распределения. Наиболее распространенные способы статистической обработки результатов анализа основаны на предположении, что эти результаты подчиняются нормальному распределению, и вероятность получения любого возможного результата в их генеральной совокупности можно рассчитать по формулам Гаусса. Однако это предположение далеко не всегда истинно; для некоторых объектов и некоторых методик анализа результаты могут соответствовать распределению Пуассона или другим известным распределениям, отличающимся от нормального. Поэтому при достаточном объеме экспериментальных данных следует проверить характер их распределения. Для этого существует ряд способов [19-23], из которых наиболее простым является проверка значимости коэффициентов асимметрии и эксцесса (пример 3). Громоздкие расчеты этих коэффициентов удобно вести с применением специальных компьютерных программ. Если эти коэффициенты не превышают некоторых критических (табличных) значений, считают распределение симметричным и не имеющим достоверного эксцесса, что подтверждает предположение о нормальном (гауссовском) распределении результатов анализа. Возможны и более надежные способы (по критерию Пирсона), но они требуют еще большего объема вычислений. Расчет выборочных параметров и доверительных интервалов. Если в описании используемой методики измерений (паспорте прибора, ГОСТе) не указываются количественные характеристики воспроизводимости - генеральное стандартное отклонение s или заменяющие его величины sr, sx сред и др., то доверительный интервал, в который с заданной надежностью попадает истинное значение измеряемой величины, находят по экспериментальным данным. Для этого после отбраковки грубых промахов рассчитывают следующие параметры: - среднее арифметическое из всех n вариант, S2 - выборочную дисперсию; S - выборочное стандартное отклонение S 2 = ; S = . (33) По выборочным параметрам можно с заданной надежностью оценить m - истинное значение измеряемой величины. Однако статистическая обработка не позволяет найти m, как и другие параметры генеральной совокупности, абсолютно точно. Мы находим лишь интервал значений, в котором с заданной вероятностью (надежностью) находится m. Ширина интервала при прочих равных условиях тем больше, чем больше эта вероятность, которая обозначается символом P. При расчете доверительных интервалов обычно используются значения P = 0, 90; 0, 95; 0, 99. Способ расчета доверительного интервала зависит от того, какому распределению случайных величин соответствуют полученные нами данные. В случае нормального распределения данных границы доверительного интервала Xmin и Xmax рассчитывают по формулам Стьюдента: £ m £ (34) Расчеты по этой формуле дают правильные результаты только в том случае, когда исходные данные (результаты измерений) не содержат значимой систематической погрешности (примеры 4-5). Значения коэффициента Стьюдента (t) приведены в приложении 8. Вероятность того, что в отсутствие дрейфа, грубых промахов, систематических погрешностей и при нормальном распределении данных значение m случайно окажется вне границ доверительного интервала, равна 1 - P. Эту вероятность обозначают обычно буквой a и называют уровнем значимости. В справочниках значения коэффициента Стьюдента обычно приводятся для a = 0, 10; 0, 05 и 0, 01. Величина t зависит и от n (числа параллельно полученных результатов, используемых при расчете интервала). Однако в справочниках значения t приводятся как функция от числа степеней cвободы (df). При расчете доверительных интервалов df = n-1, в других случаях зависимость между n и df может быть иной[8]. Формулу (34) можно использовать не только для обработки прямых измерений, но и для обработки результатов анализа, вычисленных по прямым измерениям. Так, например, при титровании по методу отдельных навесок прямыми измерениями в каждом опыте являются значения массы и объема титранта, по ним вычисляют содержание компонента, но статистически обрабатывать ни эти объемы, ни массы нельзя. Доверительные интервалы рассчитывают для содержаний (массовых долей), вычисленных по результатам прямых измерений в параллельных опытах. Выявление систематических ошибок. Несовпадение среднего результата анализа и истинного содержания компонента в исследуемом материале может быть случайностью, а может быть и следствием систематической погрешности анализа. Для проверки результаты многократного анализа образца с известным содержанием данного компонента выражают в виде доверительного интервала. Если истинное значение m в вычисленные границы интервала не попадает, с надёжностью P можно утверждать, что использованный метод анализа имеет значимую систематическую погрешность, т.е. дает неправильные результаты (пример 5). Сравнение экспериментальных данных по воспроизводимости. При сопоставлении двух методик анализа (двух приборов, двух лаборантов и т.п.) по воспроизводимости полученных данных используют статистический критерий Фишера (пример 6): экспериментальное значение F = S12 / S22 сопоставляется с табличным значениями F табл. Следует обратить внимание, что первой дисперсией считают ту, которая больше по абсолютной величине, независимо от того, сколько в каждой выборке вариант и какая серия измерений проводилась раньше. Поэтому Fэксп всегда больше 1. Критические значения F табл отыскивают в таблицах для подходящих значений n 1 и n 2 (df1 и df2) и выбранного уровня значимости (см. приложение 10). Дисперсии считают неоднородными, а серии измерений - достоверно отличающимися по воспроизводимости, если Fэксп > Fтабл. В противном случае различие в воспроизводимости методик считают недоказанным. Сравнение результатов анализа. Различие между средними арифметическими в двух сериях измерений (анализов) может быть статистически достоверным (в этом случае такое различие будет воспроизводиться при повторении измерений) или случайным. Статистическое сравнение средних значений двух выборок позволяет делать обоснованные выводы из проведенных исследований и поэтому особенно важно для специалиста, независимо от того, в какой именно области науки или техники он работает. Обычно сравнение средних проводится по критерию Стьюдента (пример 7). Сопоставление средних значений по Стьюденту в о з м о ж н о, если: а) в обеих выборках отсутствуют грубые промахи; б) измеряемая величина имеет нормальное распределение; в) дисперсии обеих выборок однородны. Поэтому сравнению средних значений должна предшествовать проверка по критерию Фишера. Экспериментальное значение t- критерия находят по формуле: , (35) где в числителе стоят средние арифметические первой и второй выборок, а в знаменателе - обобщенное стандартное отклонение. Последнюю величину считают по-разному: Sd = при n1=n2=n. (35а) Sd» при n1 ¹ n2. (35б) При существенном отличии в объеме выборок можно применять и более точные формулы. Величину tэксп сравнивают с табличными значениями для выбранного уровня значимости (см. пример 7), при этом число степеней свободы df = n1 + n2 - 2. Различие средних достоверно, если найденное значение t больше, чем t0, 01. Если t меньше, чем t0, 05, то различие средних считается статистически недоказанным, однако и в этом случае не следует утверждать, что результаты анализа, представленные данными двух выборок, достоверно совпадают.
|