Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Статистическое решение и вероятность ошибки
В конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная – о ее наличии. Чем меньше р -уровень, тем с большей уверенностью можно отклонить Н 0 в пользу H 1, тем самым, подтвердив исходную содержательную гипотезу. Но, всегда есть вероятность ошибки: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. Этот конфликт представим в табличной форме.
Вопрос в том, какую вероятность ошибки I рода α, считается допустимой: если р ‑ уровень, полученный в процессе проверки гипотезы, меньше или равен α, исследователь отклоняет Н 0, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). В этом случае вероятность ошибки известна, она меньше или равна α, точнее, равна р ‑ уровню. Если же p -уровень превышает α, то принимается Н 0 и содержательная гипотеза не подтверждается. Но при этом вероятность ошибки II рода β ‑ того, что верна все же Н 1, обычно остается неизвестной. При этом, чем меньше величина α, тем больше риск допустить ошибку II рода – не обнаружить различия или связи, которые на самом деле существуют. Величина (1- α) называется доверительной вероятностью; она задает доверительный интервал значений выборочной статистики. Если выборочное значение попадает в этот интервал, то гипотеза Н 0 не отклоняется. Вероятность (1- β) называется мощностью (чувствительностью) критерия. Она характеризует статистический критерий (метод, тест) с точки зрения его способности отклонять Н 0, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестной. Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины α, удовлетворяющее двум противоречивым требованиям. Величина α должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Н 0. Величина α должна быть достаточно велика, чтобы отклонить Н 0 при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина α является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении α для статистического вывода: · Для установленного значения α вероятность ошибки β уменьшается с ростом объема выборки. · Вероятность ошибки β уменьшается при увеличении значения α. Вопрос о величине α – вопрос о том, при каком же р ‑ уровне исследователь может отклонить Н 0 решается преимущественно исходя из неформальных соглашений. Обычно для отклонения Н 0 для небольших выборок (когда высока вероятность ошибки II рода) принимают уровень α ≤ 0, 05. Если объемы выборок около 100 и более объектов, то целесообразно принимать решение о наличии связи (различий) при α ≤ 0, 01.
Традиционная интерпретация уровней значимости.
|