![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Статистическое решение и вероятность ошибки
До сих пор под проверкой статистической гипотезы мы подразумевали процедуру определения надежности связи (р-уровня, как показателя статистической значимости). Однако в конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная — о ее наличии. Соответственно, от этого зависит и окончательный, содержательный вывод исследования: подтверждена или нет исходная научная гипотеза. Вполне очевидно, что основанием для принятия исследователем решения о том, какая гипотеза верна, является р-уровень — вероятность того, что верна все-таки нулевая гипотеза. Чем меньше р-уровень, тем с большей уверенностью можно отклонить Н0 в пользу Н1, тем самым подтвердив исходную содержательную гипотезу. Не менее очевидно и то, что, принимая решение, исследователь всегда допускает вероятность его ошибочности: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. При отклонении Н0 в пользу Н1 исследователь рискует, что связи на самом деле в генеральной совокупности нет. И наоборот, решение в пользу Н0 вовсе не исключает наличие связи. Рассмотрим возможные исходы принятия решения в зависимости от действительного положения дел: В действительности:
Н0 истинна Н1 истинна
Принять Н0
Как следует из таблицы, решение исследователя зависит от того, какую вероятность ошибки I рода α, он считает допустимой: если р-уровень, полученный в процессе проверки гипотезы, меньше или равен α, исследователь отклоняет Н0, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). Отметим, что в этом случае вероятность ошибки известна, она меньше или равна α, точнее, равна р-уровню. Если же р-уровень превышает α, то принимается Н0 и содержательная гипотеза не подтверждается. Но при этом вероятность ошибки II рода β — того, что верна все же Н1 обычно остается неизвестной. Рассмотрим соотношение ошибок I и II рода. Предположим, как и в прошлых примерах, проверяется гипотеза об отличии среднего значения от некоторой величины А. Нулевой гипотезе Н0: М =А соответствует известное теоретическое распределение со средним А. Предположим также, что в генеральной совокупности на самом деле среднее значение больше А и равно В, а исследователь, как обычно, об этом даже и не догадывается. Этому положению дел будет соответствовать свое, «альтернативное» теоретическое распределение, сходное с распределением для Н0, но со средним В (рис. 7.3). На рис. 7.3 видно, что с уменьшением α растет «доверительная вероятность» 1 — α, которая определяет величину отклонения выборочного среднего от А для принятия Н0: уменьшая α, исследователь увеличивает возможное отклонение выборочного среднего от А, при котором принимается Н0. Принятие Н0 при больших отклонениях выборочного среднего от А увеличивает вероятность ошибки II рода, β, вероятность того, что на самом деле верна альтернативная гипотеза. Таким образом, снижение величины α увеличивает риск допустить ошибку II рода - не обнаружить различия или связи, которые на самом деле существуют. Величина (1—α) называется доверительной вероятностью; она задает доверительный интервал значений выборочной статистики (в нашем примере — среднего). Если выборочное значение попадает в этот интервал, то гипотеза Н0 не отклоняется. Вероятность (1—β) называется мощностью (чувствительностью) критерия, Эта величина характеризует статистический критерий (метод, тест) с точки зрения его способности отклонять Н0, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестной. Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины α, удовлетворяющее двум противоречивым требованиям. Величина α должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Н0. Величина α должна быть достаточно велика, чтобы отклонить Н0 при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина α является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении α для статистического вывода: - Для установленного значения α вероятность ошибки β уменьшается с ростом объема выборки. - Вероятность ошибки β уменьшается при увеличении значения α (например, с 0, 01 до 0, 05). Вопрос о величине α — вопрос о том, при каком же р-уровне исследователь может отклонить Н0, решается преимущественно исходя из неформальных соглашений. Традиционная интерпретация различных уровней значимости исходит из α = 0, 05 и приведена в табл. 7.1. В соответствии с ней приемлемым для отклонения Н0 признается уровень р < 0, 05. Такая относительно высокая вероятность ошибки I рода может быть рекомендована для небольших выборок (когда высока вероятность ошибки II рода). Если объемы выборок около 100 и более объектов, то порог отклонения Н0 целесообразно снизить до α = 0, 01 и принимать решение о наличии связи (различий) при р< 0, 01. Таблица 7, 1 Традиционная интерпретация уровней значимости при α = 0, 05
|