Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Построение двухстороннего доверительного интервала для стандарта.






1.Множители l, входящие в формулу (234) и взятые из таблицы (Приложение Р) на уровне значимости a = 0, 05 для малой выборки (число степеней свободы равно 11), равны 0, 71 и 1, 70, соответственно.

2. По формулам (234) находим границы доверительного интервала для стандарта:

s н = lнm = 0, 71 ∙ 0, 9″ = 0, 64″;

s в = lвm = 1, 70 ∙ 0, 9″ = 1, 53″.

Здесь так же двухсторонний доверительный интервал увеличил свою длину по сравнению с нормальным на 11% и, кроме того, стал асимметричным относительно точечной оценки, равной 0, 9″.

Вербальная информация, изложенная в разделе 2.3, систематизирована в иллюстративной таблице «Систематизация основных определений и теорем по интервальному оцениванию» (Приложение И).

3.3 Статистические гипотезы.

Статистические гипотезы – это высказывания о свойствах генеральной совокупности (законе распределения, параметрах закона, числовых характеристиках и т.п.), осуществляемые и проверяемые по выборке из этой генеральной совокупности. Обычно гипотеза обозначается буквой H 0, а в фигурных скобках помещается текст высказывания, записанный либо на обычном языке, либо на языке вероятностной алгебры. Приведём пример одного из возможных вариантов такой записи: H 0 = {генеральная совокупность распределена нормально с параметрами a = 4; b = 2 } = { X N (4; 2) }.

Гипотеза является случайным событием и, следовательно, может быть охарактеризована некоторой вероятностью P (H 0).

Для проверки высказываемой гипотезы составляется некоторая оценивающая функция, аргументами которой являются n элементов xi выборки из гипотетической генеральной совокупности X и m параметров aj этой же генеральной совокупности. Наличие последних не обязательно. Такую функцию называют статистикой, критерием или тестом. Естественно, что всякая статистика будет случайной величиной, закон распределения которой можно заранее установить.

Итак, пусть оценивающая функция некоторой статистики имеет вид:

u = U (x 1, x 2, … xn; a 1, a 2, … am), (239)

где x 1, x 2, … xn – элементы выборки, а a 1, a 2, …, am – параметры закона, которому подчиняется генеральная совокупность. При этом, естественно, что m < n. Закон распределения оценивающей функции полагается установленным, например, в форме функции распределения:

F ( u ) = P (U < u ). (240)

В такой ситуации с вероятностью a, называемой уровнем значимости, можно вычислить 100 a % -ную (сто альфа-процентную) квантиль

u a= arg (F = a). (241)

Иными словами, попадание эмпирического значения статистики u Э в критическую область u K, расположенную правее точки u a, возможно лишь с малой вероятностью a и признается практически редким событием, в силу чего, высказанная гипотеза H 0отвергается. Если же окажется, что u Э будет находиться левее u a, то можно сказать, что гипотеза H 0 не противоречит экспериментальным данным выборки и, следовательно, не отвергается. Вышеизложенное предполагает, что область, в которой гипотеза не отвергается, представляет собой односторонний доверительный интервал.

Аналогичными рассуждениями можно описать и двухсторонний интервал ] u н; u в[, выход за пределы которого числа u э, позволяет отвергнуть гипотезу H 0. Нижняя (u н) и верхняя (u в) границы такого доверительного интервала так же определяются как соответствующие квантили. Это 100(1–α /2)% -ная и 100(α /2)% -ная квантили, соответственно:

u н = arg(F = 1 – a/2);

u в = arg(F = a/2).

Говорить, что гипотеза H 0 «принимается» не корректно, так как принять можно бесчисленное множество сколь угодно близких гипотез, а отвергнутьединственную, проверяемую. В связи со сказанным, при проверке гипотез важную роль играет правильная формулировка текста проверяемой гипотезы. По сути, она должна быть таким высказыванием, отказ от которого нас практически и устраивает.

Когда гипотеза H 0 верна, а по результатам тестирования мы вынуждены её отвергнуть, то говорят, что произошла ошибка первого рода, вероятность совершения которой как раз и равна уровню значимости a. Ошибку первого рода ещё называют «риском изготовителя».

Основной гипотезе H 0 противопоставляется альтернативная гипотеза H a. В ситуации, когда верна альтернативная гипотеза H a, а мы её не отвергли, то говорят, что произошла ошибка второго рода, вероятность совершения которой так же должна быть небольшой. Обычно, эту вероятность обозначают буквой b. Ошибка второго рода имеет и другое название: «риск потребителя».

Описанную в двух последних абзацах ситуацию можно представить в виде таблицы вероятностей проверки гипотез (Табл.3.2), предварительно введя следующие события: A = {гипотеза не отвергается } и B = {гипотеза отвергается }. Тогда ошибка первого рода или риск изготовителя – это условное событие { B | H 0 }, а ошибка второго рода или риск потребителя – это { A | H a }.

 

Таблица вероятностей проверки гипотез

Табл.3.2

Решение Ист. гипотеза Не отвергается   A Отвергается   B
Основная H 0 P (A | H 0)– не определена P (B | H 0) = a– вероятн. ош-ки I рода
Альтернативная H a P (A | H a) = b– вероятн. ош-ки II рода P (B | H a)– не определена

Неопределенность вероятности не отвергнуть нулевую гипотезу P (A | H 0) и вероятности отвергнуть альтернативную гипотезу P (B | H a) объясняется тем, что количество как основных, так и альтернативных гипотез, неопределённо, потому что на любом конечном интервале можно выбрать бесконечное множество количественно близких и практически неразличимых параметров гипотетических законов.

Проиллюстрируем на примере гипотезы о нормальности распределения геометрический смысл вероятностей ошибок I и II рода (Рис. 3.3).

Изготовитель и потребитель независимо определяют как параметры положения своих гипотез а 0 и а A, так и вероятности своих рисков a и b. Изготовитель, стараясь уменьшить вероятность P (B | H 0) = a ошибки первого рода, раздвигает границы доверительного интервала, чем автоматически воздействует на вероятность P (A | H a) = b ошибки второго рода, увеличивая её. Этому, естественно, противодействует потребитель, изменяя параметр положения а A своей гипотезы H a таким образом, чтобы вероятность b вновь стала приемлемой для него. Установление паритета рисков, т.е. выбор параметров положения а о и а A под условием a = b – один из способов решения этой проблемы.

f (u)
 
U
α
β
u α
a 0
a A

Рис. 3.4 Основная и альтернативная гипотезы:

вероятности ошибок I и II рода.

Иногда, изготовитель и потребитель – одно и то же лицо. В такой ситуации он сам решает, какой из рисков для него важнее и, следовательно, назначает разные вероятности a и b.

В следующих параграфах рассматриваются некоторые наиболее часто проверяемые гипотезы и приводятся соответствующие методики их проверки.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.008 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал