Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Постановка задачи проверки простой гипотезы о вероятностях. Применение критерия хи-квадрат к задаче проверке гипотезы о распределении полностью известном.






 

Рассмотрим следующую задачу проверки гипотезы: пусть – выборка из неизвестного распределения и основная гипотеза заключается в том, что , где – известная функция распределения. Требуется предложить критерий проверки гипотезы .

Воспользоваться критерием хи-квадрат для решения непосредственно поставленной задачи не возможно, тем не менее, имеется возможность сформулировать «близкую» к поставленной задачу, для решения которой использовать критерий хи-квадрат.

Пусть некоторые числа, рассмотрим разбиение числовой оси на интервалы и полуинтервалы:

,

,

…,

,

.

Зафиксируем некоторый номер и определим события,

,

,

…,

.

Легко видеть, что события , , …, вообще говоря при всех одинаковы, поскольку все случайные величины выборки одинаковы (имеют одну и ту же функцию распределения ), и кроме того образуют полную группу событий, поскольку несовместны и их объединение есть множество всех элементарных событий. Определим вероятности , , …, событий , , …, :

,

,

…,

.

Рисунок 6.3. Разбиение и вероятности.

Из исходного наблюдения – выборки – сформируем вектор по правилу:

,

,

то есть – случайное количество величин выборки попавших в интервал (полуинтервал) .

В качестве основной гипотезы рассмотрим «расширенную» гипотезу :

, , , , …, (6.7)

Теперь для проверки «расширенной» гипотезы может быть использован критерий хи-квадрат, рассмотренный выше.

Из (6.7) следует, что гипотеза заключается в том, что:

Таким образом, «расширенная» гипотеза утверждает, что только для точек , а гипотеза утверждает, что для всех , поэтому и , вообще говоря, различные гипотезы. Фактически, утверждает, что истинное распределение принадлежит некоторому множеству :

: ,

где – множество таких функций распределения , что :

.

Конечно, , однако, в могут оказаться и другие функции , отличные от , поэтому гипотеза «расширенная».

Остается вопрос о выборе точек , …, , которые определяют интервалы и события , …, : на практике количество точек выбирают так чтобы,

,

при этом местоположение точек выбирают так, чтобы все гипотетические вероятности оказались приближенно равны между собой:

.

 

Постановка задачи проверки сложной гипотезы о вероятностях и критерий хи-квадрат. Теорема Фишера об асимптотическом распределении минимальной по параметру статистики в случае, если основная гипотеза верна. Замечание об использовании МП-оценок. Применение критерия хи-квадрат к задаче проверки гипотезы о распределении с неизвестным параметром.

 

Пусть проводится серия из независимых испытаний, в каждом из которых может произойти в точности одно из событий , …, , имеющих неизвестные вероятности , …, . По результатам серии фиксируются количества наступлений событий , …, , так что наблюдение представляет собой вектор случайных величин , имеющий полиномиальное распределение .

Основная гипотеза заключается в том, что неизвестные вероятности равны заданным выражениям при некотором значении параметра (в общем случае параметр является -мерным):

: , …, .

Требуется предложить статистический критерий проверки гипотезы .

Заметим, что сформулированная задача, схожа с задачей, рассмотренной в пункте 2, отличие заключается в том, что гипотетические вероятности являются не числовыми значениями, а некоторыми функциями параметра . Указанное отличие не позволяет в качестве статистики критерия использовать статистику :

,

поскольку статистика оказывается зависимой от параметра , теорема Пирсона (6.15) не может быть применима и как следствие предельное (при ) распределение статистики неизвестно. Более того, следует ожидать, что это распределение окажется различным при различных значениях параметра . Тем не менее, при специальном выборе параметра удается найти предельное распределение.

Предположим, что при каждой реализации наблюдения значение параметра выбирается таким образом, чтобы минимизировать значение статистики . Минимальные значения статистики образуют новую статистику , не зависящую от параметра:

.

Пусть – значение параметра , при котором достигается минимальное значение статистики , тогда:

Теорема 6.18. (Фишер)

Пусть наблюдение имеет полиномиальное распределение и основная гипотеза заключается в том, что:

: ,

где -мерный параметр и – известные функции. Если гипотеза верна, тогда распределение статистики:

,

стремиться при к распределению .

Без доказательства.

Вычисление статистики требует трудоемкой операции нахождения минимума, а для решения в общем виде требует нахождения функции доставляющей минимум статистики , что существенно затрудняет использование статистического критерия. Оказывается, сформулированная выше теорема Фишера справедлива и в том случае, когда вместо функции используется МП-оценка параметра , вычисляемая по функции правдоподобия, составленной в соответствии с тем видом функции распределения наблюдения, которую определяет гипотеза .

Теорема 6.19. (Фишер)

Пусть наблюдение имеет полиномиальное распределение и основная гипотеза заключается в том, что:

: ,

где -мерный параметр ( – множество допустимых значений параметра ), и функции таковы, что:

1) (),

2) существуют и непрерывны производные (, ),

3) существуют и непрерывны производные (, , ),

4) для всех ранг матрицы, образованной частными производными, равен .

Если гипотеза верна и – МП-оценка параметра , тогда распределение статистики,

стремится при к распределению .

Без доказательства.

В качестве критической области выбирается область вида:

,

где пороговое значение выбирается исходя из заданного уровня значимости как квантиль уровня распределения . В остальном статистический критерий аналогичен статистическому критерию хи-квадрат, рассмотренному в пункте 2.

 

Применение критерия хи-квадрат к задаче проверки гипотезы о распределении с неизвестным параметром.

Пусть – выборка из неизвестного распределения и основная гипотеза заключается в том, что , где – функция распределения известная с точностью до значения параметра . Требуется предложить критерий проверки гипотезы .

На практике сформулированную задачу заменяют другой, но «близкой» задачей: выбираются точки и рассматривается разбиение числовой оси на полуинтервалы и интервалы:

, , …, .

Рассматриваются события , …, :

.

Легко видеть, что,

,

,

…,

.

Для исходной выборки определяется вектор так, что:

,

.

В качестве основной гипотезы рассматривается «расширенная» гипотеза :

, ,

,

,

…,

.

Для проверки гипотезы используется статистический критерий со статистикой , где – МП-оценка параметра .

В качестве критической области выбирается область вида:

,

где – квантиль уровня распределения и – заданный уровень значимости.

На практике, как правило, сперва вычисляется МП-оценка , и лишь затем производится разбиение числовой оси с помощью точек , …, так чтобы .

 

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.016 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал