Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Требования к оценкам параметров распределений






В общем случае задача оценки параметров распределения сводится к нахождению таких функций , , …. , которые можно использовать для приближенного определения значений параметров. При этом мы должны быть уверены, что, по крайней мере, при больших объемах выборки можно без существенной ошибки предполагать, что почти наверно

,

,

…………………….

.

Последнее требование сформулируем более точно.

Пусть имеется выборка наблюдаемых значений случайной величины Х и необходимо оценить параметр , входящий в неизвестную теоретическую функцию распределения . Будем считать значения выборки случайными величинами с одной и той же функцией распределения . Обозначим через оценку параметра .

Определение 5.1. Оценка называется состоятельной, если она сходится по вероятности к оцениваемому параметру при . Т.е. для любого выполняется условие

.

Состоятельность - это первое естественное требование, предъявляемое к оценке неизвестного параметра. Состоятельность обеспечивает практическую близость статистической оценки к оцениваемому параметру при больших объемах выборки . Однако при малых значениях их состоятельности оценки нельзя сделать вывод о ее пригодности.

Вторым из естественных требований, часто предъявляемых к оценкам, является требование несмещенности, т.е. отсутствия в ней систематической погрешности.

Определение 5.2. Оценка называется несмещенной, если при любом конечном (в том числе и при малом) выполняется равенство

.

Определение 5.3. Оценка называется положительно смещенной, если

,

и отрицательно смещенной, если

.

Утверждение 5. 1. Если оцениваемый параметр является математическим ожиданием случайной величины Х, то несмещенной оценкой для него будет средняя арифметическая .

Доказательство. Т.к. выборочные значения одинаково распределены, то .

Следовательно, имеем

.

Что и требовалось доказать.

Утверждение 5. 2. Если оцениваемый параметр является дисперсией случайной величины Х, то примером смещенной оценки может служить эмпирическая (выборочная) дисперсия

.

В то же время, такая оценка является состоятельной. Несмещенной же оценкой дисперсия

является число

.

Эту характеристику часто называют исправленной дисперсией.

Практически эту поправку вносят при вычислении дисперсии, когда объем выборки меньше 30-40. Другими словами, оценка является несмещенной оценкой теоретического второго центрального момента . Для третьего и четвертого теоретических центральных моментов и несмещенными оценками будут:

,

,

где - объем выборки, - второй и, третий и четвертый эмпирические центральные моменты, соответственно.

Замечание 5. 1. Функция Microsoft Excel ДИСП() и СТАНДОТКЛОН() рассчитывает несмещенные оценки теоретической дисперсии и теоретического среднего квадратического отклонения, соответственно (следовательно, функции ДИСПР(), СТАНДОТКЛОНП(), вычисляют смещенные оценки).

Пример 5. 1. Зная, что выборочная дисперсия , объем выборки , рассчитать исправленную дисперсию .

Решение. Выборочная дисперсия является смещенной оценкой генеральной дисперсии . Объем нашей выборки . Поэтому исправленная дисперсия (несмещенная оценка) равна:

.

Пусть имеются две состоятельные несмещенные оценки и для одного и того же параметра . Какой из них следует отдать предпочтение? Лучшей из них является та, у которой меньше дисперсия. Дисперсия статистической оценки рассчитывается стандартным образом:

,

где

в силу несмещенной оценки.

Т.о., возникает вопрос о нахождении несмещенной состоятельной оценки с наименьшей дисперсией. При весьма широких предположениях дисперсия оценок, построенных по выборке объема , не меньше некоторой нижней границы. Этими вопросами занимались шведский математик Крамер Карл Харальд [18, с. 270], Рао (к сожалению, мы не располагаем биографическими сведениями об этом ученом), английский биолог, математик и статистик Фишер Рональд Аймлер (1890-1962) [там же, с.496].

Утверждение 5. 3 (неравенство Крамера-Рао. Пусть несмещенная оценка неизвестного параметра , построенная по выборке объема . Тогда для дисперсии этой оценки выполняется неравенство Крамера-Рао:

.

Неотрицательную величину называют информацией Фишера. Она определяется из равносильных выражений:

,

где - плотность распределения случайной величины при непрерывном распределении. В случае дискретного распределения

.

Если существует такая несмещенная оценка , для которой дисперсия достигает нижней границы, равной , то она называется эффективной оценкой. Эффективную оценку принято обозначать как .

Эффективная оценка всегда состоятельна. Если существует какая-либо другая несмещенная оценка , то сравнительную эффективность определяют отношением дисперсией:

.

Сравнительная эффективность всякой несмещенной оценки не больше единицы.

Пример 5. 2. Для простой случайной выборки из нормальной совокупности эффективной оценкой математического ожидания является средняя арифметическая , а сравнительная характеристика медианы при выборке большего объема приближенно равна

.

Практически это означает, что центр распределения определяется по медиане с той же плотностью при наблюдениях, как при наблюдениях по средней арифметической . Рис. 1 иллюстрирует соответствующие кривые плотностей.

Рис. 1 Кривые плотностей выборочных распределений средней арифметической (линия) и медианы (пунктир)
Пример 3.
Пусть случайная величина Х представляет частость появлений успеха при возвратной выборке объема . Т.о., случайная величина - число успехов в испытаниях. Она распределена по биномиальному закону, параметр которого считается известным. Требуется найти эффективную оценку параметра этого же закона, т.е. вероятности успеха в единичном испытании, если известны результаты выборок объема . Пусть i -я из произведенных выборок объема дает частость , которую можно считать приближенной оценкой для . Будем использовать наблюдаемые частости для более точной оценки .

Опуская подробности расчетов, имеем

.

Т.е. правая часть неравенства является нижней границей дисперсий для возможных статистических оценок параметра при известном . Проверим является ли эффективной следующая статистическая оценка вероятности :

,

где - количество успехов в возвратных выборках объема . Т.к. - одинаково распределенных по биноминальному закону экземпляров величины Х и

,

то

.

Это и доказывает, что статистическая оценка t является несмещенной оценкой для . Для биномиальной случайной величины Х дисперсия равна

.

Найдем дисперсию оценки t:

.

Это означает, что статистическая оценка является эффективной несмещенной оценкой параметра при известном объеме .


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.013 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал