Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Требования к оценкам параметров распределений
В общем случае задача оценки параметров распределения сводится к нахождению таких функций , , …. , которые можно использовать для приближенного определения значений параметров. При этом мы должны быть уверены, что, по крайней мере, при больших объемах выборки можно без существенной ошибки предполагать, что почти наверно , , ……………………. . Последнее требование сформулируем более точно. Пусть имеется выборка наблюдаемых значений случайной величины Х и необходимо оценить параметр , входящий в неизвестную теоретическую функцию распределения . Будем считать значения выборки случайными величинами с одной и той же функцией распределения . Обозначим через оценку параметра . Определение 5.1. Оценка называется состоятельной, если она сходится по вероятности к оцениваемому параметру при . Т.е. для любого выполняется условие . Состоятельность - это первое естественное требование, предъявляемое к оценке неизвестного параметра. Состоятельность обеспечивает практическую близость статистической оценки к оцениваемому параметру при больших объемах выборки . Однако при малых значениях их состоятельности оценки нельзя сделать вывод о ее пригодности. Вторым из естественных требований, часто предъявляемых к оценкам, является требование несмещенности, т.е. отсутствия в ней систематической погрешности. Определение 5.2. Оценка называется несмещенной, если при любом конечном (в том числе и при малом) выполняется равенство . Определение 5.3. Оценка называется положительно смещенной, если , и отрицательно смещенной, если . Утверждение 5. 1. Если оцениваемый параметр является математическим ожиданием случайной величины Х, то несмещенной оценкой для него будет средняя арифметическая . Доказательство. Т.к. выборочные значения одинаково распределены, то . Следовательно, имеем . Что и требовалось доказать. Утверждение 5. 2. Если оцениваемый параметр является дисперсией случайной величины Х, то примером смещенной оценки может служить эмпирическая (выборочная) дисперсия . В то же время, такая оценка является состоятельной. Несмещенной же оценкой дисперсия является число . Эту характеристику часто называют исправленной дисперсией. Практически эту поправку вносят при вычислении дисперсии, когда объем выборки меньше 30-40. Другими словами, оценка является несмещенной оценкой теоретического второго центрального момента . Для третьего и четвертого теоретических центральных моментов и несмещенными оценками будут: , , где - объем выборки, - второй и, третий и четвертый эмпирические центральные моменты, соответственно. Замечание 5. 1. Функция Microsoft Excel ДИСП() и СТАНДОТКЛОН() рассчитывает несмещенные оценки теоретической дисперсии и теоретического среднего квадратического отклонения, соответственно (следовательно, функции ДИСПР(), СТАНДОТКЛОНП(), вычисляют смещенные оценки). Пример 5. 1. Зная, что выборочная дисперсия , объем выборки , рассчитать исправленную дисперсию . Решение. Выборочная дисперсия является смещенной оценкой генеральной дисперсии . Объем нашей выборки . Поэтому исправленная дисперсия (несмещенная оценка) равна: . Пусть имеются две состоятельные несмещенные оценки и для одного и того же параметра . Какой из них следует отдать предпочтение? Лучшей из них является та, у которой меньше дисперсия. Дисперсия статистической оценки рассчитывается стандартным образом: , где в силу несмещенной оценки. Т.о., возникает вопрос о нахождении несмещенной состоятельной оценки с наименьшей дисперсией. При весьма широких предположениях дисперсия оценок, построенных по выборке объема , не меньше некоторой нижней границы. Этими вопросами занимались шведский математик Крамер Карл Харальд [18, с. 270], Рао (к сожалению, мы не располагаем биографическими сведениями об этом ученом), английский биолог, математик и статистик Фишер Рональд Аймлер (1890-1962) [там же, с.496]. Утверждение 5. 3 (неравенство Крамера-Рао. Пусть несмещенная оценка неизвестного параметра , построенная по выборке объема . Тогда для дисперсии этой оценки выполняется неравенство Крамера-Рао: . Неотрицательную величину называют информацией Фишера. Она определяется из равносильных выражений: , где - плотность распределения случайной величины при непрерывном распределении. В случае дискретного распределения . Если существует такая несмещенная оценка , для которой дисперсия достигает нижней границы, равной , то она называется эффективной оценкой. Эффективную оценку принято обозначать как . Эффективная оценка всегда состоятельна. Если существует какая-либо другая несмещенная оценка , то сравнительную эффективность определяют отношением дисперсией: . Сравнительная эффективность всякой несмещенной оценки не больше единицы. Пример 5. 2. Для простой случайной выборки из нормальной совокупности эффективной оценкой математического ожидания является средняя арифметическая , а сравнительная характеристика медианы при выборке большего объема приближенно равна . Практически это означает, что центр распределения определяется по медиане с той же плотностью при наблюдениях, как при наблюдениях по средней арифметической . Рис. 1 иллюстрирует соответствующие кривые плотностей. Рис. 1 Кривые плотностей выборочных распределений средней арифметической (линия) и медианы (пунктир) Опуская подробности расчетов, имеем . Т.е. правая часть неравенства является нижней границей дисперсий для возможных статистических оценок параметра при известном . Проверим является ли эффективной следующая статистическая оценка вероятности : , где - количество успехов в возвратных выборках объема . Т.к. - одинаково распределенных по биноминальному закону экземпляров величины Х и , то . Это и доказывает, что статистическая оценка t является несмещенной оценкой для . Для биномиальной случайной величины Х дисперсия равна . Найдем дисперсию оценки t: . Это означает, что статистическая оценка является эффективной несмещенной оценкой параметра при известном объеме .
|