Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Исследование выборочной дисперсии на несмещенность.
Применим условие несмещённости оценивающей функции (193) ко второму варианту записи выборочной дисперсии (176). Дано: x 1, x 2, …, xn – простая выборка из генеральной совокупности X; математическое ожидание каждого элемента выборки равно единому математическому ожиданию генеральной совокупности по принципу статистической копии: E (xi) = E (X), и, естественно, = E (X 2); = s2 > 0 – следствие равноточности измерений; s 2 = () / n – – второй вариант формулы (176) для выборочной дисперсии. Определить: E (s 2) = s2 –? Решение: Найдем математическое ожидание правой части оценивающей функции для выборочной дисперсии: E (s 2) = E (() / n – ) = () / n – = (n ∙ – = = – = s2 + – s2 / n – = s2 (1 – 1 / n) ≠ s2. Таким образом, выборочная дисперсия s 2 является смещённой (искажённой) оценкой генеральной дисперсии. Для устранения искажения достаточно умножить выборочную дисперсию на величину, обратную искажению: s 2∙ n / (n – 1) = m 2 = () / (n – 1). # (214) Естественно, что теперь E (m 2) = s2, т.е. m 2 – несмещённая (не искажённая) оценка генеральной дисперсии. Величина m в геодезии, астрономии и смежных науках называется средней квадратической погрешностью (СКП), а формула (215) носит имя Бесселя, впервые получившего её: m = , (215) где [ v 2] = + +…+ , а vi = - xi. Переход от величины m 2 к СКП m по формуле (215) – операция нелинейная, что приводит к смещению m относительно стандарта s, т.е. E (m) ≠ s. С доказательством можно ознакомиться в [17] или [18]. Операция извлечения квадратного корня слабо искажает значения, близкие к единице. В связи с этим, на практике рекомендуется выражать НК-поправки vi = - xi в таком масштабе измерений, чтобы подкоренная дробь [ v 2] / (n – 1) мало отличалась от единицы. 3.2.3 Интервальные оценки. Точечные оценки, рассмотренные в предыдущих параграфах, характеризуются нулевой вероятностью своего появления, оставаясь возможными событиями. Этот теоретический «недостаток» точечных оценок легко устраняется путем введения интервальных оценок. Интервальная оценка параметра а представляет собой доверительный интервал (ДИ), определяемый двумя числами a H и a B: I g = ] a H; a B[. Его нижняя (a H) и верхняя (a B) доверительные границы определяются с использованием точечной оценки ã и числового значения доверительной вероятности g или уровня значимости a = 1 – γ, назначаемым заранее. Предполагается, что закон распределения оценивающей функции ã известен, например, в форме функции распределения F ( a ) = P (Ã < a ), где a – некоторый элемент спектра случайной величины Ã, для которой объективно существующее значение параметра а является её центром рассеивания. Таким образом, ã – является несмещённой оценивающей функцией: E (ã) = a. Доверительные границы a H и a B рассматриваются тоже как элементы спектра случайной величины Ã. Если, дополнительно, представить доверительные границы как уклонения от точечной оценки ã, введя расстояния ε H и ε B, такие что a H = ã – ε H и a B = ã + ε B, (216) то одинаковая доверительная вероятность g будет соответствовать двум следующим равновероятным событиям: 1) известная точечная оценка ã попадает с вероятностью g в доверительный интервал I g, построенный относительно неизвестного положения параметра а: g = P (a – ε H < ã < a + ε B) = 1 – a. (217) 2) доверительный интервал I g, построенный относительно известной точечной оценки ã, накрывает неизвестный параметр а с вероятностью g: g = P (ã – ε H< a < ã + ε B) = P (a H < a < a B) = 1 – a. (218) Вероятность именно второго события (218) представляет интерес как с практической, так и с теоретической точек зрения. Последнее выражение (218) иллюстрируется на графике функции распределения (рис. 3.3):
Рис. 3.3 Доверительный интервал. (Положение параметра a остается неизвестным!) Доверительный интервал может иметь одну границу конечной, а другую – открытой на бесконечность. В таком случае он называется односторонним, в отличие от обычного – двухстороннего. Перейдем к построению границ доверительного интервала, основываясь на его аналитическом определении (218). Дано: F ( a ) = P (Ã < a ) – функция распределения оценивающей функции ã, известная с точностью до своих параметров; g или a = (1 - g) – доверительная вероятность или уровень значимости. Найти: нижнюю a н и верхнюю a в границы доверительного интервала I g. Решение: Однозначное решение задачи возможно лишь при дополнительных ограничениях, т.к. выражение (218) содержит два неизвестных: a н и a в. Обычно, используются следующие ограничения: 1) фиксированная граница (нижняя либо верхняя); 2) равновероятность того, что накрываемый параметр окажется левее или правее границ доверительного интервала. Односторонний интервал является частным случаем двухстороннего, в связи с чем, получим сначала общее решение, опираясь на уравнение (218): P (a н< a < a в) = g = 1 – a = F (a в) – F (a н). 1. Зафиксировав сначала нижнюю границу a н, а затем верхнюю a в, выразим их друг через друга, что и даст нам искомое общее решение: a в = arg(F = F (a н) + g), (219) a н = arg(F = F (a в) – g). (220) Для одностороннего доверительного интервала, у которого нижняя граница открыта на бесконечность, получим: a н → – ∞, т.е. F (a н) = 0 , (221) a в = arg(F = g) = arg(F = 1 – a) а для интервала, у которого верхняя граница бесконечно удалена: a в→ + ∞, т.е. F (a в) = 1 . (222) a н = arg(F = 1 – g) = arg(F = a) 2. Симметричный доверительный интервал строится, исходя из равновероятности того, что накрываемый параметр окажется слева или справа за его пределами, т.е. F (a н) =1– F (a в) =a /2=(1–g)/2, откуда: a н = arg(F = (1 – g) / 2) = arg(F = a / 2) . # (223) a в = arg(F = (1 + g) / 2) = arg(F = 1 – a / 2)
|