![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Задание на лабораторную работу №3
1. Сгенерировать выборку " псевдоизмерений" некоторой физической величины А (значения заданы в таблице 3.1 —для каждого из вариантов), наложив на ее значение " погрешности измерений". Параметры погрешностей и число измерений заданы в работе №1 (значение систематической погрешности m считать равным нулю для всех вариантов). 2. Получить МНК-оценки математического ожидания и дисперсии по схеме возрастающей выборки, считая минимальный объем выборки n1 равным 10. Максимальный объем n задан в работе №1. Полученные оценки вывести на экран. 3. Файлы с оценками математического ожидания и дисперсиями импортировать в формат ППП " STATISTICA" и представить их в виде графика с помощью графических средств ППП. 4. Проделать пункты 1, 2, 3, накладывая на значения измеряемой величины погрешности, подчиняющиеся равномерному закону. При этом считать математическое ожидание погрешности равным нулю. Интервал [а, b] полагать равным [-Зd, +Зd], где d — среднеквадратичное отклонение, заданное для нормального закона. Сравнить полученные оценки с оценками, полученными для нормально распределенных погрешностей. 5. Программа генерации выборки из e-загрязненного распределения, должна быть оформлена в виде модуля, для использования ее в лабораторной работе №4.
Варианты задания. Таблица 3.1
Методика выполнения работы. Специальных указаний для выполнения работы не требуется. Требования к оформлению отчета. Отчет должен содержать: 1. название работы; 2. цель работы; 3. задание на работу; 4. сгенерированные ряды " псевдоизмерений"; 5. МНК-оценки параметров сдвига и масштаба, полученные по схеме возрастающей выборки от n1 до n; 6. инструкцию по работе с программой; 7. листинг программы; 8. выводы. Вопросы для самопроверки. 1. Что означают параметры сдвига и масштаба плотности распределения? Почему они так называются? 2. В чем заключается принцип максимума правдоподобия? 3. В каких случаях МНК-оценки совпадают с оценками максимального правдоподобия? 4. Почему погрешности измерений можно считать в большинстве своем распределенными по нормальному закону? 5. Можно ли полученные результаты применять для обработки зависимых измерений? Лабораторная работа №4.
Помехоустойчивые оценки. Цель работы: освоение методов помехоустойчивого оценивания. Работа выполняется с использованием алгоритмических языков и ППП " STATISTICA" На работу отводится 8 часов.
МНК-оценки совпадают с оценками, полученными по методу максимального правдоподобия, и являются эффективными, если погрешности наблюдений подчиняются нормальному распределению и не содержат выбросов. Такая модель погрешностей не соответствует действительности. На практике ряды наблюдений содержат от 1 до 10 процентов " аномальных" измерений, т.е. выбросов. Поскольку выбросы существенно превосходят по абсолютному значению нормальные наблюдения, МНК-оценки параметров могут значительно отличаться от их " истинного" значения. Простейшим приемом для устранения влияния выбросов является визуальный просмотр данных, представленных в виде таблиц или графиков, и удаления очевидных " аномальных" данных. Такая операция называется " предварительным редактированием" данных и, как правило, дает хороший результат. Редактирование не всегда возможно, например, при большом количестве числа наблюдений или в автоматических системах. Поэтому был разработан класс оценок, устойчивых по отношению к выбросам. Простейшей из таких оценок является медиана выборки, которая применяется при оценивании параметра сдвига, или математического ожидания случайной величины. Медианой называется значение случайной величины х, при котором функция распределения
В этом случае логарифмическая функция правдоподобия имеет вид Решение уравнения (2) дает медиану выборки. Так как при этом параметр Q минимизирует сумму модулей, то медиана является оценкой, полученной методом наименьших модулей. Помехоустойчивость медианы по отношению к выбросам очевидна, поскольку последние сосредоточены на краях выборки и не могут существенно повлиять на оценку математического ожидания. В то же время эффективность оценок наименьших модулей в отсутствии выбросов хуже, чем у МНК-оценок, так как в качестве оценки математического ожидания берется результат только одного измерения — медиана, и никакого усреднения погрешностей не происходит. Робастные оценки (от английского robust—крепкий, здоровый), являясь помехоустойчивыми, в то же время не слишком проигрывают в эффективности МНК-оценкам, если погрешности измерений подчиняются нормальному распределению и не содержат выбросов. К таким оценкам относятся оценки математического ожидания (a - усеченные оценки и a - винзорированных средние) и S-оценка параметра масштаба. a-усеченное среднее Сt(a, n) равно где a —доля отброшенных измерений; n — объем выборки; [an] — операция выделения целой части числа an. a-винзорированное среднее вычисляется по формуле Таким образом, a-усеченное среднее находится как среднее значение упорядоченной по возрастанию выборки, в которой отброшены 100%-а крайних точек " снизу" и столько же " сверху" выборки. При нахождении винзорированных средних крайние точки не отбрасываются, а " проектируются" в ближайшие точки оставшейся выборки, то есть все 100%× a, точек полагаются равными ближайшей не отброшенной точке. S-оценка параметра масштаба равна где medxi — оператор нахождения медианы. Оценка (5) находится следующим образом: 1) находится медиана выборки medxi; 2) находятся модули отклонения членов выборки от медианы |xi-medxl; 3) находится медиана ряда, полученного в пункте 2); 4) результат делится на нормирующий множитель 0, 6745. Необходимость деления на нормирующий множитель вызвана тем, чтобы при нормальном распределении погрешностей S-оценка совпадала с оценкой среднего квадратического отклонения (СКО).
Задание на лабораторную работу №4. 1. Сгенерировать выборку из сорока " псевдоизмерений", накладывая на значения измеряемого параметра (параметр масштаба) А, заданного в работе №3, погрешности измерений, подчиняющиеся e-загрязненному распределению. Параметры e-загрязненного распределения и методика его генерации рассмотрены в работе №3. 2. Получить оценки математического ожидания: — МНК-оценку; — медиану; — a-усеченную оценку; — a-винзорированное среднее; — среднее значение " отредактированной выборки"; a - усеченные и a - винзорированные оценки требуется найти для трех значений a: a1, a2, a3. Значение a1 в процентах равно числу e, заданному в лабораторной работе №3. При этом количество отброшенных точек (снизу и сверху): a1=[40× e/100]; a2=a1-1; a3=a1+1; Сравнить полученные оценки математического ожидания с " истинным" значением параметра А. 3. Найти оценки параметра масштаба: — МНК-оценку; —устойчивую оценку. МНК-оценка ищется для исходной и отредактированной выборки. Устойчивая оценка S ищется по полной выборке. Сравнить полученные оценки с " истинным" значением параметра масштаба, заданным в работе №1 (параметр d). 4. Исходную выборку " импортировать" в ППП " STATISTICA". Используя графические средства пакета рассмотреть гистограмму выборки и график накопленных частот распределения в логарифмическом масштабе. Сравнить полученные графики с графиками, полученными для нормального распределения. 5. Сравнить полученные оценки параметров сдвига (математическое ожидание) и масштаба с базовыми статистиками, получаемыми в ППП. Методика выполнения работы. 1. Методика генерации погрешностей измерений, подчиняющихся нормальному и e-загрязненному распределениям, изложена в лабораторных работах №1 и №2. 2. Упорядочение выборки " псевдоизмерений" может быть выполнено известными способами сортировки данных (сортировка с простым выбором, " пузырьковая" сортировка, " быстрая" сортировка и т.д.). 3. Медиана при четном числе членов выборки получается как среднее арифметическое двух " серединных членов". Так, при n=40 медиана будет равна где y—члены упорядоченной выборки. 4. Количество отброшенных членов a1 с обоих концов упорядоченной выборки определяется следующим образом (при заданном e): — находится доля выбросов e/100; — находится число a1= — число a1 округляется до ближайшего целого числа. 5. Работа с ППП " STATISTICA" достаточно проста и не требует специальных пояснений (достаточно обратиться к пояснениям с помощью программы " HELP")
Требования к оформлению отчета. Отчет должен содержать: 1. название работы; 2. цель работы; 3. задание на работу; 4. файлы " псевдоизмерений": 5. полученные оценки (устойчивые и МНК-оценки); 6. инструкцию по работе с программой; 7. листинг программы; 8. выводы. Вопросы для самопроверки. 1. В каком случае МНК-оценки совпадают с оценками максимального правдоподобия [МП]? 2. В чем заключается редактирование выборки? 3. В каком случае медиана выборки совпадает с оценкой математического ожидания, полученной методом МП? 4. Назовите основные свойства робастных оценок. 5. Что такое a-усеченные оценки и как они вычисляются? 6. В чем заключается процедура " проектирования" крайних членов выборки при вычислении винзорированных оценок?
|