Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Тема: Основы математической статистики. Цель: Ознакомиться с понятием математическая статистика






Цель:

  1. Ознакомиться с понятием математическая статистика.
  2. Ознакомиться с задачами математической статистики.

Теоретические сведения:

Математическая статистика — раздел математики, посвященный установлению закономерностей случайных явлений или процессов на основании обработки статистических данных—результатов наблюдений или измерений.

Наиболее важными в прикладном плане являются три задачи математической статистики:

1. Оценка неизвестной функции распределения или плотности вероятностей, когда по конкретным значениям , полученным в результате независимых измерений случайной величины , требуется оценить неизвестную функцию распределения величины или ее плотность вероятности , если — непрерывная случайная величина.

2. Оценка неизвестных параметров. В этой задаче предполагается, что на основании физических или общетеоретических соображений можно заключить, что случайная величина имеет функцию распределения определенного вида, зависящую от нескольких параметров, значения которых неизвестны. По результатам наблюдения величины нужно оценить значения этих параметров. Задачу можно ставить вне связи с функцией распределения. Например, требуется оценить: математическое ожидание, дисперсию или моменты случайной величины ; амплитуду, частоту или фазу радиоимпульса, наблюдаемого на фоне шума; корреляционную функцию или спектральную плотность стационарного случайного процесса и т. д.

3. Статистическая проверка гипотез. Обычно эта задача формулируется так. Пусть на основании некоторых соображений можно считать, что функция распределения исследуемой случайной величины есть . Необходимо выяснить, совместимы ли опытные данные с гипотезой, что случайная величина действительно имеет распределение . Задачу можно сформулировать иначе. Предположим, наблюдаемые значения случайной величины обусловлены двумя или несколькими различными причинами (гипотезами). В результате наблюдения величины нужно решить, с какой из гипотез следует связывать полученные значения величины . Например, пусть на вход радиоприемного устройства поступает случайное колебание , которое в каждый момент времени является либо суммой сигнала и помехи (гипотеза ), либо одной помехи (гипотеза ). В некоторый фиксированный момент времени произведено измерение величины . По полученному числовому значению нужно решить наилучшим образом, присутствовал ли на входе сигнал , т. е. выбрать одну из двух гипотез: или .

Исходными данными, подлежащими обработке, служат результаты наблюдений над случайной величиной .

Множество всех возможных значений случайной величины называется генеральной совокупностью, а множество опытных значений — выборочными значениями, число — объемом выборки.

Если известны функция распределения или плотность вероятности случайной величины , то говорят, что выборка принадлежит распределению или . Расположив числа в возрастающем порядке, так что при , получим упорядоченную выборку, называемую вариационным или статистическим рядом.

По выборке объема определяются ее статистические характеристики — приближенные значения соответствующих вероятностных характеристик совокупности. Чем больше , тем лучше приближение.

Аналогом функции распределения случайной величины служит статистическая (эмпирическая) функция распределения выборки, которая представляет собой частоту события :

(4.1)

где — число членов выборки, меньших .

Когда выбор осуществляется из непрерывного распределения и число выборочных значений велико (порядка сотен), целесообразно строить гистограмму, которая является статистической аппроксимацией плотности вероятности . Для этого область экспериментальных значений случайной величины разбивают на обычно одинаковых интервалов и вычисляют относительную плотность точек в каждом интервале:

, , (4.2)

где — число экспериментальных точек в -м интервале; — относительная частота. Подсчитанные таким образом значения изображают графически в виде ступенчатой кривой: по оси абсцисс откладывают соответствующие интервалы и на каждом из них как на основании строят прямоугольник высотой . Полученная ступенчатая кривая называется гистограммой.

Если необходимо аппроксимировать гистограмму подходящим аналитическим выражением какой-либо теоретической плотности вероятности сопоставляют гистограмму с графиками плотностей вероятностей.

Большой набор плотностей вероятностей дает система кривых Пирсона, задаваемая дифференциальным уравнением:

.

Параметры определяются из условия сохранения первых четырех моментов статистического распределения.

По методу моментов параметры подбирают так, чтобы первые моменты распределения равнялись бы соответствующим статистическим моментам. Число приравниваемых низших моментов определяется количеством неизвестных параметров

Чтобы оценить, насколько хорошо выбранный теоретический закон распределения согласуется с результатами наблюдений, используют критерии согласия, среди которых наиболее часто применяется критерий . По этому критерию за меру расхождения результатов наблюдений и теоретического распределения принимают величину:

, (4.3)

где - объем выборки, - число интервалов разбиения экспериментальных данных, - число значений в -м интервале, -относительная частота, - вероятность попадания случайной величины в -й интервал.

Случайная величина , независимо от распределения величины , при асимптотически распределена по закону с степенями свободы, где — число параметров теоретического распределения, оцениваемых по результатам наблюдений.

Рекомендуется следующая методика применения критерия для оценки расхождения теоретического и статистического распределений.

1. По формуле (4.3) подсчитать значение .

2. Определить число степеней свободы .

3. Выбрать достаточно малую (обычно равную 0, 05 или 0, 01) вероятность , называемую уровнем значимости.

4. С помощью таблицы приложения III по известным и найти значение величины , определяемой равенством

(4.4)

5. Если значение то теоретическое распределение считают плохо согласующимся с результатами наблюдений при уровне значимости , если то полагают, что выбранное теоретическое распределение согласуется с экспериментальными данными.

Свойства выборки описываются также более простыми характеристиками — выборочными (статистическими) моментами: выборочным средним , выборочной дисперсией и т. д.

Выборочные среднее, дисперсия, начальный и центральный моменты -го порядка определяются соответственно формулами:

, (4.5)

, (4.6)

, (4.7)

. (4.8)

Если отдельные значения в ряде распределения повторяются по несколько раз, то следует учесть частоту каждого повторения. Тогда, например, формулы (4.5) и (4.6) примут вид:

(4.5а)

, (4.6а)

где — значение величины в -м опыте; — частота значения .

Оценками математического ожидания , дисперсии , начальных и центральных моментов случайной величины могут служить соответствующие выборочные характеристики (4.5) —(4.8). При увеличении числа наблюдений за оценку дисперсии предпочтительнее брать не статистическую дисперсию , а «исправленную» выборочную дисперсию:

 

, (4.9)

которая является несмещенной оценкой.

Пример 1.

Ошибки 15 измерений дальности до цели с помощью радиодальномера представлены таблицей

Номер измерения                              
Ошибка , м   -15 -5   -15     -5 -10   -5 -10   -10 -5

Требуется: 1) построить распределение выборки 2) построить статистическую функцию распределения 3) определить выборочную среднюю , выборочную дисперсию ошибки измерения и исправленную дисперсию ошибок прибора.

Решение. Вариационный ряд имеет вид: —15, —15, —10, —10, —10, —5, —5, —5, —5, 6, 6, 6, 12, 12, 18. Он содержит шесть различных значений: —15, —10, —5, 6, 12, 18. Частоты этих значений равны соответственно: 2, 3, 4, 3, 2, 1.

1. Распределение выборки представим таблицей

Ошибка , м -15 -10 -5      
           
2/15 3/15 4/15 3/15 2/15 1/15

2. Построим статистическую функцию распределения.

Наименьшее значение ошибки измерения равно —15. Следовательно, при .

Значение , а именно наблюдалось 2-а раза, поэтому при .

Значение , а именно , наблюдалось 2-а раза, а наблюдалось 3-и раза, поэтому , при .

При .

При .

При .

 

При .

 

Таким образом, статистическая функция распределения может быть представлена таблицей:

  2/15 5/15 9/15 12/15 14/15  

График функции :

3. Определим выборочную среднюю и выборочную дисперсию ошибки измерения.

Используя формулы (4.5а), (4.6а), (4.9) получаем:

м, (4.5а)

м2, (4.6а)

«Исправленная» выборочная дисперсия:

 

.

 

Пример 2.

В течение 24 ч регистрирующее устройство контроля каждый час фиксирует напряжение сети. После первичной обработки данных получено распределение выборки в интервальной форме, приведенное в таблице

Интервалы, В 213-215 215-217 217-219 219-221 221-223
         

 

Построить гистограмму выборки.

Решение. Из таблицы видно, что частичные интервалы одинаковы =2 В. Поэтому в соответствии с (4.2) , = получим:

= , = ,

= , = , = .

 

Для построения гистограммы отложим по оси абсцисс указанные в таблице частичные интервалы и на каждом из них построим прямоугольник высотой , . Например, над интервалом 219—221 прямоугольник имеет высоту 0, 208. Гистограмма выборки представлена на рисунке ниже:

Задания 1.

1. В результате пяти измерений физической величины X одним прибором, который не имеет систематической ошибки, получены следующие результаты: 92; 94; 103; 105; 106.

Определить: а) выборочную среднюю измеряемой величины; б) выборочную и исправленную дисперсии ошибок прибора.

2. Из 100 транзисторов в среднем бывает два бракованных. Проверено десять партий по 100 транзисторов в каждой. Отклонения числа бракованных транзисторов от среднего приведены в таблице:

Номер партии                    
Отклонение от среднего -1       -1     -2    

Построить распределение выборки, эмпирическую функцию распределения и гистограмму выборки.

3. Построить гистограмму по распределению выборки, представленную таблицей:

Интервалы 0-2 2-4 4-6
     

4. Измерительным прибором, практически не имеющим систематической ошибки, было произведено пять независимых измерений, результаты которых представлены в таблице

Номер измерения          
Ошибка , м          

Требуется: 1) определить выборочную среднюю , выборочную дисперсию ошибки измерения и исправленную дисперсию ошибок прибора.

5. Произведено четыре измерения дальности до неподвижной цели с помощью радиолокатора, в результате получены следующие данные: 2470, 2490, 2580, 2520 м.

Требуется: 1) определить выборочную среднюю , выборочную дисперсию ошибки измерения и исправленную дисперсию ошибок прибора.

6. Ошибки 500 результатов измерений дальности до цели радиодальномером приведены в таблице

Интервал , м -25; -15 -15; -5 -5; 5 5; 15 15; 25
Число ошибок в интервале          
Относительная частота 0, 10 0, 26 0, 40 0, 20 0, 04

Требуется: 1) построить гистограмму и эмпирическую функцию распределения ошибок измерения дальности; 2) определить выборочную среднюю , выборочную дисперсию ошибки измерения и исправленную дисперсию ошибок прибора.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.019 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал