Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Омский государственный университет путей сообщения






О. В. ГАТЕЛЮК, А. Н. ШЕВЛЯКОВ

 

 

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

 

Министерство транспорта Российской Федерации

Федеральное агентство железнодорожного транспорта

Омский государственный университет путей сообщения

____________________________

 

 

О. В. Гателюк, А. Н. Шевляков

 

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

 

Утверждено редакционно-издательским советом университета

 

в качестве учебного пособия для студентов всех специальностей

 

ОГЛАВЛЕНИЕ

 

Введение ……………………………………………………………………… 1. Введение в математическую статистику………………………………. 2. Первичная обработка статистических данных ……………………….. 3. Числовые характеристики случайных величин ……………………….. 4. Статистические гипотезы ……………………………………………….. 5. Сравнение выборочной средней с гипотетическим средним значением нормальной случайной величины при известной величине стандартного отклонения ……………………………………………………………………... 5.1. Примеры решения задач 6. Сравнение выборочной средней с гипотетическим средним значением нормальной случайной величины при неизвестной величине стандартного отклонения …………………………………………………………………… 6.1. Примеры решения задач 7. Сравнение средних значений двух нормальных случайных величин, стандартные отклонения которых известны (случай больших выборок)........... 7.1. Примеры решения задач 8. Сравнение средних значений двух нормальных случайных величин (зависимые выборки) с неизвестными стандартными отклонениями.......... 8.1. Пример решения задачи 9. Сравнение выборочного стандартного отклонения с гипотетическим стандартным отклонением нормальной случайной величины ……………... 9.1. Пример решения задачи 10. Сравнение стандартных отклонений двух нормальных случайных величин 10.1. Пример решения задачи 11. Сравнение средних значений двух нормальных случайных величин, стандартные отклонения которых неизвестны и одинаковы ………………. 1.1. Примеры решения задач 12. Сравнение стандартных отклонений нескольких нормальных случайных величин по выборкам разных объемов (критерий Бартлетта)…. 12.1. Пример решения задачи 13. Сравнение стандартных отклонений нескольких нормальных случайных величин по выборкам одинакового объема (критерий Кочрена) 13.1. Пример решения задачи 14. Проверка гипотезы об однородности двух выборок (критерий Вилкоксона) 14.1. Примеры решения задач 15. Проверка гипотезы о нормальном распределении генеральной случайной величины по критерию Пирсона………..………………………... 15.1. Пример решения задачи 16. Коэффициент корреляции…………………………………………….... 16.1. Пример решения задачи 17. Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости……………………………………………... 17.1. Пример решения задачи Приложение 1. Таблица значений функции …………….. Приложение 2. Таблица значений функции … Приложение 3. Критические точки распределения ……………………… Приложение 4. Критические точки распределения Стьюдента ……………. Приложение 5. Критические точки распределения Фишера – Снедекора … Приложение 6. Критические точки распределения Кочрена ………………. Приложение 7. Критические точки распределения Вилкоксона …………... Библиографический список……………………………………………………                              
   

ВВЕДЕНИЕ

Современное развитие науки, техники и экономики приводит к необходимости активного использования математической статистики и статистических технологий не только в научных исследованиях, но и в повседневной практике инженера. При формировании у студентов основной компетенции – способности применять математический аппарат для осуществления профессиональной деятельности − одним и из основных ожидаемых результатов являются знание методов проверки статистических гипотез для решения тех или иных профессиональных проблем и умение их применять. Знание и умение применять их статистических технологий особенно необходимы выпускникам по специальности 221400.62 – «Управление качеством» – и направлению подготовки 221700.62 – «Стандартизация и метрология».

К сожалению, в стандартном курсе высшей математики на инженерных специальностях и направлениях подготовки вопросам математической статис тики традиционно уделяется мало времени, круг изучаемых статистических понятий и методов ограничивается лишь основными понятиями типа «уровень значимости критерия» либо «ошибка первого или второго рода» и стандартными критериями согласия, которые излагаются достаточно формально. В результате такого формального изложения материала формирование у студентов необходимой компетенции затруднено.

В предлагаемом учебном пособии на понятных студенту примерах, взятых из реальной жизни или их будущей практической работы инженера, рассмотрены основные понятия математической статистики. В пособии помимо традиционного критерия согласия Пирсона изложены ранее не входившие в стандартный курс высшей математики статистические методы и критерии: критерий Стьюдента, Фишера – Снедекора, Бартлетта, Кочрена, Вилкоксона. Помимо этих критериев рассмотрены коэффициент корреляции и ранговой корреляции по Спирмену, приведен алгоритм проверки статистической значимости этих коэффициентов.

Авторы надеются, что данное учебное пособие поможет в овладении передовыми статистическими технологиями не только студентам инженерных и экономических специальностей и направлений подготовки, но и магистрантам и аспирантам, применяющим эти технологии в научной работе.


1. ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ СТАТИСТИКУ

 

Любое статистическое исследование начинается со сбора данных. Читателю наиболее хорошо известны социологические опросы, так как хотя бы в одном из них он участвовал и отвечал на предлагаемые вопросы: ваш возраст, каким одеколоном пользуетесь, за кого будете голосовать на выборах... Однако статистическую информацию необходимо собирать и во многих областях производства, транспорта и науки. Польза от обладания такими данными очевидна. Информация о ежедневном расходе топлива двигателем тепловоза за последний месяц может многое сказать специалисту о состоянии основных узлов тепловоза и необходимости ремонта. Получив информацию о размерах деталей, выпускаемых двумя станками, можно сделать вывод о лучшей работе одного из станков или о необходимости регулировки каждого из станков.

Попробуем выделить общие черты любого сбора статистической информации. До начала сбора исследователь должен определиться с признаком, который он хочет изучить. Таким признаком может быть, например, возраст или модель автомобиля респондента (при социологическом исследовании), температура воздуха, расход топлива тепловозом за сегодняшний день, длина или вес детали, которая будет сейчас изготовлена станком.

Кроме того, в любом статистическом исследовании наблюдаемый признак имеет случайный характер, т. е. узнать до самого наблюдения значение признака невозможно. Действительно, зачем вообще собирать информацию о расходе топлива, если бы вы знали его расход в данный день еще до начала эксплуатации тепловоза! Условимся далее случайные признаки обозначать заглавными латинскими буквами X, Y, Z.

Таким образом, статистика имеет дело со значениями случайного признака. Если же наблюдаемый случайный признак может быть выражен количественно, то мы будем называть его случайной величиной (СВ). Например, такие признаки, как «расход топлива», «напряжение пробоя изолятора», «температура воздуха», «суточный расход электроэнергии на тяговой подстанции», имеют количественное измерение (соответственно в литрах, вольтах, градусах, кВтч) и поэтому являются случайными величинами. В то же время такие случайные признаки, как «модель автомобиля респондента», «пол человека» и другие не могут быть выражены числом, следовательно, это не случайные величины.

У любой СВ есть диапазон ее возможных значений. Если СВ имеет лишь конечное число возможных значений (или же все ее значения целочисленные), то она называется дискретной. Если СВ может принимать любое значение из некоторого интервала числовой прямой, то такая СВ называется непрерывной. Некоторые приведены в табл. 1 примеры дискретных и непрерывных СВ.

 

Таблица 1

Примеры случайных величин

 

  Случайная величина   Возможные значения     Тип СВ
Номер случайно выбранного электровоза Любое натуральное число Дискретная  
Расход электроэнергии за время поездки [0, ] Непрерывная
Оценка, полученная на экзамене по математике, случайно выбранным студентом 2, 3, 4, 5 Дискретная
Длина детали, изготовленной станком [0, ] Непрерывная
Средняя температура воздуха в наудачу выбранный день года (с точностью до градуса) Любое целое число большее –274о С (абсолютный нуль) Дискретная
Напряжение в контактной сети переменного тока (мгновенное значение) Любое неотрицательное число Непрерывная

 

Основная задача математической статистики заключается в следующем: наблюдая несколько раз значения случайной величины (нескольких случайных величин), попытаться сделать вывод о свойствах самой случайной величины (случайных величин).

Сразу же возникает закономерный вопрос: сколько надо произвести наблюдений за СВ, чтобы о ее свойствах можно было бы сделать хоть какой-нибудь вывод? Одного или двух наблюдений явно недостаточно, а большое количество наблюдений часто бывает слишком дорогим и долгим занятием. На следующем примере видно, как возникают еще и принципиальные ограничения на количество наблюдений.

Пример. На складе хранится 1000 одинаковых электрических лампочек. Необходимо определить средний срок службы лампы со склада. Здесь случайной величиной является X = {срок службы выбранной лампы}, значения которой получаются в результате простого эксперимента: лампочку включают и ждут, пока она не перегорит. Ясно, что истинное значение среднего срока работы лампочек из партии можно получить, если испытать все лампочки со склада и затем подсчитать среднее арифметическое их сроков службы. В этом случае ответ будет абсолютно точным, но бесполезным с практической точки зрения, поскольку вся партия товара будет уничтожена. Таким образом, число наблюдаемых значений случайной величины Х не должно быть слишком большим. Это позволит нам сохранить большую часть ламп для дальнейшего использования, но повлечет за собой потерю точности при определении значения их среднего срока службы.

 

2. ПЕРВИЧНАЯ ОБРАБОТКА СТАТИСТИЧЕСКИХ ДАННЫХ

 

Пусть значения случайной величины Х наблюдались n раз. Набор наблюдаемых значений называется выборкой. Число n называется объемом выборки. Помимо объема выборки вводят следующие характеристики: m и M –минимальное и максимальное значения случайной величины в выборке; r = Mm – размах выборки.

Пример. Выборка значений случайной величины Х = {вес детали, изготавливаемой станком} состоит из двадцати чисел:

5, 10 5, 24 4, 67 5, 22 5, 10 4, 91 5, 33 4, 84 4, 91 5, 02

4, 88 4, 92 4, 97 5, 47 5, 38 4, 77 5, 09 4, 65 4, 92 5, 06

Здесь n = 20, m = 4, 65, M = 5, 47, r = 0, 82.

Заметим, что СВ Х непрерывна, так как возможные значения веса детали принадлежат интервалу .

Выборки больших объемов необходимо группировать, т. е. разбивать все значения выборки на группы (интервалы). Количество интервалов обычно вычисляется по формуле: , где квадратные скобки обозначают округление в большую сторону.

 

 

Длина интервала равна ( – размах выборки).

Таким образом, все значения СВ разбиваются на интервалы: и т. д. (всего должно быть k интервалов).

Например, для указанного выше примера имеем: , , получая при этом интервалы

Для каждого из интервалов находят частоту как количество значений из выборки, попавших в данный интервал. Если достаточно большие значения из выборки не попадают даже в последний интервал, то при подсчете частоты их учитывают в последнем интервале. Например, для полученных выше интервалов имеем следующие частоты: 3, 2, 6, 4, 2, 3 (в последний интервал искусст-венно добавлено значение 5, 47).

Гистограммой называют ступенчатый график, по горизонтальной оси которого отложены границы интервалов, а по вертикальной оси – частоты. Высота столбика гистограммы будет равна числу значений СВ, попавших в данный интервал. Для приведенного выше примера имеем гистограмму, приведенную на рис. 1.

 

 

Рис. 1. Вид гистограммы

 

Некоторые типы гистограмм настолько важны в математической статис-тике, что соответствующие им СВ имеют специальные названия.

Если все столбики гистограммы СВ Х имеют примерно одинаковую высоту (рис. 2) то говорят, что СВ Х является равномерно распределенной.

Для равномерной СВ характерно то, что все ее возможные значения «равноправны», и в выборке все значения СВ будут появляться с примерно одинаковой частотой. Равномерно распределенные СВ довольно часто встречаются на практике, приведем лишь некоторые примеры:   Рис. 2. Вид гистограммы равномерно распределенной случайной величины

Х = {номер месяца рождения случайно выбранного человека}; Y = {число минут на часах, когда неожиданно просыпаешься ночью}.

Равномерными могут быть и непрерывные СВ: Z = {место обрыва контактного провода между станциями А, Б} (она может принять любое значение из интервала [0, L], где L – расстояние между станциями).

Если в гистограмме, построенной по значениям СВ Х, высота столбиков убывает слева направо (рис. 3), то говорят, что СВ Х имеет экспоненциальное распределение.

Это значит, что экспоненциально распределенная СВ принимает большие значения с меньшей «охотой», она «предпочитает» наименее возможные значения. Экспоненциально распределенные СВ также часто встречаются на практике, например: X = {время работы двигателя до первой поломки}.   Рис. 3. Вид гистограммы экспоненциально распределенной случайной величины

 

Если гистограмма значений СВ Х имеет вид «горба» (рис. 4), то говорят, что СВ Х нормальна (или распределена нормально).

 

  Рис. 4. Вид гистограммы нормально распределенной случайной величины Вид гистограммы нормальной СВ говорит о том, что СВ имеет одно «нормальное» (стандартное) значение (которое принадлежит самому большому столбцу гистограммы), а все другие значения СВ колеблются возле стандартного в ту или иную сторону. Нормальной СВ является, например, X ={вес детали, изготовляемой на станке}

(и вообще почти любой контролируемый параметр изделий (длина, плотность и т. п.) распределен нормально).

Существуют СВ, которые не являются ни равномерными, ни экспоненциальными, ни нормальными.

Пример. Пусть X = {рост наудачу выбранного человека}. На первый взгляд кажется, что данная СВ нормальна, однако это не так. При достаточно большом числе наблюдений за значениями X получится «двугорбая» гистограмма! Левый горб этой гистограммы будет соответствовать среднему женскому росту, а правый – среднему мужскому росту.

 

3. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН

Случайная величина имеет среднее значение (встречаются также термины математическое ожидание, генеральное среднее). Например, средним значением СВ Х = {рост случайно выбранного человека} является среднее арифметическое ростов всех людей на Земле. Средним значением для СВ Y = {длина произведенной станком детали} является то значение длины, на которую станок был настроен перед работой. В примере разд. 1 (про лампочки) средним значением СВ, очевидно, является среднее арифметическое сроков службы всех лампочек на складе.

Как правило, точное значение СВ в практических задачах неизвестно. Действительно, посчитать рост абсолютно всех людей на планете невозможно, а проверка всех лампочек со склада, конечно, позволит вычислить точное среднее значение, но толку в нем будет немного: лампочек-то уже нет! Конечно, в случае со станком мы часто знаем (например, по документам на станок), на выпуск каких деталей он настроен. Однако в силу разных причин (ошибка настройщика, износ деталей станка) истинное среднее значение может оказаться нам не известным.

Поскольку среднее значение СВ, как правило, неизвестно, то при решении задач пользуются ее приближением, вычисленным по конечной выборке значений СВ. Полученное при этом значение называется выборочным средним, которое расчитывается следующим образом.

Пусть дана выборка объема n значений случайной величины Х. Тогда выборочное среднее вычисляется по формуле:

 

(1)

 

Пример. Для СВ из примера разд. 2 (про вес детали) значение выборочного среднего.

 

 

Среднее значение и выборочное среднее не могут полностью характеризовать поведение СВ. Рассмотрим типичный пример.

Пример. Два фасовочных станка были настроены на фасовку цемента в мешки по 50 кг (выражаясь по-другому, средние значения СВ Х = {вес мешка, произведенного первым станком} и Y = {вес мешка, произведенного вторым станком} равны 50 кг). На обоих станках была произведена опытная партия продукции из 10 мешков и полученные значения веса были занесены в табл. 2.

Таблица 2

Значения веса, кг

 

1-й станок                    
2-й станок                    

 

Были подсчитаны выборочные средние: 50, 7, 50, 3, которые для обоих станков оказались почти одинаковыми и весьма близкими к настроенному значению. Однако второй станок работает более качественно. Почему? Вес всех его мешков очень близок к настроенному значению 50 кг, а первый станок наполняет мешок цементом весьма произвольно (либо значительно больше 50 кг, либо значительно меньше).

Таким образом, говорят, что СВ Х (первый станок) имеет более высокое стандартное отклонение или среднее квадратическое отклонение (СКО), чем СВ Y (второй станок).

Как и средние значения, значение стандартного отклонения СВ в большинстве задач неизвестно, и поэтому на практике используют ее приближение - выборочное СКО, вычисляемое по выборкеследующим образом.

Пусть СВ Х имеет выборку объема , тогда ее выборочное СКО

(2)

 

где – выборочное среднее.

Пример. Выборочные СКО станков из предыдущего примера, кг:

 

кг.

 

кг.

 

Выборочное СКО – всегда неотрицательная величина, причем s = 0 только в случае, когда вся выборка значений СВ состоит из одинаковых значений.

Величина СКО показывает, в каком интервале располагаются почти все значения СВ, иными словами, справедливо правило трех сигм: в большинстве практических задач можно считать, что все значения СВ Х заключены в интервале , где – среднее значение и СКО СВ Х.

Как правило, на практике надо стремиться к тому, чтобы величина СКО была бы минимальной (в идеале равной нулю). Однако, как показывает следующий пример, величина СКО в одном технологическом процессе никак не может стать меньше величины СКО в другом процессе.

Пример. На пищевом предприятии имеются два полностью идентичных фасовочных станка, предназначенных для фасовки сыпучих пищевых продуктов в упаковку. Оба станка были настроены на фасовку одного килограмма продукта. Первый станок работает на фасовке сахара, а второй фасует конфеты «Барбарис». Возникает вопрос: у какого станка в работе большее СКО? Правильный ответ: у второго. Однако в этом случае сам станок «не виноват», поскольку отмерить точно один килограмм конфет гораздо сложнее, чем один килограмм сахара (конфеты гораздо крупнее, чем песчинки сахара).

Пример. Величина отклонения от стандарта в любом производственном процессе может кардинально поменять даже способы сбыта данного товара. Рассмотрим следующие СВ: Х = {вес булки хлеба, изготовленной на современном хлебозаводе}, Y = {вес булки хлеба, изготовленной по технологии полувековой давности}. Развитие технологий полвека назад не позволяло обеспечивать низкую величину СКО СВ Y. Это приводило к тому, что булки в одной и той же партии значистельно отличались друг от друга по весу. Следовательно, продавать все булки по одной цене (как сейчас) полвека назад было нечестно. Отсюда мы получаем исторический факт: полвека назад (и ранее) хлебные булки продавались на вес.

 

4. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

Статистической гипотезой (для краткости: гипотезой) называется любое высказывание о свойствах случайных величин.

Пример. Примерами статистических гипотез являются следующие фразы:

Н0 = {СВ Х распределена нормально};

Н1 = {среднее значение СВ X равно 2};

Н2 = {среднее значение СВ X принадлежит интервалу (1, 3)};

Н3 = {СКО СВ Х больше СКО СВ Y }.

Любая гипотеза может оказаться верной или ложной. Например, гипотеза Н = {среднее значение случайной величины Х = {рост наудачу выбранного человека} принадлежит интервалу (170 см, 180 см)} окажется истинной, если действительно после измерения роста у всех жителей Земли окажется, что среднее арифметическое полученных чисел будет больше, чем 170 см, но меньше, чем 180 см. Однако такая проверка гипотезы «в лоб» не может быть реализована на практике. К сожалению, так обстоит дело со всеми статистическими гипотезами, а именно: проверить статистическую гипотезу точными методами («в лоб») невозможно. Тем не менее в арсенале математической статистики существуют методы, позволяющие если уж не со 100 % точностью установить истинность или ложность гипотезы, то хотя бы проверить, насколько выдвинутая гипотеза правдоподобна.

В математической статистике всегда работают с парой гипотез – Н 0, Н 1. Гипотезу Н 0 называют основной ( или нулевой), а в качестве конкурирующей ( или альтернативной) гипотезы Н 1 можно взять любую гипотезу, противо-речащую Н 0.

Пример. Для СВ Х = {число изюминок в случайно выбранной булочке} можно сформулировать следующую пару гипотез:

Н 0= {среднее число изюминок в булочке равно 2, 5};

Н 1= {среднее число изюминок в булочке НЕ равно 2, 5}.

Разумеется, основную и конкурирующую гипотезу можно поменять местами:

Н 0= {среднее число изюминок в булочке НЕ равно 2, 5};

Н 1= {среднее число изюминок в булочке равно 2, 5}.

Заметим также, что для одной основной гипотезы существует несколько претендентов на роль конкурирующей. Например, к основной гипотезе Н 0 = {среднее число изюминок в булочке равно 2, 5} можно в качестве конкурирующей гипотезы взять любую из следующих гипотез:

Н 1= {среднее число изюминок в булочке НЕ равно 2, 5};

Н 2= {среднее число изюминок в булочке больше 2, 5};

Н 3= {среднее число изюминок в булочке меньше 2, 5};

Н 4= {среднее число изюминок в булочке равно 3} (читатель может продолжить этот список).

Обычно в качестве основной гипотезы принимают «ситуацию по умолчанию», т. е. соответствующую естественному, наиболее ожидаемому положению вещей. Например, в качестве основной гипотезы, как правило, будут брать «пациент здоров», «пассажир самолета не имеет при себе оружия», «блок-участок между сигнальными точками свободен», если рассматриваются СВ, относящиеся соответственно к медицине, работе металлодетектора, устройствам сигнализации, централизации и блокировки (СЦБ) на железной дороге.

Поскольку методы медицинского исследования, устройства металлодетектора и СЦБ несовершенны, то с той или иной частотой могут происходить ошибки следующего типа:

1. человека признают больным, хотя на самом деле он здоров;

2. металлодетектор обнаружит оружие у пассажира, хотя на самом деле оружия у пассажира нет;

3. сигнальная точка запрещает движение поезда, хотя впереди блок-участок свободен.

Ошибки такого типа происходят, если была отвергнута основная гипотеза, хотя на самом деле она была верна. Подобные ошибки (отказ от истинной основной гипотезы) называются ошибками первого рода. Однако существуют ошибки и другого типа:

1. человека признают здоровым, хотя на самом деле он болен;

2. металлодетектор не обнаружит оружие у настоящего террориста;

3. сигнальная точка разрешает движение, хотя впереди блок-участок занят.

Во всех трех случаях была принята основная гипотеза, хотя на самом деле она ложна. Подобные ошибки (принятие неверной основной гипотезы) называются ошибками второго рода.

Из примеров ошибок первого и второго рода следует, что последствия ошибок второго рода гораздо тяжелее, но, к сожалению, полностью исключить статистические ошибки из практики невозможно. Например, в некоторых медицинских анализах 15 % первичных диагнозов содержат ошибку первого рода. Борьба с ошибками второго рода, как видно из следующего примера, также может оказаться безуспешной.

Пример. Если мы хотим, чтобы некоторое устройство (металлодетектор или устройство СЦБ) допускало меньше ошибок второго рода, необходимо увеличить его чувствительность. Так, металлодетектор должен быть снабжен более чувствительными датчиками, а электрическая схема устройства СЦБ должна быть более совершенной. Наши действия, конечно, приведут к уменьшению числа ошибок второго рода, но, возможно, увеличат число ошибок первого рода, так как более чувствительные датчики металлодетектора будут «пищать» от любой железки в кармане у пассажира, а более чувствительное устройство СЦБ будет включаться (и запрещать движение) даже от случайных помех в сети.

Как следует из предыдущего примера, невозможно уменьшить частоту ошибки одного рода без увеличения частоты ошибки другого рода. Единственно правильным решением является компромисс: разрешить появление ошибок обоих родов, но ограничить частоту их появления наперед заданными параметрами. Вероятность допущения ошибки первого рода называется уровнем значимости и обозначается через . В практических задачах уровень значимости, как правило, задан заранее и измеряется в процентах или в долях.

Пример. Уровень значимости 5 % в работе устройства СЦБ говорит о том, что примерно в пяти случаях эксплуатации из ста устройство запрещает движение, в то время как блок-участок на самом деле свободен. Уровень значимости 0 % будет наблюдаться у устройства, который всегда принимает основную гипотезу, т. е. всегда разрешает движение. Другое «крайнее» значение уровня значимости (100 %) тоже будет плохим (такое устройство будет всегда отвергать основную гипотезу, т. е. постоянно будет запрещать движение). Единственным преимуществом такого устройства является отсутствие в его работе ошибок второго рода.

Заметим также, что одно значение уровня значимости может быть неприемлемо для одной практической задачи, но может быть удовлетворительным для другой. Например, уровень значимости 5 % в задаче про устройство СЦБ слишком высок, так как это приведет к остановке большого количества поездов и, соответственно, к огромным убыткам ОАО «РЖД». В то же время это значение является приемлемым для работы металлодетектора и при проведении медицинского анализа, поскольку 5 %-ная частота возникновения ошибки первого рода здесь не приводит к большим материальным и финансовым потерям (пассажира просто попросят пройти через рамку еще раз, а пациенту выпишут новое направление на тот же анализ).

Основная идея алгоритма проверки гипотезы. Рассмотрим общую идею проверки истинности статистической гипотезы на следующем примере.

Представьте, что некто предложил вам сыграть на деньги в какую-нибудь простую игру, например в орлянку. Игра эта простая и не требует интеллектуальных усилий, исход каждого раунда игры чисто случаен и зависит лишь от бросания монеты. Несложно догадаться, что если соперники играют честно, то после n раундов игры (число n достаточно велико) в активе у обоих будет примерно одинаковое число побед, т. е. теоретически в игре ни один из игроков не имеет преимущества.

Все это теория, а что может произойти при реальной игре в орлянку? Вы начали игру и последовательно проигрываете абсолютно все раунды – первый, второй, третий и все последующие. Что вы можете подумать: «мне действительно не везет»; «соперник играет нечестно».

Поразительно, но оба ваших предположения являются статистическими гипотезами. Поскольку за основную гипотезу берется нормальное положение вещей, то «мне действительно не везет» можно взять за H 0. Второе ваше предположение можно рассматривать как конкурирующую гипотезу H 1, поскольку она противоречит H 0. Ошибка первого рода будет заключаться в том, что вы заподозрите в обмане честного соперника. Ваша ошибка второго рода будет состоять в том, что, играя с настоящим обманщиком, вы будете считать происходящее обычной «невезухой». Уровень значимости (склонность к совершению ошибки первого рода) определяет вашу чувствительность: чем он выше, тем с большей решимостью вы готовы признать соперника мошенником.

Очевидно, что уровень значимости определяет продолжительность неудачной для вас игры, а именно момент, когда вы признаете соперника мошенником. Основное достижение математической статистики заключается в том, что она может рассчитать этот момент! То есть с помощью методов математической статистики вы, имея результаты всех прошедших раундов игры, сможете (при заданном уровне значимости) выяснить, настало время обвинить соперника в мошенничестве или можно еще поиграть.

Решение (признать или не признать соперника мошенником) принимается следующим образом. Естественно, чтобы принимать решение, надо обладать критерием, когда то или иное решение принимается. У нас есть выборка, т. е., записаны результаты всех прошедших раундов игры. По выборке необходимо вычислить некоторое число, называемое наблюдаемым значением критерия, которое показывает, насколько реальны значения в выборке в предположении, что основная гипотеза действительно верна. С другой стороны, у вас есть уровень значимости, т. е. предел терпения: когда накопившиеся проигрыши в игре вынудят вас обвинить нечестного соперника в мошенничестве. Величина «терпения» в статистических задачах обычно берется из таблиц и называется критическим значением (критической точкой) критерия. Решение статистической задачи завершается сравнением наблюдаемого и критического значений критерия. Если наблюдаемое значение превышает критическое, то основная гипотеза считается неверной (при данном уровне значимости) и отвергается.

Приведем в более формальном виде план решения задачи, связанной с проверкой статистической гипотезы.

План решения типичной задачи, связанной с проверкой статистической гипотезы.

1. Необходимо зафиксировать случайную величину (случайные величины), значения которой (которых) будут наблюдаться. Например, для игры «камень – ножницы – бумага» можно взять Х = {равна 1, если я выиграл, и 0 если проиграл}.

2. Произвести наблюдения значений случайной величины (случайных величин), т. е. получить ее выборку (выборки). Для игры «камень – ножницы-бумага» это означает сыграть несколько раундов игры и запомнить все результаты.

3. Сформулировать основную и конкурирующую гипотезы о свойствах рассматриваемой случайной величины (случайных величин). Например, для игры «камень – ножницы – бумага» основной гипотезой может являться высказывание «соперник играет честно», а конкурирующей – «соперник жульничает».

4. Выбрать уровень значимости, при котором будет проверяться основная гипотеза.

5. По выборке (выборкам) с помощью формул математической статистики вычислить наблюдаемое значение критерия.

6. С помощью таблиц для данного уровня значимости найти критическую точку критерия.

7. Если наблюдаемое значение критерия превышает критическое, то основная гипотеза отвергается. Однако заметим, что существуют примеры задач, в которых основная гипотеза отвергается в соответствии с иными условиями.

В заключение укажем несколько факторов, значения которых могут существенно повлиять на принятие (отвержение) основной гипотезы.

1. Принятая (отвергнутая) для меньшей выборки гипотеза может быть отвергнута (принята) при увеличении объема выборки. Например, гипотеза о влиянии числа выкуренных в день сигарет на продолжительность жизни человека, как правило, отвергается при исследовании групп людей объема меньше чем 100000.

2. Основная гипотеза, принятая (отвергнутая) при одном значении уровня значимости, может быть отвергнута (принята) при другом его значении. Чем ниже уровень значимости, тем легче принимается основная гипотеза (в пределе при основная гипотеза принимается автоматически).

3. Основной смысл алгоритма проверки гипотезы состоит в том, что сравниваются основная и конкурирующая гипотезы и проверяется, какая из них лучше согласуется со значениями выборки. Поэтому принятие или отвержение основной гипотезы существенно зависит от выбора конкурирующей гипотезы. Иными словами, основная гипотеза может быть принята (отвергнута) при одном выборе конкурирующей гипотезы Н 1 и отвергнута (принята) при другом выборе гипотезы Н 1.

 

5. СРАВНЕНИЕ ВЫБОРОЧНОЙ СРЕДНЕЙ С ГИПОТЕТИЧЕСКИМ

СРЕДНИМ ЗНАЧЕНИЕМ НОРМАЛЬНОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ ПРИ ИЗВЕСТНОЙ ВЕЛИЧИНЕ СТАНДАРТНОГО ОТКЛОНЕНИЯ

 

Постановка задачи. Имеется выборка значений нормальной СВ Х объема n. Необходимо при заданном уровне значимости проверить основную гипотезу , где – гипотетическое (предполагаемое) среднее значение. Стандартное отклонение нормальной СВ Х предполагается известным.

Комментарии к постановке задачи. Поскольку выборочное среднее является приближением к среднему значению случайной величины, то естественно возникает вопрос, насколько близко вычисленное по выборке выборочное среднее к неизвестному «истинному» среднему СВ. В данном типе задач мы берем число и проверяем, насколько правдоподобно выглядит в качестве среднего значения нормальной СВ Х. Очевидно, что число должно быть близко к вычисленному по выборке выборочному среднему. Кроме того, при увеличении числа наблюдений величина выборочного среднего должна приближаться к (если основная гипотеза действительно верна). Разобраться в том, насколько «близко» к может помочь приведенный ниже метод.

План решения. Вычисляемвыборочное среднее . Наблюдаемоезначение критерия вычисляется по формуле:

 

(3)

 

Критическая точка критерия зависит от выбранной конкурирующей гипотезы.

1. Если , то определяется из условия , где значения функции приведены в прил. 2. Если , то основная гипотеза принимается, в противном случае основная гипотеза отвергается.

2. Если , то находится из условия , где значения функции приведены в прил. 2. Если , то основная гипотеза принимается, в противном случае основная гипотеза отвергается.

3. Если , то находится в соответствии с правилами п 2. Если , то основная гипотеза принимается, в противном случае основная гипотеза отвергается.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.032 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал