Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Проверка формы дискретного распределения в MS ExcelСтр 1 из 2Следующая ⇒
Проверка гипотезы о том, что случайная величина подчиняется какому-либо дискретному закону распределения, осуществляется с помощью –критерия Пирсона, использование которого предполагает группировку исходных выборочных данных. Процесс группировки данных наблюдения над дискретной случайной величиной зависит от числа различных возможных значений этой случайной величины. В том случае, когда велико (больше 20 – 25), процесс группировки ничем не отличается от процесса группировки данных наблюдения над непрерывной случайной величиной. Если число невелико (менее 20 – 25), то группировка сводится к подсчету частоты появления каждого из различных возможных значений исследуемой случайной величины.
Пример №1. На рис. 1 в диапазоне ячеек А1: Е10 рабочего листа MS Excel приведены результаты наблюдения над некоторой случайной величиной . Необходимо используя эти данные на уровне значимости 5% проверить гипотезу о том, что случайная величина подчиняется распределению Пуассона. Рис. 1. Исходные данные для примера №1 Определим число различных возможных значений случайной величины . Для этого в ячейках В11 и В12 используя встроенные статистические функции МИН и МАКС определим минимальное и максимальное наблюдённое значение, которые равны: Таким образом, и группировка сводится к подсчету частоты появления каждого из возможных значений случайной величины. В диапазон ячеек G2: G12 введем целые числа , соответствующие возможным значениям случайной величины . Частоту появления каждого из возможных значений определим с помощью встроенной статистической функции ЧАСТОТА. Для этого выделим диапазон ячеек H2: H13 и нажатием клавиш Shift+F3 вызовем диалоговое окно мастера функций. В открывшемся диалоговом окне в списке Категория выберем Статистические, в списке функций выделяем ЧАСТОТА и щелкнем на кнопке ОK. В результате на экране появиться панель функции (рис. 2). Рис. 2. Панель функции ЧАСТОТА В поле первого аргумента Массив_данных введем ссылку на диапазон А1: E10, в котором находятся данные наблюдения. В поле ввода Массив_интервалов введем ссылку на диапазон G2: G12, в котором записаны возможные значения случайной величины. Нажатием клавиш Shift+Ctrl+Enter введем функцию ЧАСТОТА как функцию массива. В результате в диапазоне H2: H13 появятся значения эмпирических частот (рис. 3). В последней ячейке данного диапазона содержится значение количества элементов выборки не попавших ни в один из интервалов группировки. В ячейке H14 с использованием кнопки Автосумма найдем суммарное значение эмпирических частот, равное числу наблюденных значений случайной величины. Рис. 3. Результаты группировки данных наблюдения над дискретной случайной величиной При использовании критерия согласия Пирсона в качестве меры расхождения между эмпирическим и гипотетическим распределениями используется выборочная статистика вида:
где – относительная частота попадания выборочных значений случайной величины в i -й интервал группировки (эмпирическая вероятность попадания в i -й интервал); – теоретическая вероятность попадания случайной величины в i -й интервал при ее подчинении гипотетическому закону распределения (то есть при условии, что проверяемая гипотеза верна); n – число экспериментальных данных; k – количество интервалов группировки; – число значений случайной величины попавших в i –й интервал (эмпирическая частота); – ожидаемая (теоретическая) частота попадания случайной величины i -й интервал при истинности . При определении теоретических вероятностей () левая граница первого интервала группировки расширяется до , а правая граница последнего интервала до :
где – функция распределения теоретического закона; – нижняя (левая) граница i -го интервала группировки; – верхняя (правая) граница i -го интервала группировки. Таким образом, для использования –критерия необходимо найти значения функции распределения закона Пуассона для различных возможных значений случайной величины . Для этого, в свою очередь необходимо найти оценку параметра рассматриваемого распределения по формуле:
где – i -е возможное значение случайной величины; – частота появления i -го возможного значения. Для нахождения значения в ячейку I2 введем формулу =G2*H2, после чего используя маркер заполнения, скопируем её в ячейки I3: I12. В результате в диапазоне I2: I12 появятся значения произведений . В ячейке I13 с помощью Автосуммы найдем сумму всех произведений. Затем в ячейку I15 введем формулу =I13/H14, реализующую вычисление в соответствии с выражением (3). В итоге получим значение оценки параметра распределения (рис. 4). Рис. 4. Нахождение оценки параметра распределения При нахождении значений функции распределения закона Пуассона в качестве границ интервалов группировки принимаем: Вначале определим функции распределения для нижних границ. Так как распределение Пуассона определённо только для положительных значений случайной величины, то в ячейку J2 вводим значение равное нулю. Выделим ячейку J3 нажмем кнопку Вставка функции (f x), в списке Категория выберем Статистические, в списке функций выберем ПУАССОН[1]и нажмем ОK. В результате в строке формул появится функция =ПУАССОН(), а на экране – панель этой функции с полями для ввода аргументов (рис. 5). Рис. 5. Панель функции ПУАССОН В поле Х вводим G3-1, (ячейка G3 содержит второе возможное значение случайной величины). В поле Среднее введем абсолютную ссылку на ячейку I15, содержащую выборочную оценку параметра распределения . В поле Интегральная вводится логическая константа, определяющая вид вычисляемой функции: если в это поле ввести 0 (ЛОЖЬ), то функция выдаст значение функции вероятности , соответствующее заданному значению . Если в это поле ввести 1 (ИСТИНА), то функция выдаст значение функции распределения , соответствующее заданному значениюаргумента. Т.к. нам необходимо определить значение функции распределения, то в это поле вводим значение 1. Используя маркер автозаполнения, заполним диапазон ячеек J4: J12, значениями функций распределения от нижних границ интервалов группировки. Теперь определим значения функции распределения от верхних границ. Для этого выделим ячейку K2, вызовем панель функции ПУАССОНи в поле Х введем ссылку на ячейку G2. Остальные поля заполняются так же, как и для нижних границ. Используя маркер заполнения, копируем функцию в остальные ячейки диапазона K2: K12. Наконец, в диапазоне ячеек L2: L12, используя выражения (2), находим значения теоретических вероятностей, после чего в диапазоне М2: М12 рассчитываем значения теоретических частот по формуле: Используя кнопку Автосумма, проверяем выполнение условий нормировки для теоретических вероятностей и частот. Результаты расчётов приведены на рис. 6. Рис. 6. Расчёт теоретических вероятностей и частот Из рис. 6 видно, что значения теоретических частот для некоторых интервалов меньше пяти, поэтому необходимо провести объединение соответствующих интервалов. При этом эмпирическая и теоретическая частоты объединенного интервала равны сумме соответствующих частот объединяемых интервалов (рис. 7). Рис. 7. Результат объединения интервалов Рассчитаем значения слагаемых статистики . Для этого выделим ячейку Q3 и введем в неё формулу: =(P3-O3)^2/O3. В результате получим значение слагаемого для первого интервала. Используя маркер заполнения, определим значения слагаемых для остальных пяти интервалов. С помощью кнопки Автосумма или функции СУММ, находим в ячейке Q9 по формуле (1) значение статистики . Так как, после объединения осталось шесть интервалов группировки, и по выборочным данным была найдена одна оценка параметра распределения, то число степеней свободы распределения статистики равно: Рассчитанное значение статистики необходимо сравнить с верхней процентной точкой – распределения. Для её нахождения воспользуемся функцией ХИ2.ОБР[2]– выделим ячейку Q10, нажмем кнопку Вставка функции или клавиши Shift + F3, в диалоговом окне мастера функций в категории Статистические выберем ХИ2.ОБР и нажмем OK. На экране появиться панель функции (рис. 8). В поле ввода Вероятность введем значение уровня значимости в виде десятичной дроби, а в поле Степени_свободы – число 4 и нажмем кнопку OK. В результате в ячейке Q10 появиться значение верхней процентной точки (рис. 9). Рис. 8. Панель функции ХИ2.ОБР Рис. 9. Расчет статистики и её критического значения Т.к. расчетное значение статистики меньше её критического значения , то критерий отклонения нулевой гипотезы не выполняется, следовательно, нет оснований считать, что противоречит опытным данным. Таким образом, на уровне значимости 5% можно считать, что исследуемая случайная величина подчинена распределению Пуассона.
|