![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Проверка выборки на стохастичностьСтр 1 из 2Следующая ⇒
Министерство образования и науки Российской Федерации Невинномысский технологический институт (филиал) федерального государственного автономного образовательного учреждения высшего профессионального образования «СЕВЕРО-КАВКАЗСКИЙ ФЕДЕРАЛЬНЫЙ университет»
Кафедра информационных систем, электропривода и автоматики
рассчётно-графическая работа
По дисциплине: Высшая математика
Автор работы: Асеева С. А. Специальность: 140400.61 Группы Н-ЭЭН-121-б-о-12
Руководитель работы: Пашковский А. В. Работа зачтена с оценкой________
Невинномысск, 2013. Вариант 1 Из текущей продукции автомата, обрабатывающего ролики, взята выборка объемом 100 шт. Ролики измерены по диаметру микрометром с ценой деления 0, 01 мм. Результаты этих измерений приводятся ниже.
(Xi-19)*100-80, получаем
Проверка выборки на стохастичность Пред тем как подвергнуть результаты наблюдений соответствующей статистической обработке, необходимо убедиться, что они образуют случайную выборку. С этой целью воспользуемся критерием «восходящих» и «нисходящих» серий. В этом критерии исследуется последовательность знаков – плюсов и минусов. Исходным пунктом является выборка х 1, х 2, … х n (в приведенном примере значения признака). На i – ом месте этой выборки ставится плюс, если Х i+1 – X i > 0, минус, если х i+1 – x i < 0.(Если х in = х i, то значение х i пропускается). В приведенном таблице мы получим следующую последовательность знаков: -++-+-+-+-+-++-+-++---+-+-+-+-++-++-+---++-+-+-+---++-++-+-+-++-+-++--++----+-+--++---++-+-+-+ Под «серией» будем понимать последовательность подряд идущих плюсов или минусов. В частности, «серия» может состоять только из одного плюса или одного минуса, тогда ее протяженность равна единице. Общее число, серий в выборке обозначим через n(n), протяженность самой длинной серии – t(n). Для нашего таблицы n =100; n(n) =66; t(n) = 4. При уровне значимости a = 0, 05 количественное выражение правила проверки на случайность следующее: t(n) < t0(n),
Так как выполнено и второе неравенство, то в приведенном задание выборка случайная.
2.2 Построение эмпирической функции распределения При большом объеме выборки (порядка сотен) простая статистическая совокупность престает быть удобной формой записи статистического материала - она становится громоздкой и мало наглядной. Для придания большей компактности элементы выборки объединяют в группы (интервалы), число которых колеблется от 5 до 40, в зависимости от объема выборки. Некоторые авторы для определения числа интервалов рекомендуют пользоваться эмпирическими формулой Просматривая результаты испытаний, выбираем наибольшее и наименьшее наблюдаемые значения признака X (x max, x min) и находим величину размаха варьирования
Зная число интервалов и размах варьирования R, находим длину каждого интервала h по формуле
При этом не рекомендуется, чтобы значение признака попадало на границу интервала. Чтобы избежать этого, длину интервала увеличивают или уменьшают, изменяя число интервалов. В рассмотренном задание: х min = 6; x max = 19; R = xmax – хmin = 13. Значение К =10 подсчитано по формуле Тогда h = 1, 3 h*=1, 33. Далее приступаю к заполнению таблицы 1. В колонке 1 записаны полученные интервалы, расположенные в порядке возрастания значений признака. В колонке 2 отмечено наличие признака, попавшего в рассматриваемый интервал (для облечения подсчета количества значений признака их группируют по 5). Количество m (абсолютная частота признака) записывают в колонку 3. В колонке 4 записывают относительные частоты Таблица 1
Данные таблицы 1 используют для графического изображения статистического ряда либо в виде гистограммы, либо в виде эмпирической функции распределения. Это графическое изображение позволяет представить в наглядной форме закономерности, присущие генеральной совокупности. Для построения гистограммы (рисунок 1) на оси абсцисс последовательно откладываются интервалы изменения значения признака. На этих отрезках, как на основании, строят прямоугольники с высотами, равными Рисунок 1 – Гистограмма График эмпирической функции распределения (рисунок 2) строят в координатах (х, где x – значения признака;
Под значением признака понимают середины рассматриваемых интервалов, а под накопительной
Рисунок 2 – Вычисление точных оценок параметров распределения Статистический ряд – первый шаг к осмыслению ряда наблюдений. Однако на практике этого недостаточно. Статистические ряды, имеющие похожие графические изображения, могут различаться: 1. Эмпирической средней 2. Средним квадратическим отклонением S - рассеянием наблюдения вокруг эмпирической средней; 3. Показателем ассиметрии Аs, характеризующим скошенность гистограммы; 4. Показателем эксцесса Es, характеризующим островершинность гистограммы. Перечисленные числовые характеристики называют статистическими. По ним судят о характерных особенностях статистического ряда. Эти характеристики вычисляются по формулам:
где ximi – середина и абсолютная частота i - го интервала; k – число интервалов. Для удобства вычислений
Обозначим где h – длина интервала, и подставим в последнюю формулу Для вычисления эмпирической дисперсии S2 используют формулу
Показатель асимметрии вычисляют по формуле
Показатель эксцесса находят по формуле:
Для удобства вычислений Таблица 2.
Подставляя данные таблицы 2 в формулы, находим:
Заметим что для нормального распределения As = Es =0. 2.3 Вычисление интервальных оценок Следует понимать, что найденные эмпирические характеристики могут отличаться от истинных. Для оценки этих отклонений вводят понятие о доверительном интервале. Пусть q некоторый параметр, характеризующий распределение генеральной совокупности. ]A, B[ называется доверительным интервалом с уровнем значимости a, если Обычно a полагают равным 0, 1; 0, 05; 0, 01. Значение I-a определяются условиями эксперимента, например, в биологии I – a = 0, 99, а в технике часто принимают I – a = 0, 95. Если случайная величина Х распределена по закону, близкому к нормальному, а дисперсия s 2 этого распределения не известна, то доверительный интервал для математического ожидания a имеет следующие границы:
где ta, n-1 – находят по таблицам; t – распределения Стьюдента. В рассматриваемом примере n = 100, S =2, 9063, a = 0, 05, t0, 05; 199 =1, 96. Следовательно, математическое ожидание a исследуемой величины Х заключенного в интервале
Заметим, что при известном s математическое ожидание заключено в интервале где число t определяется из равенства
2.4 Построение теоретической кривой. Проверка близости эмпирической и теоретической функций распределения Во многих практических задачах точный закон распределения исследуемой случайной величины не известен. При обработке экспериментальных данных для характеристики частотных свойств ряда наблюдений исследователь подбирает теоретико-вероятностную модель этого ряда. В качестве модели может быть выбрано нормальное распределение Пуассона. Пусть экспериментатор по виду гистограммы или из других соображений выдвинул гипотезу о законе распределения, которому подчиняется исследуемая случайная величина. Проверка гипотезы о предлагаемом законе распределения производится с помощью критериев согласия. Наиболее распространенным критерием согласия является критерий Х2 Пирсона, который позволяет проверять близость эмпирической функции распределения с гипотетической (предполагаемой) функцией. Вид гистограммы, а также значения AS, ES и позволяют выдвинуть гипотезу о нормальном виде распределения исследуемого признака. Для проверки этого на основании гипотетической функции вычисляют вероятности попадания случайной величины в интервалы ]xi-1, xi[: рi = P(x i-1 < x < x i) = F(x i) – F(x i-1), i = 1, 2, 3…., k. Умножая эти вероятности на объем выборки, получают теоретические абсолютные частоты nрi интервалов ]xi-1, xi[. После чего подсчитывают выборочную статистику X2набл: Зная уровень значимости a и число степеней свободы по таблицам квантилей Х2 – распределения находят критическое значения Х2a, n. Заметим, что число степеней свободы n данного распределения равно n = k - r – 1, где k – число интервалов; r – число параметров предполагаемой функции распределения. Например, у нормального закона распределения r = 2, (a, σ), у распределения Пуассона r = 1, (a). Сравнивая наблюдаемое значение выборочной статистики, вычисленной по формуле, с критическим значением, приходят к выводу: 1. Выдвинутая гипотеза отвергается, если X2набл > Х2a, n, то есть гипотетическая функция распределения не согласуется с опытными данными; 2. Выдвинутая гипотеза принимается, если X2набл < Х2a, n, то есть гипотетическая функция распределения согласуется с опытными данными. Для применения критерия Пирсона необходимо, чтобы в каждом интервале было не менее 5 значений признака. Если это не так, то рекомендуется объединить такие интервалы с соседними. Значения статистических характеристик подтверждают обоснованность нашего предположения о нормальном распределении исследуемой совокупности. Параметрами этого распределения будут эмпирическая средняя Гипотетическая функция распределения имеет вид:
Для вычисления значений F(x) сделаем замену Таблица 3
Так же, как и при определении доверительного интервала, a определяется условиями эксперимента. Зададим a = 0, 05. В рассматриваемом примере К = 10 (3 последних интервала объединены в один), поэтому n = 8 – 2 – 1 = 5. По таблицам квантилей Х2 распределения находят: X20, 05; 7 =11, 2. Так как X2набл =4, 147< 11, 1, то выдвинутая гипотеза о том, что совокупность объектов подчиняется нормальному закону распределения, принимается.
|