Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
График эмпирической функции распределения
5) Мода - значение признака с наибольшей частотой; Медиана значение признака, расположенного в середине ряда распределения. Мода и медиана являются структурными (распределительными) средними. Для определения моды сначала находят интервал с наибольшей частотой = 8. В этом интервале число правильных ответов 32-36. Точное значение моды находят путем интерполяции по формуле Где h - шаг интервала, - частота предмодального интервала, - частота постмодального интервала. = 4=34
Значение медианы также определяем путем интерполяции по формуле . - накопленные частоты интервалов, предшествующих меданному. - локальная частота интервала, в котором находятся единицы совокупности, делящие ряд пополам, медианного интервала. , следовательно медианным является интервал с накопленной частотой 20, его частота составляет =10, =17. 4=33, 5
Найдем методом произведений выборочные: среднюю, дисперсию, среднее квадратическое отклонение, начальные и центральные моменты до четвертого порядка включительно. Составляем таблицу: Таблица 1.
В качестве ложного нуля принимаем С= 34– варианта с наибольшей частотой 10 и находящаяся в середине вариационного ряда. Шаг выборки h=4. Тогда условные варианты определяются по формуле . Подсчитываем все варианты и заполняем все столбцы. Последний столбец служит для контроля вычислений по тождеству: = + 4 + 6 n= +4 +6 170 +4 +40= . Вычисления произведены верно. Найдем условные начальные моменты. . = 4, 25. - условные начальные моменты к- го порядка Вычисляем выборочную среднюю: = 3, 8. Находим выборочную дисперсию: = = 4, 2475 = 67, 96. Определяем выборочное среднее квадратическое отклонение: = = =8, 2437. = . = центральные эмпирические моменты третьего и четвертого порядков. Эти моменты в случае равноотстоящих вариант с шагом вычисляются по формулам: Ассиметрия и эксцесс определяются равенствами: , , , . = 4, 25. = =2, 08725 = 133, 584 = =42, 4 = 10855, 3552 Коэффициент вариации находим по формуле: · 100%. · 100% =24, 39 %. 6. Строим нормальную кривую. Для облегчения вычислений все расчеты сводим в таблицу 2
Таблица 2.
Заполняем первые три столбца. В четвертом столбце записываем условные варианты по формуле, указанной в «шапке» таблицы. В пятом столбце находим значения функции Функция четная, т.е. .Значения функции в зависимости от аргумента (берутся положительные , т.к. четная) находим из таблицы. Теоретические частоты теоретической кривой находим по формуле =n , где - вероятность попадания Х в i-частичный интервал с концами Приближенно вероятности могут быть найдены по формуле . Тогда теоретические частоты равны равны =n = = 19, 4 . Заполняем последний столбец. В последнем столбце частоты округляются до целого числа и = =40. В системе координат () строим нормальную (теоретическую кривую)кривую по выравнивающим частотам и полигон наблюдаемых частот . Полигон наблюдаемых частот построен в системе координат ().
7. Проверяем гипотезу о нормальности Х при уровне значимости =0, 05. В качестве статистики выбирают СВ : = . Она подчиняется распределению с числом степеней свободы , где s - число различных значений ; - число параметров, откоторых зависит распределение. Для нормального закона таких параметров два: a= и , т.е. , и . По данному уровню значимости и числу степеней свободы в таблице распределения находят критическое значение и находят критическую область: , = . Затем вычисляем наблюдаемое значение , т.е. по формуле . Если окажется, что , то нулевую гипотезу о том, что Х имеет нормальное распределение, принимают. В этом случае опытные данные хорошо согласуются с гипотезой о нормальном распределении генеральной совокупности. Вычислим , для чего составим расчетную таблицу 3. Таблица 3
Суммируя числа пятого столбца, получаем = 5, 352381 Суммируя числа последнего столбца, получаем 45, 35238 Контроль: =5, 352381 - = 45, 35238-40=5, 352381 Совпадение результатов подтверждает правильность вычислений. Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариантов) 9, =9-3=6. По таблице критических точек распределения , по уровню значимости и числу степеней свободы 6 находим . Так как , то нет оснований отвергнуть нулевую гипотезу. Расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности. 8. Найдем доверительный интервал для оценки неизвестного математического ожидания, полагая, что Х имеет нормальное распределение, среднее квадратическое отклонение = 8, 2437и доверительную вероятность . Известен объем выборки: n=40, выборочная средняя 3, 8. Из соотношения 2 получим 0, 475. По таблице находим параметр t=1, 96. Найдем точность оценки = 2, 55 Доверительный интервал таков: < или < или < . Надежность указывает, что если произведено достаточно большое число выборок, то 95 % из них определяет такие доверительные интервалы, в которых параметр действительно заключен. Интервальная оценка для среднего квадратического отклонения: . находим по таблице по заданным n и . = 0, 24
Тема 2
Статистическое исследование зависимостей (корреляционно- регрессионный анализ) Рассмотрим выборку двумерной случайной величины (Х, Y). Примем в качестве оценок условных математических ожиданий компонент их условные средние значения, а именно: условным средним назовем среднее арифметическое наблюдавшихся значений Y, соответствующих Х = х. Аналогично условное среднее - среднее арифметическое наблюдавшихся значений Х, соответствующих Y = y. Уравнения регрессии Y на Х и Х на Y имеют вид: = f* (x) - - выборочное уравнение регрессии Y на Х, = φ * (у) - - выборочное уравнение регрессии Х на Y. Соответственно функции f* (x) и φ * (у) называются выборочной регрессией Y на Х и Х на Y, а их графики – выборочными линиями регрессии. Выясним, как определять параметры выборочных уравнений регрессии, если сам вид этих уравнений известен. Пусть изучается двумерная случайная величина (Х, Y), и получена выборка из п пар чисел (х 1, у 1), (х 2, у 2), …, (хп, уп). Будем искать параметры прямой линии регрессии Y на Х вида Y = ρ yxx + b, подбирая параметры ρ ух и b так, чтобы точки на плоскости с координатами (х 1, у 1), (х 2, у 2), …, (хп, уп) лежали как можно ближе к прямой. Используем для этого метод наименьших квадратов и найдем минимум функции . Приравняем нулю соответствующие частные производные: . В результате получим систему двух линейных уравнений относительно ρ и b: Ее решение позволяет найти искомые параметры в виде: . При этом предполагалось, что все значения Х и Y наблюдались по одному разу. Теперь рассмотрим случай, когда имеется достаточно большая выборка (не менее 50 значений), и данные сгруппированы в виде корреляционной таблицы:
Здесь nij – число появлений в выборке пары чисел (xi, yj). Поскольку , заменим в системе (10.3) , где пху – число появлений пары чисел (х, у). Тогда система примет вид: Можно решить эту систему и найти параметры ρ ух и b, определяющие выборочное уравнение прямой линии регрессии: . Но чаще уравнение регрессии записывают в ином виде, вводя выборочный коэффициент корреляции. Выразим b из второго уравнения системы: . Подставим это выражение в уравнение регрессии: . , где Введем понятие выборочного коэффициента корреляции и умножим равенство на : , откуда . Используя это соотношение, получим выборочное уравнение прямой линии регрессии Y на Х вида .
|