![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
График эмпирической функции распределения
5) Мода Медиана Для определения моды сначала находят интервал с наибольшей частотой Где h - шаг интервала, =
Значение медианы
Найдем методом произведений выборочные: среднюю, дисперсию, среднее квадратическое отклонение, начальные и центральные моменты до четвертого порядка включительно. Составляем таблицу: Таблица 1.
В качестве ложного нуля принимаем С= 34– варианта с наибольшей частотой 10 и находящаяся в середине вариационного ряда. Шаг выборки h=4. Тогда условные варианты определяются по формуле
Подсчитываем все варианты Последний столбец служит для контроля вычислений по тождеству:
Вычисления произведены верно. Найдем условные начальные моменты.
Вычисляем выборочную среднюю:
Находим выборочную дисперсию:
Определяем выборочное среднее квадратическое отклонение:
Эти моменты в случае равноотстоящих вариант с шагом Ассиметрия и эксцесс определяются равенствами:
Коэффициент вариации находим по формуле:
6. Строим нормальную кривую. Для облегчения вычислений все расчеты сводим в таблицу 2
Таблица 2.
Заполняем первые три столбца. В четвертом столбце записываем условные варианты по формуле, указанной в «шапке» таблицы. В пятом столбце находим значения функции Функция Теоретические частоты теоретической кривой находим по формуле
где Приближенно вероятности могут быть найдены по формуле Тогда теоретические частоты равны равны
Заполняем последний столбец. В последнем столбце частоты В системе координат (
7. Проверяем гипотезу о нормальности Х при уровне значимости В качестве статистики
Она подчиняется распределению
Если окажется, что Вычислим Таблица 3
Суммируя числа пятого столбца, получаем Суммируя числа последнего столбца, получаем 45, 35238 Контроль:
Совпадение результатов подтверждает правильность вычислений. Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариантов) 9, По таблице критических точек распределения Так как 8. Найдем доверительный интервал для оценки неизвестного математического ожидания, полагая, что Х имеет нормальное распределение, среднее квадратическое отклонение Известен объем выборки: n=40, выборочная средняя Из соотношения 2 Найдем точность оценки
Доверительный интервал таков:
Надежность Интервальная оценка для среднего квадратического отклонения:
Тема 2
Статистическое исследование зависимостей (корреляционно- регрессионный анализ) Рассмотрим выборку двумерной случайной величины (Х, Y). Примем в качестве оценок условных математических ожиданий компонент их условные средние значения, а именно: условным средним имеют вид:
- выборочное уравнение регрессии Y на Х,
- выборочное уравнение регрессии Х на Y. Соответственно функции f* (x) и φ * (у) называются выборочной регрессией Y на Х и Х на Y, а их графики – выборочными линиями регрессии. Выясним, как определять параметры выборочных уравнений регрессии, если сам вид этих уравнений известен. Пусть изучается двумерная случайная величина (Х, Y), и получена выборка из п пар чисел (х 1, у 1), (х 2, у 2), …, (хп, уп). Будем искать параметры прямой линии регрессии Y на Х вида Y = ρ yxx + b, подбирая параметры ρ ух и b так, чтобы точки на плоскости с координатами (х 1, у 1), (х 2, у 2), …, (хп, уп) лежали как можно ближе к прямой. Используем для этого метод наименьших квадратов и найдем минимум функции
Приравняем нулю соответствующие частные производные:
В результате получим систему двух линейных уравнений относительно ρ и b: Ее решение позволяет найти искомые параметры в виде:
При этом предполагалось, что все значения Х и Y наблюдались по одному разу. Теперь рассмотрим случай, когда имеется достаточно большая выборка (не менее 50 значений), и данные сгруппированы в виде корреляционной таблицы:
Здесь nij – число появлений в выборке пары чисел (xi, yj). Поскольку
Можно решить эту систему и найти параметры ρ ух и b, определяющие выборочное уравнение прямой линии регрессии:
Но чаще уравнение регрессии записывают в ином виде, вводя выборочный коэффициент корреляции. Выразим b из второго уравнения системы:
Подставим это выражение в уравнение регрессии:
где Введем понятие выборочного коэффициента корреляции и умножим равенство на Используя это соотношение, получим выборочное уравнение прямой линии регрессии Y на Х вида
|