![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
статистических распределений
Выборочные характеристики
Статистическое распределение содержит полную информацию об изменчивости (вариации) признака. Однако на практике часто нет необходимости непосредственно использовать статистическое распределение, достаточно знать некоторые сводные характеристики, которые довольно успешно и полно описывают основные свойства распределения. Для описания основных свойств статистических распределений чаще всего используют выборочные характеристики следующих видов: 1) средние; 2) характеристики вариации (рассеяния). Существуют различные виды средних: средняя арифметическая, средняя геометрическая, средняя гармоническая и др. Это так называемые аналитические средние. Основным видом аналитических средних является средняя арифметическая, или выборочная средняя. Выборочная средняя Если данные наблюдения не сгруппированы, то выборочная средняя
Если же данные сгруппированы, то выборочная средняя
Здесь частоты mi и частости wi являются весами. Следует отметить, что данные формулы непосредственно применимы только к статистическому распределению дискретного признака (дискретному ряду). Кроме рассмотренной средней арифметической, для статистических распределений используют еще структурные, или порядковые, средние. Из них наиболее часто применяют медиану и моду. Медиана х ме - это серединное значение признака Х, то есть значение признака, которое делит ранжированный вариационный ряд на две равные по численности группы. Медиана х ме определяется следующим образом:
х ме = хj+ 1 , если n = 2 j +1 - нечетное. Из определения накопленной относительной частоты следует, что
Мода Если Рассмотренные средние тем более характерны для данного распределения, чем теснее группируются отдельные варианты вокруг средней, то есть чем менее они рассеяны. Поэтому средние характеристики должны быть дополнены измерением вариации признака относительно средней, то есть характеристиками рассеяния. Самую грубую оценку рассеяния значений признака дает размах вариации R = х max- х min, который учитывает лишь два крайних значения признака. Но он не дает представления о расположении вариант вокруг средней. Для оценки колеблемости значений признака относительно средней чаще всего используют дисперсию. Выборочная дисперсия
Если данные наблюдения не сгруппированы, то выборочная дисперсия определяется следующей формулой:
Для сгруппированных данных находят выборочную взвешенную дисперсию:
Эти формулы непосредственно применимы только к статистическому распределению дискретного признака (дискретному ряду). Выборочную дисперсию еще можно определить по формуле
то есть выборочная дисперсия равна среднему квадрату без квадрата средней. Средний квадрат есть выборочная средняя арифметическая квадратов значений признака X (данные наблюдения не сгруппированы и сгруппированы, соответственно):
Однако дисперсия вследствие суммирования квадратов отклонений дает искаженное представление о самой величине отклонений, измеряя их в квадратных единицах. Поэтому, используя дисперсию, вводят еще характеристики: выборочное среднее квадратическое отклонение Выборочное среднее квадратическое отклонение (
Оно показывает, на сколько в среднем отклоняются значения xj признака X от выборочной средней Коэффициент вариации Замечание. Приведенные выше формулы вычисления выборочных характеристик, применимые только к дискретному ряду, могут быть использованы для приближенного вычисления выборочных характеристик непрерывного признака, представленного интервальным рядом. Для этого предварительно каждый интервал (xi -1 -xi) заменяется его серединой Пример 1. Найти числовые характеристики распределения предприятий по числу работающих. Решение. Признак Х - число работающих (чел.) на предприятии. Для расчета характеристик данного распределения удобнее использовать таблицу:
Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = xi при Н (хi) + 1 Ј j Ј Н (хi +1). Для рассматриваемого примера: xj = 450 при 12Ј j Ј 41. Объем выборки n = 80 - число четное. Пусть n = 2 j, тогда j = 40. Поэтому
Частота достигает максимума: mi = m max = 30 при xi = 450, поэтому х мо = 450 (чел.). Очевидно, х мo= х ме№ R = х max - х min = 750 - 150 = 600 (чел.). Дисперсию вычислим двумя способами: 1) 2)
Тогда
Так как Пример 2. Найти числовые характеристики распределения затрат времени на обработку одной детали. Решение. Признак Х - затраты времени (мин) на обработку одной детали - непрерывный. Распределение задано интервальным рядом. Характеристики такого ряда находят по тем же формулам, что и для дискретного ряда, предварительно заменив интервальный ряд дискретным. Для этого каждый интервал xi -1 -xi заменяется его серединой
Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = Объем выборки n = 100 - число четное. Пусть n = 2 j, тогда j = 50. Поэтому
Частота достигает максимума: mi = m max = 40 при xi = 29, поэтому х мо=29 (мин). Очевидно, х мo = х ме № R = х max - х min = 34 - 22 = 12 (мин). Дисперсию найдем двумя способами: 1) 2)
|