Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Величин по выборкам. Структурные средние.
Вариационные ряды и их графики дают наглядное представление о варьировании признаков, но они недостаточны для полного описания варьирующих объектов. Для этой цели служат особые, логически и теоретически обоснованные числовые показатели, называемые статистическими характеристиками. К числу важнейших показателей, используемых в статистическом анализе, относят: 1) средние величины; 2) показатели разнообразия и 3) показатели соответствия выборочных данных параметрам генеральной совокупности. В зависимости от того, как распределены первичные данные – в равно- или в неравноинтервальный вариационный ряд, - для их характеристики применяют разные средние величины. Именно при распределении собранных данных в неравноинтервальный вариационный ряд более подходящей обобщающей характеристикой изучаемого объекта служит так называемая плотность распределения, т.е. отношение частот или частей к ширине классовых интервалов. Кроме того, числовыми __________характеристиками таких рядов могут служить средние из абсолютных или относительных показателей плотности распределения. Средняя плотность показывает, сколько единиц данной совокупности приходится в среднем на интервал, равный единице измерения учитываемого признака. Средние величины. В отличие от индивидуальных числовых характеристик средние величины обладают большей устойчивостью, способностью характеризовать целую группу однородных единиц одним средним числом. Различают структурные (мода, медиана) и степенные (средняя арифметическая, средняя взвешенная и др.) средние. Показатели средних величин обладают следующими свойствами: 1)являются обобщенными статистическими параметрами, они позволяют получать срединное значение варьирующего показателя; 2)средняя – это величина абстрактная, т.к. при ее вычислении можно получать такие дробные значения, которые в действительности не могут иметь место в связи с природой самого признака; 3)средняя величина имеет конкретное выражение, показывая величину признака в том же наименовании, в котором он измерялся; 4)средние величины могут характеризовать только однородную совокупность вариант; 5)одни средние применяются только в симметричных рядах (арифметическая, взвешенная, квадратичная, кубическая), другие – в асимметричных рядах (геометрическая), а третьи – как в симметричных, так и в асимметричных рядах (мода, медиана, средняя гармоническая). Структурные средние и способы их вычисления. Структурные величины представляют собой конкретные варианты имеющейся совокупности, которые занимают особое место в ряду распределения. Мода (Мо) – это наиболее часто встречающаяся варианта в вариационном ряду. Мода отличается полной независимостью от крайних значений. Для малых выборок мода не определяется. При нормальном распределении величины моды (Mo), медианы (Ме) и средней арифметической (Х) равны. Чем больше асимметрия ряда, тем больше разница между Мо, Ме, Х. Моду применяют для характеристики не только количественных, но и качественных признаков, что важно при изучении генетических особенностей альтернативных признаков. В качестве примера рассмотрим распределение, представленное в таблице 5.1. Таблица 5.1. В этом распределении наиболее многочисленным является пятый класс (180-199 с частотой 250. Это модальный класс. Формула для вычисления моды (Мо): где: ХМо – варианта, соответствующая началу модального класса; k – классный промежуток; f1 – частота, предшествующая модальному классу; f2 – частота модального класса; f3 – частота, следующая за модальным классом. Для приведенного распределения ХМо = 180, k = 20, f1= 160, f2 = 250, f3 = 240. Следовательно, мода этого распределения Модальная величина особенно удобна для характеристики качественных признаков, что имеет распространение при изучении генетических особенностей альтернативных при знаков. Например, модальными будут доминантные признаки. В некоторых распределениях встречается два или три модальных класса. Иногда это может быть следствием того, что в изучаемую группу попал разнородный материал, относящийся к разным категориям (более крупной или менее крупной) по изучаемому признаку. Медиана (Ме) – средняя, относительно которой ряд распределения делится на две равные части: в обе стороны от Ме располагается одинаковое число вариант. Медиану чаще используют для характеристики качественных признаков. Для количественных признаков способ вычисления медианы зависит от объема выборки: а) n< 30. В малой выборке собранные данные в начале ранжируют. При нечетном числе членов ряда медианой будет центральная варианта. Для ряда с четным числом членов медианой будет полусумма его центральных членов. б) n> 30. Медиана может быть вычислена при помощи формулы: где: ХМе – варианта, соответствующая началу медиального класса; k – классный промежуток; f1 - сумма накопленных частот по классам, предшествующим классу, включающему медиану; f – частота медиального класса. Нахождение медианы можно показать для распределения, представленного в таблице 5.2. Таблица 5.2. Судя по ряду накопленных частот, медиана находится в шестом классе, так как в первых пяти классах имеется 492 вариант, а меньше медианы должна быть половина всей группы, т.е. 500 вариантов__________. Недостающие варианты до 500 находятся в шестом классе. Для данного распределения а медиана равна Медиана особенно удобна для таких рядов, когда ряд характеризуется не замкнутостью, т.е. крайние классы вариационного ряда не имеют определенной границы, а дается условная граница и, когда разброс данных велик. Например, для первого класса – " 5 и менее", для последнего класса – " 16 и более". Для таких рядов вычислить Х невозможно. Поэтому вычисляют только Ме. Медиана, обладая в полной мере всеми общими свойствами средних величин, дает начало целой серии показателей разнообразия, которые носят общее название квантиль. Квантиль — это такое значение признака, которое отсекает в распределении определенную часть дат больше себя и определенную часть дат меньше себя. К таким показателям относятся, кроме медианы (средней величины), показатели разнообразия: квартили, децили и перцентили. Три квартиля разделяют группу на четыре равночисленные части. Второй квартиль равен медиане, а расстояние между третьим и первым квартилем является одним из показателей степени разнообразия значений признака в группе. Девять децилей разделяют группу на десять равночисленных частей. Пятый дециль равен медиане, а расстояние между девятым и первым децилем служит одним из показателей разнообразия. Девяносто девять перцентилей делят группу на сто равночисленных частей. Пятидесятый перцентиль равен медиане; девяносто девятый и первый перцентиль используются иногда в качестве максимума и минимума группы; расстояние между девяносто девятым и первым перцентилем служит показателем размаха признака и разнообразия дат в этой группе.
|