Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Группирование. Ряды распределения.
Сводка и группировка представляют второй этап статистического исследования, цель которого – систематизация данных, полученных в результате статистического наблюдения. Целью этого этапа является получение сводной характеристики объекта с помощью статистических показателей. Сводкой называется научно организованная обработка материалов наблюдения, представляющая собой их систематизацию и группирование. При группировании образуются группировки, изображаемые в виде таблиц, в которых отдельные единицы совокупности объединены в группы. Таким образом, группировка является результатом разбивки (разделения, расчленения) множества единиц совокупности на группы по определенным существенным для них признакам. Признак, на основании которого построена группировка, называется группировочным ( или основанием группировки ). Группировка позволяет выявить закономерности изучаемого явления. Метод группировок является важнейшим статистическим методом обобщения данных. С помощью него могут решаться следующие задачи: а) определение типа явления; б) изучение структуры явления; в) выявление связи и зависимости между явлениями. Статистические группировки классифицируются как по типу группировочного признака, так и по количеству признаков, положенных в ее основание. В соответствии с типом группировочного признака группировки делятся на типологические и структурные. В основание типологической группировки положен атрибутивный признак, разделяющий исследуемые совокупности на качественно разнородные классы, типы, группы единиц (группировка жителей по полу, образованию, рабочих по профессиям, предприятий по отраслям, формам собственности, деталей по материалу и т.п.). Структурная группировка имеет в своем основании количественный (варьирующий) признак, который делит совокупность на однородные группы (группировка населения по возрасту, доходу, предприятий размеру уставного капитала, числу работников, объему выпускаемой продукции, стоимости основных фондов и т.п.). По количеству признаков, использованных для образования группировок, последние делятся на простые, в основание которых положен один любой признак, и сложные, построенные по двум и более признакам, взятым в сочетании. Сложная группировка строится следующим образом. Вначале совокупность делится на группы по одному признаку, затем полученные группы – на подгруппы по другому, далее из подгрупп формируются более мелкие образования по третьему признаку и т.п. Чем больше признаков применяется для построения группировки, тем детальнее может быть изучена совокупность. С другой стороны группировка, построенная с использованием трех и более признаков, сложнее воспринимается. Кроме того, использование большого количества признаков для группирования относительно небольших совокупностей приводит к тому, что значительное число подгрупп может оказаться пустым, что является недопустимым. Структурные группировки способны содержать практически любое количество групп – от минимального (двух) до очень большого. Так, возрастная группировка жителей поселка может насчитывать от двух групп (например, до 40 и более 40 лет) и, например, до такого их количества, при котором каждый конкретный возраст будет составлять отдельную группу. При небольшом количестве групп число единиц совокупности в группе может быть слишком большим и наоборот. Число единиц в группе должно быть, однако, оптимальным (группа с большим количеством единиц может потребовать дополнительной группировки, показатели же, рассчитанные для малочисленных групп, могут не быть представительными). Таким образом, оптимальное число единиц в группе определится оптимальным количеством групп в совокупности. Оптимальное число групп, на которые может быть разбита совокупность, определяется рядом способов. Чаще всего для этой цели используется формула Стерджесса:
n = 1 + 3, 3 lg N,
где n – число групп в совокупности; N – число единиц совокупности.
После определения числа групп, входящих в состав группировки, необходимо найти интервалы каждой группы с тем, чтобы по ним распределить единицы совокупности в соответствии со значениями их группировочного признака. Интервалом называется значение варьирующего количественного признака, лежащее в определенных пределах. Интервал имеет величину и границы. Нижней границей интервала называется минимальное значение признака в нем, верхней границей – максимальное. Величиной интервала является разность между его верхней и нижней границами. Статистические группировки могут иметь различные виды интервалов. У группировки с равными интервалами вариация признака в каждой группе одинакова. Величина равного интервала h в группировке определяется по формуле
, где Хmax и Хmin – максимальное и минимальное значения признака в совокупности.
Величина интервала называется шагом интервала, а разность Хmax и Хmin – размахом вариации R (R = Хmax – Хmin). При определении размаха вариации из совокупности необходимо исключить аномальные значения признака, если таковые имеются (это максимальные и минимальные значения, сильно отличающиеся от смежных с ними значений признака). Полученная при этом величина h при необходимости может быть округлена следующим образом: при ее значениях с одним знаком до запятой – до десятых, с двумя – до целых, с тремя и более знаками – до ближайшего числа, кратного 50 или 100. Для построения группировки последовательно определяют границы интервалов каждой группы. Нижняя граница интервала первой группы равна минимальному значению признака в совокупности; прибавляя к ней шаг, получают верхнюю границу ее интервала, которая одновременно является нижней границей интервала второй группы. После определения интервалов группировки единицы совокупности в соответствии со значениями их группировочного признака распределяются по группам. Упорядоченно распределенные единицы совокупности по группам по определенному варьирующему признаку образуют статистический ряд распределения. Конкретное значение варьирующего признака вариационного ряда распределения называется вариантом; численность отдельного варианта (каждой группы ряда), т.е. число, показывающее, как часто тот или иной вариант встречается в варьирующем ряду, – частотой. Сумма всех частот, таким образом, составляет численность (объем) всей совокупности. Частоты, выраженные в долях единицы (или в процентах к итогу), называются частостями (их сумма должна быть равна соответственно 1 или 100%). Ряды распределения, как правило, оформляются в виде таблиц и анализируются при помощи их графических изображений, которые называются гистограммой. Гистограмма представляет собой изображенную в плоских прямоугольных координатах систему прямоугольников, основания которых представляют собой величины интервалов ряда, откладываемые по оси абсцисс, а высоты – соответствующие им частоты, откладываемые по оси ординат. В результате ряд распределения изображается в виде смежных друг с другом вертикальных столбцов (полос). Для анализа рядов распределения могут быть использованы и суммирующие кривые, например, кумулята. Кумулята строится в тех же координатах, что и гистограмма; при ее построении используют накопленные частоты – каждая последующая включает предыдущие нарастающей суммой.
|