Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Первичная обработка материалов массовых наблюдений.
Исходным пунктом исследования, проводимого с использованием статистических методов, является массовое наблюдение, то есть сбор информации о признаках исследуемых объектов Материалы массовых наблюдений первоначально представляют собой довольно беспорядочную массу различных сведений. Первым этапом проведения первичной обработки является сводка. Сводка - это подсчет числа единиц наблюдаемой совокупности. Пример 10. Пусть имеются данные о возрасте 100 рецидивистов, осужденных за грабеж и разбой: 18, 20, 32, 23, 20, 24, 22, 18, 29, 23, 19, 21, 18, 23, 18, 24, 27, 31, 19, 25, 27, 21, 28, 25, 16, 17, 27, 21, 19, 20, 19, 25, 18, 27, 22, 23, 19, 31, 32, 27, 19, 22, 30, 17, 22, 19, 18, 24, 20, 22, 17, 29, 21, 27, 17, 31, 25, 20, 24, 19, 26, 28, 21, 18, 26, 21, 20, 23, 26, 23, 19, 25, 21, 20, 18, 25, 33, 18, 33, 19, 33, 28, 31, 22, 30, 19, 26, 18, 29, 20, 29, 19, 23, 32, 17, 20, 33, 21, 33, 19. После упорядочивания этих данных в порядке возрастания получим следующий ряд: 16, 17, 17, 17, 17, 17, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 28, 28, 28, 29, 29, 29, 29, 30, 30, 31, 31, 31, 31, 32, 32, 32, 33, 33, 33, 33, 33. Операция упорядочивания ряда числовых данных по возрастанию (убыванию) называется его ранжированием. После сводки материалы наблюдения принимают следующий вид, для большего удобства записываемый в виде таблицы. таблица 1
Наблюдаемые значения возраста (х1=16, х2=17,..., х18=33) называются вариантами, а последовательность вариант, записанная в возрастающем порядке, - вариационным рядом или рядом распределения. Числа наблюдений в начале примера - это числа лиц n1, n2,..., n18 называются частотами. Относительной частотой называется отношение числа наблюдений данной варианты (ni) к общему числу наблюдений (n). Отметим, что сумма относительных частот равна единице: Накопленной частотой называется сумма частот всех вариант от левой границы вариационного ряда до данной варианты. Для последней варианты накопленная частота всегда равняется единице. Найдем частоты каждого из возрастов: таблица 2
Теперь можно, например, подсчитать сколько в России преступников, совершивших преступление в возрасте 18 лет. Доля 18-летних преступников 0, 1. Умножив общее число лиц, нарушивших уголовный закон, на 0, 1 получим искомое число. Перечень вариант и соответствующих им частот называют статистическим распределением выборки. При соблюдении всех правил проведения выборочного исследования статистическое распределение выборки является экспериментальным отражением соответствующего закона распределения случайной величины и может служить основанием для анализа действующих факторов и закономерностей. Выборки большого объема разбивают на интервалы. Количество интервалов зависит от объема выборки. Рекомендуемое число интервалов для выборок разного объема: таблица 3
Группировка по возрасту 100 рецидивистов, осужденных за грабеж и разбой: таблица 4
Здесь статистическое распределение задано в виде последовательности интервалов и соответствующих им частот. В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал. Вариационные ряды бывают дискретные и интервальные (непрерывные). Вариационный ряд называется дискретным, если в нем указаны конкретные значения варьируемого признака. Вариационный ряд называется интервальным (непрерывным), если предполагается, что варианты могут принимать любое значение в рамках указанных интервалов. При построении интервального ряда необходимо выбрать оптимальное число групп. Малое число групп снижает разнообразие значений признака, а большое число групп может исказить форму распределения случайными колебаниями частот. Длина интервала должна быть постоянной для всех групп.
|