![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Ошибки выборки при различных видах отбора
1. Собственно случайная и механическая выборка. Средняя ошибка собственно случайной и механической выборки находятся по формулам, представленным в табл. 11.1. Таблица 1 Формулы для расчета средней ошибки где s2¾ дисперсия признака в выборочной совокупности. Пример 2. Для изучения уровня фондоотдачи было проведено выборочное обследование 90 предприятий из 225 методом случайной повторной выборки, в результате которого получены данные, представленные в таблице. В рассматриваемом примере имеем 40%-ную выборку (90: 225 = 0, 4, или 40%). Определим ее предельную ошибку и границы для среднего значения признака в генеральной совокупности по шагам алгоритма: 1. По результатам выборочного обследования рассчитаем среднее значение и дисперсию в выборочной совокупности: Выборочная средняя Выборочная дисперсия изучаемого признака 2. Определяем среднюю ошибку повторной случайной выборки 3. Зададим вероятность, на уровне которой будем говорить о величине предельной ошибки выборки. Чаще всего она принимается равной 0, 999; 0, 997; 0, 954. Для наших данных определим предельную ошибку выборки, например, с вероятностью 0, 954. По таблице значений вероятности функции нормального распределения (см. выдержку из нее, приведенную в Приложении 1) находим величину коэффициента доверия t, соответствующего вероятности 0, 954. При вероятности 0, 954 коэффициент t равен 2. 4. Предельная ошибка выборки с вероятностью 0, 954 равна 5. Найдем доверительные границы для среднего значения уровня фондоотдачи в генеральной совокупности Таким образом, в 954 случаях из 1000 среднее значение фондоотдачи будет не выше 1, 88 руб. и не ниже 1, 74 руб. Выше была использована повторная схема случайного отбора. Посмотрим, изменятся ли результаты обследования, если предположить, что отбор осуществлялся по схеме бесповторного отбора. В этом случае расчет средней ошибки проводится по формуле Тогда при вероятности равной 0, 954 величина предельной ошибки выборки составит: Доверительные границы для среднего значения признака при бесповторном случайном отборе будут иметь следующие значения: Сравнив результаты двух схем отбора, можно сделать вывод о том, что применение бесповторной случайной выборки дает более точные результаты по сравнению с применением повторного отбора при одной и той же доверительной вероятности. При этом, чем больше объем выборки, тем существеннее сужаются границы значений средней при переходе от одной схемы отбора к другой. По данным примера определим, в каких границах находится доля предприятий с уровнем фондоотдачи, не превышающим значения 2, 0 руб., в генеральной совокупности: 1) рассчитаем выборочную долю. Количество предприятий в выборке с уровнем фондоотдачи, не превышающим значения 2, 0 руб., составляет 60 единиц. Тогда m = 60, n = 90, w = m/n = 60: 90 = 0, 667; 2) рассчитаем дисперсию доли в выборочной совокупности s w 2= w (1 - w) = 0, 667(1 - 0, 667) = 0, 222; 3) средняя ошибка выборки при использовании повторной схемы отбора составит Если предположить, что была использована бесповторная схема отбора, то средняя ошибка выборки с учетом поправки на конечность совокупности составит 4) зададим доверительную вероятность и определим предельную ошибку выборки. При значении вероятности Р = 0, 997 по таблице нормального распределения получаем значение для коэффициента доверия t = 3 (см. выдержку из нее, приведенную в Приложении 1): 5) установим границы для генеральной доли с вероятностью 0, 997: Таким образом, с вероятностью 0, 997 можно утверждать, что в генеральной совокупности доля предприятий с уровнем фондоотдачи, не превышающим значения 2, 0 руб., не меньше, чем 54, 7%, и не больше 78, 7%. 2. Типическая выборка. При типической выборке генеральная совокупность объектов разбита на k групп, тогда N 1 + N 2 + … + Ni + … + Nk = N. Объем извлекаемых из каждой типической группы единиц зависит от принятого способа отбора; их общее количество образует необходимый объем выборки n 1 + n 2 + … + ni + … + nk = n. Существуют следующие два способа организации отбора внутри типической группы: пропорциональной объему типических групп и пропорциональной степени колеблемости значений признака у единиц наблюдения в группах. Рассмотрим первый из них, как наиболее часто используемый. Отбор, пропорциональный объему типических групп, предполагает, что в каждой из них будет отобрано следующее число единиц совокупности: где ni ¾ количество извлекаемых единиц для выборки из i -й типической группы; n ¾ общий объем выборки; Ni ¾ количество единиц генеральной совокупности, составивших i -ю типическую группу; N ¾ общее количество единиц генеральной совокупности. Отбор единиц внутри групп происходит в виде случайной или механической выборки. Формулы для оценивания средней ошибки выборки для среднего и доли представлены в табл. 11.2. Таблица 2 Формулы для расчета средней ошибки выборки ( m ) при использовании типического отбора, пропорционального объему типических групп Здесь Пример 3. В одном из московских вузов проведено выборочное обследование студентов с целью определения показателя средней посещаемости вузовской библиотеки одним студентом за семестр. Для этого была использована 5%-ная бесповторная типическая выборка, типические группы которой соответствуют номеру курса. При отборе, пропорциональном объему типических групп, получены следующие данные: Число студентов, которое необходимо обследовать на каждом курсе, рассчитаем следующим образом: ¨ общий объем выборочной совокупности:
¨ количество единиц, отобранных из каждой типической группы: аналогично для других групп: п 2 = 31 (чел.); п 3 = 29 (чел.); п 4 = 18 (чел.); п 5 = 17 (чел.). Проведем необходимые расчеты. 1. Выборочная средняя, исходя из значений средних типических групп, составит: 2. Средняя из внутригрупповых дисперсий 3. Средняя ошибка выборки: С вероятностью 0, 954 находим предельную ошибку выборки: 4. Доверительные границы для среднего значения признака в генеральной совокупности: Таким образом, с вероятностью 0, 954 можно утверждать, что один студент за семестр посещает вузовскую библиотеку в среднем от семи до девяти раз. 3. Малая выборка. В связи с небольшим объемом выборочной совокупности те формулы для определения ошибок выборки, которые использовались нами ранее при «больших» выборках, становятся неподходящими и требуют корректировки. Среднюю ошибку малой выборки определяют по формуле Предельная ошибка малой выборки: Распределение значений выборочных средних всегда имеет нормальный закон распределения (или приближается к нему) при п > 100, независимо от характера распределения генеральной совокупности. Однако в случае малых выборок действует иной закон распределения ¾ распределение Стьюдента. В этом случае коэффициент доверия находится по таблице t -распределения Стьюдента в зависимости от величины доверительной вероятности Р и объема выборки п. В Приложении 1 приводится фрагмент таблицы t -распределения Стьюдента, представленной в виде зависимости доверительной вероятности от объема выборки и коэффициента доверия t. Пример 4. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8, 5; 8, 0; 7, 8; 9, 0; 7, 2; 6, 2; 8, 4; 6, 6. Оценим выборочные средние затраты времени и построим доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0, 95. 1. Среднее значение признака в выборке равно 2. Значение среднего квадратического отклонения составляет 3. Средняя ошибка выборки: 4. Значение коэффициента доверия t = 2, 365 для п = 8 и Р = 0, 95 (Приложение 1). 5. Предельная ошибка выборки: 6. Доверительный интервал для среднего значения признака в генеральной совокупности: То есть с вероятностью 0, 95 можно утверждать, что затраты времени студента на подготовку к контрольной работе находятся в пределах от 6, 9 до 8, 5 ч.
|