Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Непараметрические ⇐ ПредыдущаяСтр 9 из 9
Главным параметрическим методом является корреляционный. Он заключается в нахождении уравнения связи, в котором результативный признак зависит только от интересующего нас фактора (или нескольких факторов). Все прочие факторы, также влияющие на результат, принимаются за постоянные средние.
Удобной формой изучения связи является корреляционная таблица. В этой таблице одни признаки располагаются по строкам, а другие – в колонках. Числа, стоящие на пересечении строк и колонок, показывают, сколько раз встречается данное значение факторного признака с данным значением результативного. Рассмотрим следующую схему:
По такой таблице можно сделать выводы (1) о том, существует ли связь, (2) о ее направлении и (3) о ее интенсивности (при условии существования связи).
В указанных уравнениях величина результативного признака представляет собой функцию только одного фактора х. Все прочие факторы приняты за постоянную и выражены параметром а0. Таким образом, при выравнивании фактические значения у заменяются значениями, вычисленными по уравнению. Поскольку все факторы, определяющие у, являются постоянными средними величинами, постольку и выровненные значения (ух) являются средними величинами ().
Параметры а1 (а в уравнении параболы и а2) называются коэффициентами регрессии. В корреляционном анализе эти параметры показывают меру, в которой изменяется у при изменении х на одну единицу. При линейной зависимости коэффициент регрессии а1 называется также коэффициентом пропорциональности. Он положителен при прямой зависимости, отрицателен – при обратной. Параметр же а0 показывает влияние на результативный фактор множества неучтенных факторов.
Уравнение регрессии имеет большую ценность, поскольку позволяют экстраполировать показатели связи за пределы исследованных данных. Корреляционное отношение для выровненных значений результативного признака рассчитывается так же, как и для значений, полученных на основе группировок.
В этом случае вся вариация результативного признака за счет всех факторов обозначается
Вариация результативного признака за счет всех факторов, кроме х, равна
Вариация за счет интересующего нас фактора х равна разности
Дисперсия, характеризующая величину вариации за счет фактора х, может быть рассчитана непосредственно как
Отсюда
Данное корреляционное отношение применяется во всех случаях изучения связи для оценки ее тесноты независимо от формы связи (прямолинейной или криволинейной). Для прямолинейной связи может быть преобразовано в специальный линейный коэффициент корреляции
Значение его колеблется от –1 до +1. Знак говорит о направлении, а величина – о тесноте связи.
Выборочный метод
Основы выборочного метода Выборочное наблюдение – одно из наиболее современных видов статистического наблюдения. Выборочное наблюдение – это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных, для того чтобы охарактеризовать всю совокупность в целом. Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или репрезентатировать соответствующие показатели совокупности в целом.
Логика выборочного наблюдения (1) определение объекта и целей выборочного наблюдения; (2) выбор схема отбора единиц для наблюдения; (3) расчет объема выборки; (4) проведение случайного отбора установленного числа единиц из генеральной совокупности; (5) наблюдение отобранных единиц по установленной программе; (6) расчет выборочных характеристик в соответствии с программой выборочного наблюдения; (7) определение ошибки, ее размера; (8) распространение выборочных данных на генеральную совокупность; (9) анализ полученных данных. Основные преимущества (1) Выборочное наблюдение можно осуществить по более широкой программе. (2) Выборочное наблюдение более дешевое с точки зрения затрат на его проведение. (3) Выборочное наблюдение можно организовать тогда и в тех случаях, когда отчетностью мы воспользоваться не можем. Основные недостатки (1) Полученные данные всегда содержат в себе ошибку, о результатах наблюдения можно судить лишь с определенной степенью достоверности. Но по сравнению с другими видами наблюдения это достоинство выборочного метода. (2) Для его проведения требуются квалифицированные кадры.
Вся совокупность единиц, из которых производится отбор, называется генеральной. Совокупность единиц отобранных называется выборочной.
Для генеральной совокупности –
Для выборочной совокупности –
Обычно частота обозначается как, а относительная численность единиц выборочной совокупности, обладающая данным признаком, называется частостью –. Если численность единиц выборочной совокупности обозначить через, то получим:
Ошибки выборки Чтобы оценить степень точности выборочного наблюдения, необходимо оценить величину ошибок, которые могут возникнуть в процессе проведения выборочного наблюдения.
Средняя ошибка выборки Мерой колеблемости возможных значений выборочной средней является средний квадрат отклонений вариантов выборочной средней от генеральной, взвешенной по их вероятностям, т.е. дисперсия выборочной средней.
Отсюда видно, что средняя ошибка выборки прямо пропорциональна среднему квадратическому отклонению и обратно пропорциональна квадратному корню из численности выборки.
Если выборка используется для определения доли признака, то средняя ошибка выборки определяется по следующей формуле:
Когда значение и значение неизвестны, то значение принимается равным.
Предельная ошибка выборки Средняя ошибка выборки используется для определения возможных отклонений показателей выборочной совокупности от соответствующих показателей генеральной совокупности. С определенной вероятностью можно утверждать, что эти отклонения не превысят заданной величины, которая называется предельной ошибкой выборки.
Предельная ошибка связана со следующим равенством:
– коэффициент, зависящий от вероятности, с которой можно гарантировать определенные размеры предельной ошибки выборки. Применительно к выборочному методу из теоремы Черышева следует, что с увеличением значений величина вероятности быстро приближается к единице.
В связи с этим, увеличивая численность выборки, можно отклонение выборочной средней от генеральной довести до сколь угодно малых размеров, причем это результат можно гарантировать с вероятностью сколь угодно близкой к единице. Основные виды выборки, способы отбора Какой бы способ отбора мы не применяли, на последнем этапе в любом случае надо обеспечить случайную выборку, для того чтобы уменьшить размер выборки. Вид выборки определятся способом отбора единиц, подвергающихся наблюдению. Выборочная совокупность может быть образована либо путем последовательного отбора единиц, либо путем последовательного отбора групп. Если перед отбором совокупность разбивается на отдельные группы, из которых затем производится индивидуальный отбор, то такая выборка называется типической, районированной, стратифицированной. Если отбирают целые серии и в них проводится сплошное наблюдение, то такая выборка называется серийной, или гнездовой. Выборка в любом из указанных видов может быть осуществлена путем повторного или бесповторного отбора. Повторный – это такой отбор, при котором каждая единица или серия участвует в отборе столько раз, сколько отбирают единиц или серий. При бесповторном отборе отобранная единица больше не участвует в отборе. Случайность отбора обеспечивается следующими механизмами: (1) путем жеребьевки; (2) путем механической выборки (все единицы совокупности располагаются в определенном порядке, а затем в зависимости от численности выборки отбираются определенные единицы); (3) с помощью таблицы случайных чисел. В зависимости от процедуры отбора расчет предельной ошибки выборки имеет определенную модификацию.
Примеры задач
Пример 1. Найти среднюю и с вероятностью 0, 954 – предельную ошибку среднего бала, если дисперсия успеваемости равна 0, 56, а обследованию подвергнуто 100 студентов. Что произойдет с ошибкой среднего балла, если обследовать 400 студентов? – Ошибка уменьшится в два раза. Это значит, что ошибку 0, 06 можно будет гарантировать с вероятностью 0, 954.
Пример 2. Какую ошибку доли отобранных деталей можно ожидать с вероятностью 0, 9, если дисперсия равна 0, 09, а обследованию подвергнуто 400 деталей?
Численность выборки Из формулы предельной ошибки выборки формула для расчета численности выборки:
Пример 3. Сколько изделий необходимо отобрать для исчисления процента бракованных с ошибкой не более 2 % при вероятности 0, 954, если вариация изучаемого признака максимальная.
Пример 4. Какое количество станков надо обследовать, чтобы ошибка среднего срока службы не превышала 1 год с вероятностью 0, 997, если дисперсия срока службы станка равна 25 годам.
Повторный групповой отбор В зависимости от того, отбираются ли единицы или же группы, различают индивидуальный или групповой отбор. При повторном групповом отборе (повторный индивидуальный мы уже рассмотрели) предельная ошибка выборки равна:
Пример 5. По данным выборочного обследования средняя удойность коров на 400 обследованных фермах составила 2200 литров в год. Найти ошибку удойности с вероятностью 0, 954, если коэффициент вариации удойности коров между фермами равен 10 %.
Пример 6. Сколько учебных групп необходимо обследовать, чтобы ошибка среднего балла успеваемости по интересующей нас дисциплине не превышала 0, 2 с вероятностью 0, 954, если дисперсия оценок между группами равна 0, 1.
Многоступенчатый отбор Ошибка многоступенчатого отбора в общем виде может быть представлена следующей формулой:
Для комбинационного отбора предельная ошибка выборки равна:
Пример 7. В результате комбинационной выборки оказалось, что средний процент выполнения норм выработки равен 135 %. Дисперсия признака между предприятиями равна 60, а в среднем для отдельных предприятий – 400. Рассчитать ошибку среднего процента выполнения норм с вероятностью 0, 954, если на первой ступени отобрано 100 предприятий, а на второй – 1000 рабочих данной профессии.
Бесповторный отбор При бесповторном отборе в формулу вносим коэффициент:
Соответствующим образом модифицируем формулу для численности (при бесповторном отборе):
Определение границ изменения генеральной средней Пример 8. В результате выборочного наблюдения затраты времени на оформление финансовых документов мы поместили в таблицу.
Определить границы затрат времени на оформление финансовых документов с вероятностью 0, 997.
Таким образом, с вероятностью 0, 997 можно утверждать, что время, затраченное на оформление одного финансового документа, равно Используются технологии uCoz
|