![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Оценка достоверности статистических величин.
Любое подмножество объектов генеральной совокупности называют выборочной совокупностью, или выборкой. Суть выборки состоит в том, что она, являясь частью генеральной совокупности, в определенной мере может характеризовать саму генеральную совокупность, т. е., обследуя часть объектов, можно сделать выводы обо всем их множестве. Как правило, генеральная совокупность имеет достаточно большое, а в идеале и бесконечное, количество элементов. Понятно, что чем больше объем выборки, тем лучше она представляет генеральную совокупность. Однако обследование больших выборок или проведение сплошных обследований зачастую просто невозможно или экономически нецелесообразно. Реально на практике репрезентативность (представительность, типичность) выборки обеспечивается способом отбора значений. Отбор должен гарантировать каждому возможному значению равные шансы быть выбранным, и тогда появление или не появление конкретного значения определяется его частотой в генеральной совокупности, т. е. вероятностью появления тех или иных значений. Вероятность случайного события А — это отношение количества элементарных событий, благоприятствующих А к общему количеству элементарных событий. Оценка достоверности результатов исследования базируется на теоретических основах вероятности. Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность. В большинстве медицинских исследований врачу приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом — на генеральную совокупность. Таким образом, оценка достоверности необходима для того, чтобы по части явления можно было бы судить о явлении в целом, о его закономерностях. Как бы тщательно ни производилась выборка, какой репрезентативной ни была бы выборочная совокупность (отобранная часть наблюдений), она неизбежно в какой-то мере будет отличаться от генеральной (общей, исчерпывающей) совокупности. Однако в нашем распоряжении имеются методы определения степени различий числовых характеристик обеих совокупностей и пределов возможных колебаний выборочных показателей при данном числе наблюдений. Как будет видно из последующего, число наблюдений играет при этом значительную роль: чем оно больше, тем точнее отображаются в выборке свойства генеральной совокупности и тем меньше размеры ошибки выборочных показателей. Теория выборочного метода, наряду с обеспечением репрезентативности выборочных показателей, практически сводится к оценке расхождений между числовыми характеристиками генеральной и выборочной совокупностей, т. е. к определениюсредних ошибок (ошибок репрезентативности). Эти ошибки неизбежны, так как они проистекают из сущности выборочного исследования. Генеральная совокупность может быть охарактеризована по выборочной совокупности только с некоторой погрешностью, измеряемой ошибкой репрезентативности. Ошибки репрезентативности нельзя смешивать с обычным представлением об ошибках — методических, точности измерения, арифметических и др. По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генеральной совокупности. Это единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Выборочный метод и оценка достоверности относительных и средних величин (средние ошибки) Как уже отмечалось, под выборочным методом в статистике понимается такой метод наблюдения, при котором для определения типичных черт какой-либо совокупности изучаются не все единицы этой совокупности, а лишь их часть. Как бы тщательно ни производилась выборка, какой бы репрезентативной ни была выборочная совокупность (отобранная часть наблюдений), она неизбежно будет отличаться от всей генеральной (общей, исчерпывающей) совокупности. Таким образом, полного тождества результатов достичь не удается, и неизбежно остается некоторая неточность. Однако в нашем распоряжении имеются методы установления степени различий числовых характеристик обеих совокупностей и пределов возможных колебаний показателей при данном числе наблюдений. Как будет видно из последующего, значительную роль играет число наблюдений: чем больше число наблюдений, тем точнее отображается генеральная совокупность и тем меньше ошибка. Так называемые средние ошибки являются мерой точности и достоверности любых статистических величин. Теория выборочного метода, наряду с обеспечением репрезентативности, практически сводится к оценке расхождений между числовыми характеристиками генеральной и выборочной совокупности, т. е. к определению средних ошибок и так называемых доверительных границ или интервалов. Средняя ошибка позволяет установить тот интервал, в котором заключено действительное значение производной величины при данном числе наблюдений, т. е. средняя ошибка всегда является конкретной. На размеры средней ошибки влияет не только число наблюдений, но и степень колеблемости, изменчивости признаков. Чем изменчивее изучаемое явление, тем больше будет его ошибка. Это видно из формулы, по которой определяется средняя ошибка средней величины, обозначаемая буквой m. Она вычисляется, по формуле:
Между размерами сигмы (отражающей колеблемость явления) и размерами средней ошибки существует прямая связь. Между числом наблюдений и размерами средней ошибки существует обратная связь (пропорциональная не числу наблюдений, а квадратному корню из этого числа). Если вычислить среднюю ошибку для вариационного ряда, приведенного в табл. 9, где М = 62, 0; N = 36; s = 1, 8, то получим:
Определяя для средней арифметической (или относительной) величины два крайних значения (минимально возможное и максимально возможное), находят пределы, в которых может быть искомая величина генерального параметра. Эти пределы называютдоверительными границами. Доверительные границы — границы средних (или относительных) величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность. Доверительные границы средней арифметической в генеральной совокупности определяют по формуле:
М ген = M выб ± tmм.
Доверительные границы относительной величины в генеральной совокупности определяют по формуле:
Р ген = P выб ± tmp,
где М ген и Р ген — значения средней и относительной величин, полученных для генеральной совокупности; M выб и Р выб — значения средней и относительной величин, полученных для выборочной совокупности; mм и тр — ошибки репрезентативности выборочных величин; t — доверительный критерий. При определении доверительных границ сначала надо решить вопрос о том, с какой степенью вероятности безошибочного прогноза необходимо представить доверительные границы средней или относительной величины. Для большинства медико-биологических и медико-социальных исследований достаточна вероятность безошибочного прогноза р = 95 % и более. Избрав такую степень вероятности, соответственно находят величину доверительного критерия по специальной таблице. Таким образом, доверительный критерий t устанавливается заранее, при планировании исследования. Доверительные границы средней величины, вычисленные исходя из доверительной вероятности 0, 95, составляют М ± 2т. Это означает, что в 95 из 100 аналогичных выборок значение М будет находиться в указанных пределах (или на 95 % случаев гарантируется нахождение в этих пределах генеральной средней). При необходимости получения более надежных гарантий доверительности выборочного показателя используется доверительная вероятность 0, 99 (99 %), которой соответствует коэффициент t = 2, 6. Утроенная средняя ошибка (t = 3) соответствует доверительной вероятности 0, 997 (99, 7 %). Для получения наиболее высокой надежности результатов исследования прибегают к вероятности 0, 999 (99, 9 %), соответствующей значению t = 3, 3. Доверительный интервал. Чем выше требования к доверительной вероятности (соответствие выборочной средней генеральной средней), тем шире должен быть обеспечивающий такую вероятность интервал, называемый доверительным интервалом. Необходимость в определении доверительного интервала возникает при желании по материалам выборочного исследования (например, распространенность кариеса в двух дошкольных учреждениях) дать прогноз о распространенности изучаемого явления (кариеса) среди всех детей, посещающих дошкольные учреждения. Интуитивно понятно, что если исследования будут продолжены дальше, то значение определяемого показателя несколько изменится в большую или меньшую сторону. Границы доверительного интервала как раз и показывают, в какой степени может измениться значение определяемого нами показателя с принятой нами вероятностью ошибки. При небольшом числе наблюдений для вычисления доверительных границ с указанными доверительными вероятностями (0, 95; 0, 99 и 0, 999) значение коэффициента t находят по специальной таблице Стьюдента. Очевидно, что в реальных исследованиях желательно иметь как можно меньший доверительный интервал при достаточно высокой доверительной вероятности.
|