Постановка и проверка гипотез.

⇐ ПредыдущаяСтр 10 из 27Следующая ⇒

Это могут быть гипотезы о том, как распределены случайные величины (нормально, равномерно и т.п.), о равенстве средних значений, дисперсий и др. величин, а также о том, связаны ли случайные величины между собой (для социологов такая связь означала бы то, что выбранный респондентом вариант ответа на один из вопросов предполагает выбор определенного(ых) ответа(ов) на другой вопрос с большей вероятностью).

Сначала, перед проверкой, гипотезу надо сформулировать. Гипотеза – это не вопрос и не проблема, а утверждение. Не может быть гипотезы «Является ли распределение нормальным?». Гипотеза должна звучать либо «Распределение является нормальным», либо «Распределение нормальным не является». Для статистической проверки выбирают гипотезы, отражающие самую общую ситуацию: «величины независимы», «средние значения равны» и т.п., потому что при таких формулировках легче оценить, как бы выглядели данные в случае выполнения гипотезы.

Сформулировав гипотезу, обычно сразу формулируют еще одну гипотезу, альтернативную (противоположную) ей. Например, для гипотезы «Распределение является нормальным» альтернативной гипотезой является «Распределение нормальным не является». Ту гипотезу, которую мы проверяем, часто обозначают H₀, а альтернативную ей – H₁. Альтернативная гипотеза принимается, если приходится отвергнуть основную гипотезу H₀.

Итак, мы сформулировали гипотезы. Теперь требуется посмотреть, как бы выглядели наши данные, если бы гипотеза была верна. Естественно, мы проверяем гипотезу по всей популяции (например, «является ли распределение нормальным во всей Москве»). Но опросили мы не всех москвичей, а только небольшую выборку. Если в следующий раз мы проведем такой же эксперимент, но опросим других респондентов, то мы получим другие значения – ведь имеется статистический разброс. Этот разброс приводит к тому, что даже в случае верной гипотезы наши экспериментальные значения будут отличаться от значений, предсказанных теоретически в случае верной гипотезы. Например, если при сравнении средних значений в двух группах мы вычислим эти значения, то они, скорее всего не совпадут друг с другом с точностью до 10-го знака. Весь вопрос – можно ли объяснить наблюдаемое расхождение только статистическим разбросом, или есть что-то помимо разброса, обеспечивающее эту разность значений (во всей популяции).

Проверка осуществляется следующим образом. На основании экспериментальных данных вычисляется некоторая величина (обозначим ее А). Теперь предположим, что гипотеза, которую мы проверяем, верна и все обусловлено только статистикой. И будем мысленно проводить такие же социологические опросы, которые мы обрабатываем. В каждом из них мы будем получать свои результаты, на основании которых будет возможно вычислить ту же величину А. Понятно, что величины А будут в каждом случае различны. То есть, мы имеем некоторую случайную величину А, которая, как и все случайные величины, характеризуется своей функцией и плотностью распределения. Математики получили формулы для многих функций и плотностей распределения случайных величин, использующихся при проверки гипотез. По значению функции можно определить вероятность того, что в результате нашего эксперимента получится такое большое значение А (если гипотеза верна). Эта вероятность обозначается буквой p или α и называется уровнем значимости гипотезы. Величины уровней значимости для различных значений функции распределения приводятся в статистических таблицах, а также могут быть вычислены в Excel.

Поясним смысл коэффициента α. Предположим, мы получили α =0.03. Это означает, что если мы проведем 100 таких же экспериментов, то только в 3-х из них будут получаться значения функции А не менее данного. Если же α =0.5, то такие значения А будут наблюдаться в каждом втором эксперименте. Меньше нуля или больше 1 уровень значимости быть не может, поскольку это вероятность.

Осталось решить, принимать гипотезу или ее отвергнуть. Чаще всего решают заранее, какую вероятность считать критической (т.е. выбирают α _крит,) для того, чтобы гипотезу отвергнуть. Смысл: если экспериментальное α меньше критической, то получается, что мы при верной гипотезе наблюдали маловероятное событие, а это является поводом для того, чтобы отвергнуть гипотезу. Обычно α _крит выбирают α =0.05 (т.е. 5%) или α =0.01(т.е. 1%). Если α < α _крит, то гипотезу H_o отвергают.

Существует другой подход к проверке гипотезы. Выбрав α _крит, можно сразу по таблице определить критическое значение величины А. После этого осталось сравнить полученное по данным эксперимента значение А_эксп с ее критическим значением А_крит.. Если А_эксп> А_крит, то мы отвергаем основную гипотезу и принимаем альтернативную.

Все-таки, более точным является получение α, поскольку сама величина α имеет смысл: вероятность того, что верна основная гипотеза H_o. О том, какие распределения получаются в каких случаях, будет рассказано ниже в примерах проверки различных гипотез.

⇐ Предыдущая 5 6 7 8 91011 12 13 14 Следующая ⇒

Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2025 год. (0.007 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал