Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Модуль 3 Математическая статистика ⇐ ПредыдущаяСтр 3 из 3
(Цылова Е. Г., Кротова Е. Л.ПГТУ, 2007) 11.21. Даны 5 наблюдений над случайной величиной скорости автомобилей на одном из участков шоссе (км/ч): . Требуется построить доверительный интервал для математического ожидания при , когда дисперсия - неизвестна. Как изменится доверительный интервал, если при тех же значениях средней скорости и выборочной дисперсии число наблюдений возрастет в 10 раз? Решение. Из условия известно, что . По имеющимся данным вычислим:
По таблице 4 приложения находим, что при и . Вычислим доверительный интервал: ;
Получили доверительный интервал для скорости, которую можно ожидать на данном участке шоссе. Если число наблюдений возрастет в 10 раз (), вновь воспользуемся той же формулой для построения интервала. По таблице 4 приложения находим, что . Тогда ; .
11.22 Социологические обследования дали следующие результаты. Из 1000 опрошенных людей 849 никогда не обращались за юридической консультацией, из них 649 занимаются предпринимательской деятельностью, а 200 работают на государственных предприятиях. И из 151 обращавшегося респондента 101 человек занимался предпринимательской деятельностью, а 50 – нет. По имеющимся данным: 1) построить таблицу сопряженности; 2) оценить условные и безусловные вероятности признаков; 3) оценить тесноту связи между признаками; 4) при уровне значимости проверить нулевую гипотезу о независимости исследуемых признаков; 5) изменится ли характер зависимости, если все данные увеличить в 25 раз? Решение. 1. Пусть признак A – человек занимается предпринимательской деятельностью; признак B – человек обращался за юридической консультацией. Тогда, согласно условию: и таблица сопряженности имеет вид
2. Вычислим оценки условных и безусловных вероятностей.
3. Тесноту связи между признаками оценим, вычислив эмпирический коэффициент корреляции событий . Так как полученное значение коэффициента мало, можно предположить, что зависимость между A и B практически отсутствует. 4. Найдем значение статистики
Из таблицы 3 приложения нашли при . Учитывая, что нулевая гипотеза принимается и делается вывод – обращение за юридической консультацией не зависит от того занимается ли человек своим бизнесом или работает на государственном предприятии. . 5. При увеличении данных в 25 раз опять подсчитаем статистику
Следовательно, нулевая гипотеза отвергается, что говорит о наличии связи между признаками, оценим тесноту связи: , Теснота связи между A и B остается прежней, ее значения не зависят от числа наблюдений. 11.23 Случайная величина - число лет, которые служащие проработали в торговой компании; - сколько отпусков за это время они брали в этой компании. Результаты наблюдений над случайными величинами и : приведены в следующей таблице:
Построить уравнения прямых регрессий по и по . Найти выборочный коэффициент линейной корреляции . Решение. Из условия находим: ; ; Воспользовавшись предложенными формулами, вычислим коэффициенты прямых регрессий по и по .
И по формулам построим уравнения прямых регрессий и выборочный коэффициент линейной корреляции. ;
. 11.24 При обработке наблюдений из 900 торговых точек за количеством проданных шампуней и соответствующих им лечебных бальзамов был найден выборочный коэффициент линейной корреляции . По имеющимся данным построить доверительный интервал для коэффициента линейной корреляции с доверительной вероятностью . Решение. По таблице приложения 2 находим для соответствующее значение . Согласно формуле доверительный интервал выглядит следующим образом: Следовательно, при заданной доверительной вероятности истинное значение может варьировать в пределах от 0, 777 до 0, 823 и зависимость между случайными величинами и сильная. 11.25 По выборке найден выборочный коэффициент линейной корреляции . При уровне значимости проверить нулевую гипотезу о равенстве нулю коэффициента линейной корреляции против . Решение. Известно, что , . Вычислим статистику : . Из таблицы приложения 4 находим, что при , значение критической точки распределения Стьюдента . Поскольку 4, 78> 1, 9799, то есть , то нулевая гипотеза отвергается, величины и зависимы, поскольку .
11.26. Даны выборочные варианты х1 и соответствующие им частоты ni количественного признака Х. а) найти выборочные среднюю дисперсию и среднеквадратическое отклонение. б) Считая, что количественный признак Х распределен по нормальному закону и что выборочная дисперсия равна генеральной дисперсии, найти доверительный интервал для оценки математического ожидания с надежностью γ =0, 99
Р ешение 1. Объем выборки n= Средняя выборочная: = Выборочная дисперсия: Dв= 2 – 2, где =23, 76 Средняя выборочная квадратов значений признака γ = Тогда Dв=598, 87-(23, 76)2=34, 33 Среднее квадратичное отклонение: σ в= σ в= 5, 86 пусть количественный признак Х генеральной совокупности распределен по нормальному закону, причем среднеквадратическое значение отклонение «σ» этого распределения известно. Тогда с вероятностью γ доверительный интервал заданный формулой ; ), покрывает неизвестное математическое ожидание. Здесь число t находится из соотношения 2Ф(t)=γ с помощью таблицы интегральной функции Лапласса. В данной задаче γ =0, 99, поэтому 2Ф(t)=0, 99, а Ф(t)=0, 495, по таблице находим t=2, 58. По условию задачи дисперсия генеральной совокупности D=Dв и, следовательно, σ =σ в=5, 86. ранее найдены значения n=118, и Хв=23, 76. Поэтому можно найти доверительный интервал: (23, 76-1, 39; 23, 76+1, 39) (22, 37; 25, 15). Ответ: Хв=23, 76; Dв=34, 33; σ в=5, 86; а (22, 37; 25, 15).
11.27. По данным корреляционной таблицы найти условные средние Yx и Xy. Оценить тесноту линейной связи между признаками X и Y и составить уравнение линейной регрессии Y по X и X по Y. Сделать чертеж, нанеся на него условные средние и найденные прямые регрессии. Оценить силу связи между признаками с помощью корреляционного отношения.
Найдем условные средние воспользовавшись формулами:
Ү x= Xy= Yx=5= Xy=35= Yx=10= Xy=45= Yx=15= Xy=55= Yx=20= Xy=65= Yx=25 Xy=75= Yx=30 Оценка тесноты линейной связи между признаками X и Y производится с помощью коэффициента линейной корреляции r: Коэффициент r может принимать значения от -1 до +1. Знак r указывает на вид связи: прямая или обратная. Абсолютная величина |r| на тесноту связи. При r> 0 связь прямая, то есть с ростом х растет у. При r< 0 связь обратная, то есть с ростом х убывает у. Для нахождения rвычислим указанные общие средние: х, у, ху, а также средние квадратические отклонения σ х и σ у. Вычисления удобно поместить в таблицах, куда вписываем также найденные ранее условные средние. Значение коэффициента линейной корреляции
С помощью таблиц находим общие средние, средние квадратов, среднюю произведения и среднеквадратические отклонения: Х= X2= 5 XY= Y= 57.5 Y2= σ x= = = σ y= = =9.94 Отсюда коэффициент корреляции равен: r= т.к r > 0, то связь прямая, то есть с ростом Х растет Y. т.к | r | > 0, 78 то линейная связь высокая. Находим линейное уравнение регрессии Y по X: Yx-57.5=0.78* Yx=1.52x+27.94 Аналогично находим уравнение регрессии X поY: Xy-19.45=0.78* Xy=0.4y-3.55 Данные уравнения устанавливают связь между признаками X и Y и позволяют найти среднее значение признака Yx для каждого значения x и аналогично среднее значение признака Xy для каждого значения y. Изобразим полученные результаты графически. Нанесем на график точки (х; ух) отметив их звездочками(). Нанесем на график точки (ху; у) отметив их кружочками (). Построим каждое из найденных уравнений регрессии по двум точкам:
Yx=1.52x+27.94
Xy=0.4y-3.55
Обе прямые регрессии пересекаются в точке (х; у). В нашей задаче это точки (19, 45; 57, 5). Оценка тесноты любой связи между признаками производится с помощью корреляционных отношений Y по X и X по Y: η ух= Дисперсия называемые внутригрупповыми, определены ранее. Величины называются межгрупповыми дисперсиями и вычисляются по формулам:
Они характеризуют разброс условных средних, от общей средней. В данной задаче: бх= бу= Тогда корреляционные отношения равны: η ух= η ху= Ответ: Корреляционная связь между признаками высокая ее можно описать уравнениями: Yx=1.52x+27.94, Xy=0.4y-3.55.
|