![]() Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Корреляционные и дисперсионные характеристики демонстрационных задач
№ 8.1 (линейная 0, 90 регрессия)
! 8.2 (гипербо- 0, 79 ппмеская регрессия) № 8.3 (линейная 0, 80 регрессия) № 8.4 (функция 0, 79 Кобба—Дугласа) № 8.5 (логариф- 0, 45 мическая квадратичная регрессия) Задача 9.1. Значение коэффициента корреляции свидетельствует о высокой степени линейной корреляции величин у и х. Достоверность расчета коэффициента корреляции высока. В силу линейности регрессии корреляционное отношение не дает дополнительной информации. Коэффициент детерминации показывает, что примерно 80 % изменений величины у вызвано соответствующими изменениями величины х. Остальные изменения, отражаемые выборкой, обусловлены действием неучтенных факторов. Несмещенная выборочная оценка зу стандартного отклонения величины у от линии регрессии составляет 1, 88, то есть находится в пределах 5—10% от значений величины у, получаемых из уравнения регрессии (сравните указанное значение зу со сглаженными значениями у, приведенными в последнем столбце гибл. 14). Задача 9.2. Здесь наглядно иллюстрируется ситуация, когда «большое» (по введенной выше градации) значение коэффициента корреляции не означает, что класс линейных функций адекватен сущности явления, рассматриваемого в задаче (см. рис. 6). Очень большое значение выборочного корреляционного отношения и малая погрешность его определения говорят о соответствии принятого класса уравнений регрессии (гиперболическая зависимость) выборочной информации. Это, однако, не должно создавать иллюзию, что возможно однозначное решение проблемы подбора сглаживающей зависимости только на основе корреляционного анализа. Суть остающейся неопределенности можно выразить, например, следующим образом: если потребителя результатов устраивает степень корреляции у и х порядка 0, 8 («в среднем» — в рассматриваемых диапазонах их значений), то он «имеет право» воспользоваться не гиперболической, а более простой с вычислительной точки зрения линейной регрессией, пренебрегая тем, что она неадекватна сущности анализируемого явления. Задача 9.3. Выборочная оценка коэффициента корреляции свидетельствует о приемлемости линейной регрессии. Оценка коэффициента детерминации В показывает, что изменения рассматриваемых производственных факторов — площадей кормовых угодий, стоимости животноводческих построек, площади смытых земель — определяют 63 % изменений плотности поголовья коров на 100 га сельскохозяйственных угодий. Остальные 37 % вариации у обусловлены действием неучтенных факторов. Задача 9.4. Значение коэффициента множественной корреляции велико. Поэтому в принципе можно было бы воспользоваться линейной регрессией. Кроме того, тот факт, что значение корреляционного отношения (Л = 0, 77) меньше значения коэффициента множественной корреляции (0, 79), а также невысокая достоверность расчета корреляционного отношения свидетельствуют о том, что в данной задаче функция Кобба—Дугласа менее приемлема, чем линейная зависимость. Задача 9.5. Невысокое выборочное значение коэффициента корреляции и слабая достоверность его расчета говорят о том, что линейная регрессия в данной задаче была бы неприемлема. Исходная гипотеза о приемлемости логарифмической квадратичной регрессии подтверждается оценкой корреляционного отношения и погрешности его определения. Большое значение коэффициента детерминации свидетельствует о превалирующей роли изменения расстояния х от лесополосы в изменении прибавки урожая у (в рассматриваемых границах значений х). В то же время следует учесть, что на границах рассматриваемого диапазона значений стандартное отклонение у от линии регрессии у(х) может достигать почти 20 % (ср. последний столбец табл. 24 со значением зу для задачи 8.5 в табл. 25). Контрольные вопросы и задания 1. Что характеризует коэффициент корреляции? 2. Запишите выражение для расчета выборочного значения коэффициента парной корреляции. 3. Каков диапазон возможных значений коэффициента парной корреляции? Что характеризуют различные уровни значений модуля коэффициента парной корреляции? Чему соответствуют положительные и отрицательные значения коэффициента парной корреляции? 4. Что такое коэффициент множественной корреляции? Приведите общее выражение для расчета этого коэффициента. Каков диапазон его возможных значений? 5. К чему сводится выражение для расчета коэффициента множественной корреляции, если число производственных факторов равно одному? двум? 6. Дайте определение корреляционного отношения. Что оно характеризует? В чем заключается его отличие от коэффициента корреляции? 7. Приведите формулу связи между корреляционным соотношением и коэффициентами корреляции для случая линейной регрессии. 8. Как вы объясните утверждение: «Выборочные значения коэффициентов корреляции имеют статистический характер»? 9. Приведите формулы для расчета среднеквадратической ошибки определения выборочного значения парной и множественной корреляций при различных объемах выборки.
10. Что такое «правило трех сигм»? 11. Приведите формулу расчета параметров доверительного интервала для коэффициента корреляции /о из генеральной совокупности при больших объемах нмборки. Какое допущение лежит в основе этой формулы? 12. Приведите формулу расчета параметров доверительного интервала для коэффициента корреляции г0 из генеральной совокупности при больших объемах выборки. Какую роль играет при получении этой формулы статистика 2 Р. Фишера? 13. Как можно проверить достоверность гипотезы: «Коэффициент корреляции 1п генеральной совокупности с доверительной вероятностью р не отличается значимо от нуля»? 14. В чем состоит смысл задачи оценки значимости представления производственной функции, полученной по результатам выборочных наблюдений? 15. Опишите качественно процедуру совместного анализа корреляционного отношения и коэффициента множественной корреляции при оценке допустимости использования линейной регрессии или регрессии другого вида. 16. Какими показателями характеризуется степень влияния производственных факторов на результативный показатель? 17. Как определяются дисперсии: отклонений сглаженных значений результативного показателя от среднего наблюдаемого значения; отклонений наблюдаемых значений результативного показателя от линии регрессии? 18. Дайте определение коэффициента детерминации. Что он характеризует? 19. Как коэффициент детерминации связан с корреляционным отношением и коэффициентом множественной корреляции в случае линейной регрессии? 20. Приведите формулу для расчета доверительных границ зависимости у(х) для случая однофакторной линейной регрессии. 21. Как вы понимаете задачу оценки достаточности числа наблюдений? 22. Каким должен быть минимальный объем выборки Ж в зависимости от количества производственных факторов А/? Можно ли определить достаточный объем выборки независимо от оцениваемой характеристики случайной величины? 23. Приведите формулы для расчета необходимого объема выборки, если оценивается среднее значение наблюдаемой случайной величины. 24. Проведите качественный анализ результатов из таблицы 25. Попытайтесь на основании представленных в этой таблице данных применительно к задачам 8.1, К.2, 8.4, 8.5 ответить на следующие вопросы: допустимо ли использование линейной регрессии для описания статистической информации, приведенной в задаче в качестве исходных данных? Является ли правильным выбор класса функций при построении регрессии для данной задачи? Насколько (количественно!) существенно влияние неучтенных факторов на результативный показатель в данной задаче? Какова (в %) несмещенная оценка стандартного отклонения результативного показателя от линии регрессии (при ответе на этот вопрос следует воспользоваться помимо таблицы 25 данными, представленными в последних столбцах табл. 14, 17, 23, 24)?
|