Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Приклад 1. Лінійна парна регресія
Маємо дані щодо річної продуктивності праці в розрахунку на одного робітника та енергомісткості праці на підприємствах певної галузі. Між цими показниками існує певна залежність. Потрібно перевірити, чи лінійною є залежність між даними показниками, побудувати модель лінійної парної регресії, яка б характеризувала дану залежність; виконати перевірку статистичної значимості оцінок параметрів, знайдених за методом найменших квадратів, та знайти інтервали довіри для параметрів , ; знайти коефіцієнти кореляції та детермінації, за допомогою знайдених коефіцієнтів описати вплив розглядуваного фактору на результат; виконати перевірку моделі на адекватність; знайти інтервальні прогнози для будь-якого значення незалежної змінної. Таблиця 3.1. Вихідні дані задачі
Розв’язання Очевидно, що річна продуктивність праці галузі в розрахунку на одного робітника залежить від енергомісткості праці. Кожну пару спостережень за змінними та можна зобразити у двовимірній системі координат:
Рис. 3.1. Кореляційне поле точок Аналіз зображеної множини точок дозволяє зробити висновок про наявність лінійного зв’язку між енергомісткістю та продуктивністю праці, тобто для характеристики даної залежності варто обрати лінійну функцію. Отже, залежність між енергомісткістю та продуктивністю праці описується простою лінійною моделлю: де – річна продуктивність праці в розрахунку на одного робітника, тис. грн.; – енергомісткість праці, кВт/робітн.; – стохастична складова, яка вводиться до моделі з метою урахувати наявність впливу факторів, які не входять до моделі, – параметри моделі. Згідно з гіпотезою про лінійний зв’язок, через кореляційне поле точок можна провести принаймні кілька прямих ліній, які різняться коефіцієнтами та . Розрахункові значення продуктивності праці можна знайти з вибіркової моделі парної лінійної регресії: Оцінити параметри моделі та можна, використавши метод 1МНК (розрахунки в табл. 3.2.). , ; ; Таблиця 3.2. Розрахункові дані задачі
Модель лінійної парної регресії має вигляд: Оскільки вільний член , то величина продуктивності праці не є строго пропорційною до енергомісткості праці. Кількісна оцінка параметра показує, що граничне збільшення продуктивності праці при зростанні енергомісткості на 1 кВт/робітн. становить 1, 44 тис. грн. Виконаємо перевірку істотності або статистичної значимості оцінок параметрів моделі за допомогою t -критерію Стьюдента: ; ; ; ; Критичне значення критерію Ст’юдента для рівня значимості та ступенів вільності ( – кількість параметрів) знаходимо за допомогою таблиць –розподілу Ст’юдента (дод. А): . Оскільки, < , то оцінка вважається статистично значимою, тобто, зі ймовірністю 95% вплив рівня енергомісткості праці на продуктивність праці визнається істотним. < , то оцінка також вважається статистично значимою зі ймовірністю 95%. Довірчі межі коефіцієнта регресії зі ймовірністю 0, 95: або Довірчі межі вільного члена зі ймовірністю 0, 95: або Для оцінки щільності зв’язку обчислимо лінійний коефіцієнт кореляції Пірсона. Значення лінійного коефіцієнта кореляції 0, 98 близьке до одиниці, тому можна зробити висновок про досить тісний прямий ()зв’язок між енергомісткістю та продуктивністю праці. Коефіцієнт детермінації використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної: Або Постільки значення коефіцієнта детермінації близьке до одиниці, то можна вважати, що побудована модель адекватна. Виконаємо перевірку моделі на адекватність за – критерієм Фішера: Розраховуємо величину – критерію: Задаємо рівень значимості: . За статистичними таблицями – розподілу Фішера з ступенями вільності та рівнем значимості знаходимо критичне значення критерію: (дод. В). , то зі ймовірністю 0, 95 ми стверджуємо, що побудована нами модель є адекватною. Оскільки побудована модель виявилася адекватною, то ми можемо використовувати її для знаходження прогнозних значень результативної змінної. Нехай, , тоді точковий прогноз: Інтервал довіри при заданому рівні значимості для індивідуального значення : Зі ймовірністю 0, 95 при енергомісткості річна продуктивність праці в галузі буде не меншою за 15, 79 тис. грн. і не більшою 18, 95 тис. грн. Інтервал довіри для математичного сподівання : На рис. 3.1. зображено емпіричну лінію регресії, теоретичну лінію регресії та довірчу область прогнозних значень для базисних даних значень . Рис. 3.2. Лінійна парна регресія залежності річної продуктивності галузі від енергомісткості та довірча область базисних даних
|