Студопедия

Главная страница Случайная страница

КАТЕГОРИИ:

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Багатофакторна регресія






 

У реальній дійсності всі економічні процеси взаємопов’язані і часто потрібно визначити ступінь такого зв'язку і вплив на майбутні періоди. Тобто прогнозування повинно йти з урахуванням впливу найбільше істотних факторів. Природно, що для такого прогнозування потрібний більш великий статистичний матеріал. Наприклад, комерційний агент, займаючись підготовкою офісних будинків ділового району для продажу, намагається прогнозувати ціну будинку в залежності від його площі, кількості офісів, входів, часу експлуатації. Відомі дані по 11 будинках приведені в таблиці:

N Площа (Х1) Офіси (Х2) Входи (Х3) Термін (Х4) Ціна (У)
           
           
      1, 5    
           
           
           
      1, 5    
           
           
           
           

“Пів-входу” означає вхід тільки для доставки кореспонденції.

 

Стартовою точкою для подальшого аналізу і добору підхожої статистичної моделі є оцінка середнього, стандартних помилок, довірчого рівня і т.д., що можна одержати за допомогою методів описової статистики пакета Exсel.

Показники Площа Офіси Входи Термін Ціна
           
Середнє 2425, 00 2, 64 2, 36 37, 91 149545, 45
Стандартна помилка 23, 00 0, 24 0, 23 7, 39 3991, 73
Медіана 2425, 00 2, 00 2, 00 33, 00 149000, 00
Мода #Н/Д 2, 00 2, 00 23, 00 142000, 00
Стандартне відхилення 76, 28 0, 81 0, 78 24, 51 13239, 06
Дисперсія вибірки 5819, 00 0, 65 0, 60 600, 69 175272727, 27
Ексцес -1, 20 -0, 76 0, 28 3, 34 -0, 31
Асиметр. 0, 00 0, 85 0, 94 1, 68 0, 10
Інтервал 230, 00 2, 00 2, 50 87, 00 43000, 00
Мінімум 2310, 00 2, 00 1, 50 12, 00 126000, 00
Максимум 2540, 00 4, 00 4, 00 99, 00 169000, 00
Сума 26675, 00 29, 00 26, 00 417, 00 1645000, 00
Рахунок 11, 00 11, 00 11, 00 11, 00 11, 00
Рів. надійності (95%) 45, 08 0, 48 0, 46 14, 48 7823, 63

 

Далі виконують оцінку наявності зв'язків між змінюваною ознакою і шляхом побудови кореляційної моделі, що впливає. Можна використовувати функцію КОРРЕЛ або метод Кореляция з надбудови Анализ данных пункту меню Сервис (пакет Exсel).

Кореляція
  Площа Офіси Входи Термін Ціна
Площа          
Офіси 0, 223607        
Входи 0, 620453 0, 310714406      
Термін 0, 221437 -0, 0522657 -0, 05    
Ціна 0, 318841 0, 879305911 0, 5083 -0, 443316  

 

Найбільш тісний зв'язок між ціною і кількістю розміщуваних у будинку офісів, кількістю наявних входів і найменший - із площею. Оскільки в поставленій задачі факторів не так багато і усі вони мають зв'язок із залежним показником, то усі вони мають бути включені в модель.

Напрямок і розмір асоційованості наборів даних визначають за допомогою функції КОВАР або методу Ковариация з надбудови Анализ данных пакета.

Коваріація
  Площа Офіси Входи Термін Ціна
Площа          
Офіси 12, 54545 0, 595041322      
Входи 33, 45455 0, 17768595 0, 5496    
Термін 376, 3636 -0, 94214876 -0, 88 546, 0826446  
Ціна 292727, 3 8561, 983471 4756, 2 -130768, 6  

 

Залежний параметр Ціна має позитивну коваріацію з усіма наборами незалежних факторів, крім Терміна. Тобто великим значенням площі, кількості офісів і входів відповідають великі значення ціни, а для великих значень термінів - менші значення ціни.

У такий спосіб приведений приклад являє собою багатофакторну модель.

Звичайно прогноз розробляється в декількох варіантах, кожний із яких можливий з деякою ймовірністю. Придатність прогнозу визначається шляхом зіставлення фактичної динаміки з динамікою, отриманої за прогнозом. Наприклад, у пакеті Exсel виконати прогноз з урахуванням ряду факторів можна за допомогою функцій Тенденция (для лінійної і поліномиальної залежностей) і Рост (для экспоненціальної залежності), а також за допомогою методу Регрессия з надбудови Анализ данных. Результати прогнозу по усім вище зазначеним функціям і методам зведені в таблицю 1. Крім того, при прогнозуванні за допомогою методу Регрессия користувачу видається таблиця дисперсійного аналізу, коефіцієнти регресійного рівняння, стандартні помилки обчислення і коефіцієнтів, по яких можна бачити достовірність прогнозу, число використовуваних ступенів свободи і розрахункові критерії для оцінки прогнозних результатів (F - і t - критерії).

ВИСНОВОК РЕЗУЛЬТАТІВ
   
Регресіоная статистика
Множинний R 1, 00
R-квадрат 1, 00
Нормований R-квадрат 0, 99
Стандартна помилка 954, 25
Спостереження 11, 00
   

Коефіцієнт детермінованості R-квадрат указує на сильну залежність між незалежними перемінними і продажною ціною. Проте це ще не гарантує не випадковість результату. Необхідна перевірка по критеріях, що можна одержати з такої таблиці (видається ПК):

 

ANOVA          
  ступеня свободи Регрес. сума квадратів MS F-статистика Значимість F
Регресія 4, 00 1747263697, 28 436815924, 32 479, 70 0, 00
Залишок 6, 00 5463575, 44 910595, 91    
Разом 10, 00 1752727272, 73      
           
  Коефіцієнти Стандартна помилка t-статистика P-Значення  
Y-перетинання 58695, 61 12031, 51 4, 88 0, 00  
Площа 24, 64 5, 34 4, 62 0, 00  
Офіси 12704, 67 393, 34 32, 30 0, 00  
Входи 2679, 80 521, 74 5, 14 0, 00  
Термін -230, 23 13, 04 -17, 65 0, 00  

 

  Нижні 95% Верхні 95% Нижні 95. 000% Верхні 95. 000%
Y-перетинання 29255, 56 88135, 67 29255, 5576 88135, 6696
Площа 11, 58 37, 70 11, 5772 37, 7007
Офіси 11742, 21 13667, 13 11742, 2071 13667, 1302
Входи 1403, 14 3956, 46 1403, 1434 3956, 4600
Термін -262, 15 -198, 31 -262, 1494 -198, 3103

 

Розрахунковий розмір F= 479, 7, а F-критичне вибирається з будь-якого довідника по математичній статистиці. При можливості достовірного результату 95%, і числі ступенів свободи v1=4 і v2=6 Fкр=4, 53. Розрахунковий розмір F помітно більший, чим табличний, що говорить про те, що отримане регресійне рівняння корисно для передрікання оцінної вартості будинків у даному районі.

Інший критерій (t-статистика), що є в регресійній статистиці, дозволяє оцінити корисність кожного з незалежних факторів для прогнозування ціни. Наприклад, для терміна експлуатації t=-17, 65, а t-критичне при достовірності прогнозу 95% і з 6 ступенями свободи дорівнює 1.94. Оскільки абсолютний розмір t.> tкр, то термін експлуатації важлива перемінна для оцінки вартості будинку під офіс. Аналогічно можна протестувати всі інші перемінні на статистичну значимість. Якщо t для цих перемінних більше, чим 1.94, значить усі вони корисні для прогнозування. Регресійна модель записується з використанням обчислених коефіцієнтів у такий спосіб:

У = 24, 64Х1 + 12704, 67Х2 + 2679, 8Х3 – 230, 23Х4 + 58695, 61

Метод Регресія відразу виводить таблицю розрахункових цін по всіх наявних об'єктах і відхилення від фактичних.

ВИСНОВОК ЗАЛИШКУ
Будинок Прогноз Залишки Стандартні залишки
  141775, 92 224, 08 0, 23
  144184, 45 -184, 45 -0, 19
  151281, 09 -281, 09 -0, 29
  150885, 39 114, 61 0, 12
  139124, 92 -124, 92 -0, 13
  169328, 05 -328, 05 -0, 34
  125648, 04 351, 96 0, 37
  142519, 57 -519, 57 -0, 54
  161003, 27 1996, 73 2, 09
  169587, 08 -587, 08 -0, 62
  149662, 22 -662, 22 -0, 69

 

Висновок можливості

Персентиль Ціна
4, 55 126000, 00
13, 64 139000, 00
22, 73 142000, 00
31, 82 142000, 00
40, 91 144000, 00
50, 00 149000, 00
59, 09 151000, 00
68, 18 151000, 00
77, 27 163000, 00
86, 36 169000, 00
95, 45 169000, 00

Разом із розрахунковими розмірами прогнозованого параметра і їхніх оцінних характеристик можна одержати цілий ряд графіків, що наочно подають взаємозв'язок залежного розміру з кожним фактором окремо, а також графіки залишків по кожному фактору.

Використання різних методів прогнозування, супроводжувальний графічний матеріал повинні послужити основою для обґрунтування спеціалістом своїх висновків.

 


Поделиться с друзьями:

mylektsii.su - Мои Лекции - 2015-2024 год. (0.008 сек.)Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав Пожаловаться на материал