Главная страница Случайная страница КАТЕГОРИИ: АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника |
Краткие теоретические сведения. Ряд динамики, или временной ряд – последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления
Ряд динамики, или временной ряд – последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Каждое конкретное значение называется уровнем ряда. Интервальный динамический ряд характеризуется последовательностью, когда уровни ряда относятся к результату, накопленному или произведенному за определенный интервал времени (ряды объемов продукции по месяцам года, объемы перевозок за недели, месяцы или кварталы, экономические показатели предприятий по отдельным периодам и т.д.). Моментный динамический ряд характеризуется последовательностью, когда уровни ряда показывают фактическое наличие изучаемого явления на конкретный момент времени (ряды численности населения на начало года, величины запасов сырья на начало периода и т.д.). Комплексные ряды – отображают динамику совокупности нескольких разных показателей во времени. Цели анализа временных рядов направлены на определение природы ряда или его прогнозирование (предсказание будущих значений временного ряда по настоящим и прошлым значениям). Показатели, исчисляемые как отношение уровня ряда в данный момент или интервал времени к непосредственно предшествующему уровню, называются цепными. Цепные коэффициенты (темпы) роста равны: . Если для сравнения взят общий уровень, то такие показатели называются базисными. Базисные коэффициенты (темпы) роста равны: , где: – последовательность абсолютных уровней ряда. Абсолютный прирост – разность двух уровней ряда динамики. Цепной абсолютный прирост исчисляется как разность между сравниваемым уровнем и уровнем, который предшествует ему: . Базисный абсолютный прирост исчисляется как разность между сравниваемым уровнем и уровнем, принятым за постоянную базу сравнения : . Темп прироста – это абсолютный прирост в относительных величинах. Цепной темп прироста представляет собой отношение сравниваемого цепного абсолютного прироста к предшествующему уровню : . Базисный темп прироста – отношение сравниваемого базисного абсолютного прироста к уровню, принятому за постоянную базу : . Средний уровень ряда – показатель, обобщающий итоги развития явления за определенный интервал из имеющейся временной последовательности. Для интервальных временных рядов с равными периодами времени средний уровень равен: . Для моментных временных рядов при условии, что в пределах каждого периода развитие происходило по линейному закону, средний уровень (среднее хронологическое) равен: . Изучение основной тенденции развития временного ряда. Обычно анализ временных рядов предполагает, что данные содержат систематическую составляющую, которая может состоять из нескольких регулярных компонент, и случайный шум (ошибку), который затрудняет обнаружение регулярных компонент. Большинство регулярных составляющих временных рядов принадлежит к двум классам: они являются либо трендом, либо сезонной составляющей. Тренд представляет собой общую систематическую линейную или нелинейную компоненту, которая может изменяться во времени. Сезонная составляющая – это периодически повторяющаяся компонента. Оба этих вида регулярных компонент часто присутствуют в ряде одновременно. Например, продажи компании могут возрастать из года в год, но они также содержат сезонную составляющую (как правило, 25% годовых продаж приходится на декабрь и только 4% на август). Под выравниванием временного ряда понимают определение основной, проявляющейся во времени, тенденции развития изучаемого явления. Выравнивая временной ряд, получают наиболее общий, суммарный, проявляющийся во времени результат действия всех причинных факторов. Отклонение конкретных уровней ряда от уровней, соответствующих общей тенденции, объясняют действием факторов не постоянных, но проявляющихся случайно. В результате приходят к трендовой модели вида: , где: – уровень, определяемый тенденцией развития (тренд); – случайное отклонение от тенденции (случайный шум). Целью выравнивания динамического ряда является определение зависимости . Если в анализируемой временной последовательности наблюдаются устойчивые отклонения от тенденции, как в большую, так и в меньшую сторону, то можно предположить наличие в ряду динамики некоторой сезонной или циклической составляющей. Естественно, что динамические ряды могут содержать колебательные процессы с большей и меньшей периодичностью. Анализ выполняют, представляя временной ряд как совокупность гармонических колебательных процессов. Для каждой точки этого ряда справедливо выражение: при , где: – фактический уровень ряда в момент (интервал) ; – выровненный уровень ряда (тренд) в момент (интервал) ; – параметры колебательного процесса (гармоники) с номером . Анализ тренда Первым шагом в выделении тренда является сглаживание (один из методов выравнивания). Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга. Самый общий метод сглаживания – скользящее среднее, в котором каждый член ряда заменяется простым или взвешенным средним соседних членов, где – ширина " окна". Вместо среднего можно использовать медиану значений, попавших в окно. Основное преимущество медианного сглаживания, в сравнении со сглаживанием скользящим средним, состоит в том, что результаты становятся более устойчивыми к выбросам (имеющимся внутри окна). Таким образом, если в данных имеются выбросы (связанные, например, с ошибками измерений), то сглаживание медианой обычно приводит к более гладким или, по крайней мере, более " надежным" кривым, по сравнению со скользящим средним с тем же самым окном. Относительно реже, когда ошибка измерения очень большая (ряд очень зашумлен), используется сглаживание методом наименьших квадратов, взвешенных относительно расстояния, или метод отрицательного экспоненциально взвешенного сглаживания. Все эти методы отфильтровывают шум и преобразуют данные в относительно гладкую кривую. Для выявления тренда методом скользящей средней, прежде всего, устанавливается ширина окна. Тренды бывают возрастающие, убывающие и нейтральные (горизонтальные). Простейшее скользящее среднее определяется следующим образом: берется текущая точка и соответствующее значение , предыдущее значение , значение и т.д. до значения . Строится новое усредненное значение уровня ряда при размере окна : . Далее точка сдвигается вправо на один шаг, скользя по временной шкале, и вновь производится усреднение значений ряда и т.д. Из определения скользящего среднего следует, что этот метод не прогнозирует тенденцию, а только следует за ней. Различают скользящее среднее, построенное по предыдущим точкам наблюдаемого ряда, и центрированное скользящее среднее. Во втором случае данные усредняются справа и слева от выбранной точки. По способу вычисления бывает простое, взвешенное и экспоненциальное скользящее среднее [4]. Если число усредняемых значений мало – маленькое окно, то флуктуации ряда сглаживаются слабо. Если число усредняемых значений велико – большое окно, то флуктуации ряда сильно сглаживаются, но в ряде возникает смещение (сдвиг полученного ряда по отношению к исходному ряду). Это может привести к искажению тенденции. Рекомендуется для рядов наблюдаемых с интервалом в один день применять пятидневное, десятидневное, двадцатидневное, сорокадневное скользящее среднее. Бывает, что используются числа Фибоначчи – 13, 21, 34, 55 …, или 4, 9, 18-тидневное скользящее среднее. При анализе квартальных данных применяют четырехчленные окна, при анализе месячных данных – 12-членные окна и т. д. При анализе годовых данных выбор размера окна интуитивно определяется исходя из длительности циклов в изучаемом явлении и длины ряда. После того как выявлена тенденция, вторым шагом в описании тренда является измерение тенденции, т.е. задание функции , которая наилучшим образом опишет тренд ряда динамики. Для этого используют методы аналитического выравнивания, основанные на методе наименьших квадратов. В практике статистического изучения трендов различают следующие эталонные типы развития экологических и социально-экономических явлений во времени. Равномерное развитие. Для этого типа динамики присущи приблизительно постоянные абсолютные приросты: . В этом случае основная тенденция развития отображается линейной функцией вида: . Равноускоренное (равнозамедленное) развитие. Этому типу динамики свойственны приблизительно постоянные во времени темпы прироста: . В этом случае основная тенденция развития отображается параболической функцией (частным случаем полиномиальной функции) вида: . Развитие по экспоненте. Этому типу динамики свойственны приблизительно постоянные во времени темпы роста: . В этом случае основная тенденция развития отображается показательной функцией вида: . Развитие с замедлением роста в конце периода. Для этого типа динамики показания цепного абсолютного прироста сокращаются с течением времени: . В этом случае основная тенденция развития отображается полулогарифмической функцией вида: . Возможны другие виды тенденций, которые могут быть определены на основе графического анализа трендов, полученных путем использования метода скользящего среднего. Многие монотонные временные ряды можно хорошо приблизить линейной функцией. Если же имеется явная монотонная нелинейная компонента, то данные вначале следует преобразовать, чтобы устранить нелинейность. Обычно для этого используют логарифмическое, экспоненциальное или (менее часто) полиномиальное преобразование данных. Анализ периодической или сезонной зависимости Сезонность представляет собой другой общий тип компонент временного ряда. Часто бывает, что ряд динамики имеет повторяющуюся сезонную или периодическую составляющую. Это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самом периоде в прошлом. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка между каждым -ым элементом ряда и -ым элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); величину обычно называют лагом. Если ошибка измерения (зашумленность ряда) не слишком большая, то сезонность или периодичность можно определить визуально на графике, рассматривая поведение членов ряда через каждые временных единиц. Сезонные составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (АКФ), иными словами коэффициенты автокорреляции (и их стандартные ошибки) для последовательности лагов из определенного диапазона (например, от 1 до ). На коррелограмме обычно отмечается величина автокорреляции, потому что интерес в основном представляют очень сильные (а, следовательно, высоко значимые) автокорреляции между членами ряда. Обычно для периодических рядов АКФ имеет выбросы корреляций на соответствующих лагах. Другой полезный метод исследования периодичности состоит в исследовании частной автокорреляционной функции (ЧАКФ), представляющей собой углубление понятия обычной автокорреляционной функции. В ЧАКФ устраняется зависимость между промежуточными наблюдениями (наблюдениями внутри лага). Другими словами, частная автокорреляция на данном лаге аналогична обычной автокорреляции, за исключением того, что при вычислении из нее удаляется влияние автокорреляций с меньшими лагами. На лаге 1 (когда нет промежуточных элементов внутри лага), частная автокорреляция равна, очевидно, обычной автокорреляции. На самом деле, частная автокорреляция дает более " чистую" картину периодических зависимостей. В качестве примера рассмотрим временной ряд, характеризующий изменение курса доллара (см. рис. 5.1):
Рисунок 5.1 – Пример временного ряда
На рисунке 5.2 дана автокорреляционная функция для этого временного ряда. Она показывает, что имеется тенденция к затуханию корреляции, однако коэффициенты автокорреляции велики:
Рисунок 5.2 – Автокорреляционная функция вышеприведенного временного ряда
Частная автокорреляционная функция этого же ряда приведена на рисунке 5.3, из которого видно, что имеется выброс корреляций на первом лаге, а на других лагах коэффициенты корреляции значительно меньше: 5.3 – Частная автокорреляционная функция временного ряда, приведенного на рисунке 5.1 Удаление периодической зависимости Периодическая составляющая для данного лага может быть удалена взятием разности соответствующего порядка. Это означает, что из каждого -го элемента ряда вычитается -ый элемент. Имеются два довода в пользу таких преобразований. Во-первых, таким образом можно определить скрытые периодические составляющие ряда. Напомним, что автокорреляции на последовательных лагах зависимы. Поэтому удаление некоторых автокорреляций изменит другие автокорреляции, которые, возможно, подавляли их, и сделает некоторые другие сезонные составляющие более заметными. Во-вторых, удаление сезонных составляющих делает ряд стационарным. В анализе временных рядов стационарные ряды имеют постоянные по времени среднее, дисперсию и автокорреляции и более удобны для анализа. Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности порядка . Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. В сезонных рядах АКФ и ЧАКФ имеют существенные значения на лагах, кратных сезонному лагу. Сезонную разность берут при необходимости после взятия одной разности с лагом 1. Сезонный лаг, используемый для сезонных параметров, определяется на этапе идентификации порядка модели. Следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов Основная цель преобразований временных рядов – сделать преобразованный ряд стационарным, что необходимо для дальнейшего анализа. С этой целью на первом этапе обычно исключают тренд, если он присутствует, далее берут разности. Поиск алгоритма преобразований обычно основывается на интуитивном подходе путем анализа автокорреляционной и частной автокорреляционной функций. Вторая важная цель преобразований – идентификация (определения возможных параметров) будущей модели временного ряда.
Идентификация моделей динамики Идентификация является грубой предварительной процедурой оценки будущего вида модели. Основной критерий идентификации – анализ поведения выборочный АКФ и ЧАКФ на графиках. На первом этапе изучается график ряда динамики на нестационарность. Если ряд зашумлен, может применяться сглаживание, для выявления тренда. Если тренд явно на графике не выражен, то изучают выборочную АКФ: ряд нестационарен, если АКФ не имеет тенденции к затуханию или имеет слабую тенденцию. Если ряд не стационарен, то на следующем этапе, преобразовывая ряд, пытаются удалить тренд, чтобы получить затухающую АКФ. Если после удаления тренда АКФ не имеет тенденции к затуханию, то тогда берут разности первого порядка и проверяют поведение АКФ и ЧАКФ. Если преобразованный ряд можно считать стационарным, то определяют порядок разности . Если ряд не стационарный, то повторно берут разность первого порядка и оценивают АКФ. В этом случае, считают . Обычно редко встречаются временные ряды, когда необходимо брать разности более 2 раз. Далее проводят идентификацию полученной стационарной модели. В дальнейшем будем работать с временными рядами, которые могут описываться моделями авторегрессии и проинтегрированного скользящего среднего (АРПСС). Модель авторегрессии и скользящего среднего, предложенная Боксом и Дженкинсом (1976) включает как параметры авторегрессии, так и параметры скользящего среднего. Именно, имеется три типа параметров модели: параметры авторегрессии (), порядок разности (), параметры скользящего среднего (). В обозначениях Бокса и Дженкинса модель записывается как АРПСС (p, d, q). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авторегрессии () и 2 параметра скользящего среднего (), которые вычисляются для ряда после взятия разности с лагом 1 (). Идентификация не является простой процедурой и требуется основательно поэкспериментировать с альтернативными моделями. Тем не менее, большинство встречающихся на практике временных рядов можно с достаточной степенью точности аппроксимировать одной из 5 основных моделей, которые можно идентифицировать по виду автокорреляционной (АКФ) и частной автокорреляционной функции (ЧАКФ). Отметим, что число параметров каждого вида невелико (меньше 2), поэтому нетрудно проверить альтернативные модели.
Для примера, идентифицируем нестационарный временной ряд, представленный на рисунке выше. На шаге 1 исключим тренд. Изучив АКФ и ЧАКФ, увидим, что это ничего не дало, т.е. тренд если и есть, то слабо выраженный. На шаге 2 берем разность первого порядка для исходного временного ряда. Преобразованный ряд и его АКФ и ЧАКФ представлены на рисунках ниже.
Рисунок 5.4 – Преобразованный временной ряд
Рисунок 5.5 – Автокорреляционная функция преобразованного временного ряда
Рисунок 5.6 – Частотная автокорреляционная функция преобразованного временного ряда
Из рисунков видно, что преобразованный ряд стационарный, т.к. его среднее значение равно нулю. С учетом рекомендаций 1 – 5 идентифицируем исходный временной ряд. Для этого изучим АКФ и ЧАКФ исходного и преобразованного временных рядов. Используя первый критерий (из перечня 1 – 5), можно идентифицировать модель как процесс AP(1) – авторегрессия порядка p=1. Однако следует учитывать, что исходный ряд имеет слабую нестационарность. Анализируя АКФ и ЧАКФ преобразованного временного ряда можно установить, что АКФ и ЧАКФ похожи друг на друга и имеют выбросы на втором лаге. Однако видно, что АКФ сильнее осциллирует в отличие от ЧАКФ. Поэтому с учетом второго критерия можно идентифицировать модель как AP(2) – авторегрессия порядка 2. Исходя из анализа, останавливаемся на трех альтернативных моделях для дальнейшего анализа: первая АРПСС (1, 0, 0), вторая АРПСС (2, 1, 0), т.е. вторая модель содержит 2 параметра авторегрессии (), которые вычисляются для ряда после взятия разности с лагом 1 (), и 0 (нуль) параметров скользящего среднего () и третья модель АРПСС (1, 1, 1). Третья модель используется потому, что пятое условие с определенными допущениями также подходит под АКФ и ЧАКФ преобразованного ряда. Из рисунков видно также, что модели не имеют сезонных составляющих. На следующем этапе следует определить параметры моделей, исследовать их остатки и оценить адекватность моделей. После чего необходимо из трех альтернативных моделей выбрать наилучшую модель.
|