Модель авторегрессии - проинтегрированного скользящего среднего
Процедуры оценки параметров и прогнозирования, описанные в предыдущем разделе, предполагают, что математическая модель процесса известна. В реальных данных часто нет отчетливо выраженных регулярных составляющих. Отдельные наблюдения содержат значительную ошибку, тогда как вы хотите не только выделить регулярные компоненты, но также построить прогноз. Методология АРПСС, разработанная Боксом и Дженкинсом (1976), позволяет это сделать. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость. Однако из-за мощности и гибкости, АРПСС - сложный метод. Его не так просто использовать, и требуется большая практика, чтобы овладеть им. Хотя часто он дает удовлетворительные результаты, они зависят от квалификации пользователя. Большинство временных рядов содержат элементы, которые последовательно зависят друг от друга. Такую зависимость можно выразить следующим уравнением: , (1) где - константа (свободный член); - параметры авторегрессии. Вы видите, что каждое наблюдение есть сумма случайной компоненты (случайное воздействие, ) и линейной комбинации предыдущих наблюдений. Заметим, что процесс авторегрессии будет стационарным только, если его параметры лежат в определенном диапазоне. Например, если имеется только один параметр, то он должен находиться в интервале . В противном случае, предыдущие значения будут накапливаться и значения последующих могут быть неограниченными, следовательно, ряд не будет стационарным. Если имеется несколько параметров авторегрессии, то можно определить аналогичные условия, обеспечивающие стационарность. В отличие от процесса авторегрессии, в процессе скользящего среднего каждый элемент ряда подвержен суммарному воздействию предыдущих ошибок. В общем виде это можно записать следующим образом , (2) где - константа; - параметры скользящего среднего. Другими словами, текущее наблюдение ряда представляет собой сумму случайной компоненты (случайное воздействие, ) в данный момент и линейной комбинации случайных воздействий в предыдущие моменты времени. Не вдаваясь в детали, отметим, что существует "двойственность" между процессами скользящего среднего и авторегрессии. Это означает, что приведенное выше уравнение скользящего среднего можно переписать (обратить) в виде уравнения авторегрессии (неограниченного порядка), и наоборот. Это так называемое свойство обратимости. Имеются условия, аналогичные приведенным выше условиям стационарности, обеспечивающие обратимость модели. Модель авторегрессии и скользящего среднего. Общая модель, предложенная Боксом и Дженкинсом включает как параметры авторегрессии, так и параметры скользящего среднего. Именно, имеется три типа параметров модели: параметры авторегрессии (обозначение ), порядок разности (обозначение ), параметры скользящего среднего (обозначение ). В обозначениях Бокса и Дженкинса модель записывается как АРПСС (). Например, модель (0, 1, 2) содержит 0 (нуль) параметров авторегрессии и 2 параметра скользящего среднего, которые вычисляются для ряда после взятия разности с лагом 1. Как отмечено ранее, для модели АРПСС необходимо, чтобы ряд был стационарным, это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. Поэтому обычно необходимо брать разности ряда до тех пор, пока он не станет стационарным (часто также применяют логарифмическое преобразование для стабилизации дисперсии). Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром . Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка (лаг = 1). Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности. Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка. Однако следует помнить, что для некоторых временных рядов нужно брать разности небольшого порядка или вовсе не брать их. Заметим, что чрезмерное количество взятых разностей приводит к менее стабильным оценкам коэффициентов. |