¿Qué es el Modelo ARMAX y la diferencia con el modelo ARIMA?

¿Qué es el Modelo ARMAX y la diferencia con el modelo ARIMA?

Juan M. Gutierrez

Por: Juan M. Gutierrez

Comparación ARMAX vs ARIMA

A menudo hay confusión acerca de cómo incluir covariables en los modelos ARIMA, y la presentación del tema en varios libros de texto y en los archivos de ayuda de programas como R o Eviews no ayuda a la clarificación de la confusión. Así que pensé en dar mi opinión sobre el tema. Para simplificar, solo describiré los modelos ARIMA no estacionales, aunque las ideas se amplían fácilmente para incluir términos estacionales. Incluiré solo una covariable en los modelos, aunque es fácil extender los resultados a múltiples covariables. Y, para empezar, supondré que los datos son estacionarios, por lo que solo consideramos los modelos ARMA.

La serie temporal tendrá la siguiente expresión de yty_t.

Primero, definiremos un modelo ARMA (p, q) sin covariables:

yt=ϕ1yt1++ϕpytpθ1zt1θqzt+zty_t = \phi_1 y_{t-1} + \cdots + \phi_p y_{t-p} - \theta_1 z_{t-1} - \cdots - \theta_q z_t + z_t

Donde ztz_t es un proceso denominado ruido blanco (que se distribuye con media nula y covarianza nula y son independientes e idénticamente distribuidas).

LOS MODELOS ARMAX

Un modelo ARMAX simplemente agrega la covariable en el lado derecho de la siguiente manera:

yt=βxt+ϕ1yt1++ϕpytpθ1zt1θqzt+zty_t = \beta x_t + \phi_1 y_{t-1} + \cdots + \phi_p y_{t-p} - \theta_1 z_{t-1} - \cdots - \theta_q z_t + z_t

Donde xtx_t es una covariable en el tiempo tt, y β\beta es su coeficiente. Si bien esto parece sencillo, una desventaja es que el coeficiente covariable es difícil de interpretar. El valor de β\beta no es el efecto en yty_t cuando xtx_t se incrementa en uno (ceteris paribus). La presencia de valores rezagados de la variable de respuesta en el lado derecho de la ecuación significa que β\beta solo puede interpretarse condicionalmente en el valor de los valores anteriores de la variable de respuesta, cual es poco intuitivo.

Si escribimos el modelo utilizando operadores de rezagos, el modelo ARMAX viene dado por:

ϕ(B)yt=βxt+θ(B)zt\phi(B) y_t = \beta x_t + \theta(B) z_t

ó

yt=βϕ(B)xt+θ(B)ϕ(B)zty_t = \frac{\beta}{\phi(B)} x_t + \frac{\theta(B)}{\phi(B)} z_t

Donde:

ϕ(B)=1ϕ1BϕpBpyθ(B)=1θ1BθqBq\phi(B) = 1 - \phi_1 B - \cdots - \phi_p B^p \quad \text{y} \quad \theta(B) = 1 - \theta_1 B - \cdots - \theta_q B^q

Se observa cómo los coeficientes AR se mezclan tanto con las covariables como con el término de error.

REGRESIÓN CON ERRORES ARMA

Por esta razón, prefiero usar modelos de regresión con errores ARMA, definidos de la siguiente manera:

yt=βxt+ntnt=ϕ1nt1++ϕpntpθ1zt1θqztq+zt\begin{aligned} y_t &= \beta x_t + n_t \\ n_t &= \phi_1 n_{t-1} + \cdots + \phi_p n_{t-p} - \theta_1 z_{t-1} - \cdots - \theta_q z_{t-q} + z_t \end{aligned}

En este caso, el coeficiente de regresión tiene su interpretación habitual. No hay mucho para elegir entre los modelos en términos de capacidad de pronóstico, pero la facilidad adicional de interpretación en el segundo lo hace atractivo. Usando operadores de rezagos, este modelo se puede escribir como:

yt=βxt+θ(B)ϕ(B)zty_t = \beta x_t + \frac{\theta(B)}{\phi(B)} z_t

Esto permite efectos rezagados de las covariables (a través del operador β(B)\beta(B)) y para efectos de descomposición de las covariables (a través del operador v(B)v(B)). A veces, estos se denominan "modelos de regresión dinámica", aunque diferentes libros usan ese término para diferentes modelos. El método para seleccionar las órdenes de un modelo de función de transferencia que se describe en el paper de Box y Jenkins y es engorroso y difícil, pero continúa describiéndose en los libros de texto. Un procedimiento mucho mejor se da en Pankratz (1991).

MODELIZACIÓN CON DATOS NO ESTACIONARIOS

Para los errores ARIMA, simplemente reemplazamos ϕ(B)\phi(B) por ϕ(B)Δd\phi(B)\Delta^d donde Δ=(1B)\Delta = (1 - B) denota el operador de diferencia. Tenga en cuenta que esto es equivalente a diferenciar tanto yty_t como xtx_t antes de ajustar el modelo con errores ARMA. De hecho, es necesario diferenciar todas las variables primero ya que la estimación de un modelo con errores no estacionarios no es consistente y puede conducir a una "regresión espuria".

CONCLUSIÓN

Antes de 1970, los economistas y analistas de series de tiempo usaban métodos muy diferentes para modelar una serie de tiempo. Las series de tiempo modeladas por económetras son una regresión lineal estándar con variables explicativas sugeridas por la teoría, intuición económica y conocimiento de la temática a modelar, para explicar los movimientos en los datos de series de tiempo. La teoría de la econometría primero asumió la serie temporal como "no estacionaria" y no tuvo ningún efecto en su análisis empírico. Los analistas de series de tiempo, por otro lado, ignoraron este análisis econométrico tradicional. Modelaron una serie de tiempo en función de sus valores pasados. Trabajaron en torno al problema de la no estacionariedad diferenciando los datos para hacerlos estacionarios. Entonces, Clive Granger y Paul Newbold aparecieron con sus papers. Los econometristas se vieron obligados a prestar atención a los métodos de los analistas de series de tiempo, el más famoso de los cuales fue el enfoque de Box-Jenkins desarrollado por George P Box y Gwilym Jenkins y publicado en su legendaria monografía Análisis de series de tiempo: pronóstico y control.

Box y Jenkins afirmaron (con éxito) que los datos no estacionarios pueden hacerse estacionarios diferenciando la serie. Este modelo se llama Autoregressive Integrated Moving Average o modelo ARIMA (p, d, q). Los econometristas ignoraron el enfoque de Box-Jenkins al principio, pero se vieron obligados a prestarles atención cuando los pronósticos ARIMA comenzaron a superar constantemente los pronósticos basados en modelos econométricos estándar. La falta de una teoría económica sólida al principio detrás de los ARIMA era preocupante para los científicos de aceptar de inicio. Respondieron desarrollando otra clase de modelos que incorporaron componentes de promedio móvil y agresivo del enfoque de Box-Jenkins con el enfoque de "variables explicativas" de la econometría estándar. El más simple de estos modelos es el ARIMAX que es solo un ARIMA con variables explicativas adicionales proporcionadas por la teoría económica.

🚀Comparte este artículo

Math Chaos Texture
🎓

¿Te gustó este contenido?

Obtén certificados verificables en Python, Data Science y Machine Learning.

Ver Certificaciones Disponibles →