Gujarati, D. y Porter, D. (2010). Econometría. 5a edición, Mc Graw Hill. Cap 17
Enders, W. (2014). Applied econometric time series. 4th edition, Wiley. Cap 5
Pérez, c. (2008). Econometría avanzada. Técnicas y herramientas. Pearson. Cap 1
Demirhan, H. (2020). "dLagM: An R package for distributed lag models and ARDL bounds testing". PLoS ONE, 15(2): e0228812. https://doi.org/10.1371/journal.pone.0228812
En modelo de series de tiempo, existen tres tipo de modelos
Yt=α+p∑i=0βiXt−i+ut Modelo de rezagos distribuidoYt=α+q∑j=1γjYt−j+ut Modelo autorregresivoYt=α+p∑i=0βiXt−i+q∑j=1γjYt−j+ut Modelo autorregresivo de rezago distribuido (ADL)
En este tema estudiaremos estos modelos
Suponga que tenemos el siguiente modelo de rezagos distribuidos infinito:
Yt=α+β0Xt+β1Xt−1+β2Xt−2+...+ut
¿Cómo estimamos α y las β? Podemos adoptar dos enfoques:
Estimación ad hoc
Como se supone que la variable explicativa Xt es no estocástica (o por lo menos no correlacionada con el término de perturbación ut), igualmente son no estocásticas Xt−1, Xt−2, y así sucesivamente. Por consiguiente, en principio, es aplicable el método de MCO
El enfoque de Alt (1942) y Tinbergen (1949) sugiere proceder secuencialmente, es decir, primero la regresión Yt sobre Xt, luego la de Yt sobre Xt y Xt−1, después la regresión de Yt sobre Xt, Xt−1 y Xt−2, y así sucesivamente
Este procedimiento secuencial se detiene cuando los coeficientes de regresión de las variables rezagadas empiezan a ser estadísticamente insignificantes y/o el coeficiente de por lo menos una variable cambia su signo de positivo a negativo, o viceversa
Aunque la estimación ad hoc parece sencilla y discreta, plantea muchas desventajas, como las siguientes:
No hay guía a priori sobre la longitud máxima que debe tener el rezago
A medida que se estiman rezagos sucesivos, quedan menos grados de libertad, con lo cual se debilita un poco la inferencia estadística
Los rezagos sucesivos tienden a estar altamente correlacionados; por tanto, sale a relucir la multicolinealidad
Dadas estas limitaciones el procedimiento ad hoc no es muy recomendable
Método de Koyck: restricciones a priori sobre las β
Si todas las β tienen el mismo signo, Koyck da por hecho que se reducen geométricamente de la siguiente manera
βk=β0λk
donde λ, tal que 0<λ<1, se conoce como tasa de descenso, o de caída, del rezago distribuido y donde 1−λ se conoce como velocidad de ajuste
La idea es que cada coeficiente β sucesivo es numéricamente inferior a cada β anterior (esta afirmación se debe a que λ<1), lo cual implica que, a medida que se retorna al pasado distante, el efecto de ese rezago sobre Yt se reduce progresivamente, supuesto muy razonable
Características del esquema de Koyck:
Al suponer valores no negativos para λ, Koyck elimina la posibilidad de que las β cambien de signo
al suponer que λ<1, le da un menor peso a las β en el pasado distante que a las actuales
asegura que la suma de las β, que proporciona el multiplicador de largo plazo, es
∞∑k=0βk=β0(1+λ+λ2+λ3+...)=∞∑k=0β0(11−λ)
Método de Koyck: restricciones a priori sobre las β
Como resultado de imponer el supuesto de Koyck sobre el modelo, el modelo de rezagos distribuido queda
Yt=α+β0Xt+β0λXt−1+β0λ2Xt−2+...+ut
El modelo aún no es adecuado para su fácil estimación, pues un gran número (infinito) de parámetros quedan aún por estimar y el parámetro λ ingresa de forma por completo no lineal, por lo que un método de estimación lineal no podría aplicarse
Koyck entonces propone transformar la ecuación rezagandola un periodo, multiplicarla por λ y restarla a la ecuación original, con lo cual el modelo quedaría
Yt=α(1−λ)+β0Xt+λYt−1+vt
donde vt=ut−λut−1
Esta transformación de Koyck tiene las siguientes características:
Empezamos con un modelo de rezagos distribuidos y terminamos con un modelo autorregresivo
Yt−1 como expicativa implica algunos problemas. Yt−1, al igual que Yt, es estocástica (aletoria), lo cual significa que tenemos una variable explicativa estocástica en el modelo. En los mínimos cuadrados es necesaio el supuesto de que las variables explicativas son no estocásticas (no aleatorias)
vt=ut−λut−1 implica problemas de correlación serial
La presencia de Yt−1 implica que el d de Durbin-Watson no se puede utilizar. Se debe utilizar una prueba alternativa: la h de Durbin
Método de Koyck: restricciones a priori sobre las β
Mediana de los rezagosEs el tiempo requerido para la primera mitad, o 50%, del cambio total ocurrido en Y como consecuencia de un cambio unitario sostenido en X
Modelo de Koyck: Mediana de los rezagos=−log2logλ
Por ejemplo:
λ=0.2⟹ mediana de los rezagos = 0.4306: 50% del cambio total en Y se logra en menos de la mitad de un periodo
λ=0.8⟹ mediana de los rezagos = 3.1067: 50% del cambio total en Y se logra en más de 3 periodos
λ es la velocidad de ajuste, con lo que entre más alto sea λ mayor será la velocidad de juste, y entre menor se el valor de λ mayor será la velocidad de ajuste
Modelo de Koyck: Media de los rezagos=λ1−λ
Por ejemplo:
λ=0.5⟹ rezago medio = 1: se requiere en promedio un periodo para que el efecto de los cambios en X se sientan en los cambios en Y
Yt=α+q∑j=1γjYt−j+ut
Aplicar MCO a estos modelo puede no ser adecuado, debido a la presencia de variables explicativas estocásticas o aleatorias y la posibilidad de correlación serial
Para aplicar MCO debemos demostrar que Yt−1 está distribuida independientemente del término de perturbacón vt. Es posible demostrar que existe tal correlación:
cov[Yt−1,(ut−ut−1)]=−λσ2
Como sabemos, la estimación por MCO ante correlación de las variables independientes y el término de perturbación, lleva a estimadores sesgados e inconsistentes.Por lo que la estimación del modelo por MCO no es adecuada
Supongamos que encontramos una variable para representar Yt−1 muy correlacionada con Yt−1 pero no con vt. Tal representación se denomina variable instrumental. Liviatan (1963) sugiere Xt−1 como variable instrumental para Yt−1
Un modelo ADL(p,q) asume que una serie de tiempo Yt puede ser representada por una función lineal de p valores de su rezago y q rezagos de otra serie de tiempo Xt
Yt=α+p∑i=0βiXt−i+q∑j=1γjYt−j+ut Por ejemplo, un ADL(1,2) será:
Yt=α+β0Xt+β1Xt−1+γ1Yt−1+γ2Yt−2+ut
Como se mencionó, cuando Yt−1 está como variable explicativa el estadístico d de Durbin-Watson no sirve para detectar correlación serial (de primer orden)
En los modelos autorregresivos el valor del d por lo general tiende a 2, que indica ausencia de autocorrelación
El mismo Durbin, propuso la prueba h de muestras grandes para detectar correlación serial en modelo autorregresivos. El estadístico h tiene la siguiente estructura bajo la hipótesis nula de no autocorrelación
h=ˆρ√n1−n(Var(ˆα2))∼N(0,1) donde n=tamaño de la muestra, Var(ˆα2)=varianza del coeficiente de Yt−1, y ˆρ es la estimación de ρ, correlación serial de primer orden y el estadístico se distribuye como una normal estandarizada
Si el valor absoluto del estadístico h de Durbin es mayor a 1.96 (o si pvalor<5%), es porbable que exista autocorrelación
Los modelos ADL estiman sólo efectos autorregresivos
Una extensión inmediata que viene a la mente es la inclusión de efectos MA dentro del modelo
Estos efectos pueden ser entendidos como efectos rezagados de variables omitidas
El modelo ARMAX(p,q,b) se define como:
Yt=α+p∑j=1γjYt−j+q∑k=1ϕkut−k+b∑i=0βiXt−i+ut
Una desventaja de este modelo es que los βi son difíciles de interpretar. El β0 no es el efecto sobre Yt cuando Xt incremente en una unidad, como en un modelo de regresión normal
La presencia de valores rezagados de la variable dependiente al lado derecho de la ecuación implica que, los βi sólo pueden interpretarse condicional a los valores pasados de Yt, lo cual es poco intuitivo
Si reescribimos el modelo usando los operadores de rezagos, el modelo ARMAX es dado por
γ(L)Yt=β(L)Xt+ϕ(L)ut⟹Yt=β(L)γ(L)Xt+ϕ(L)γ(L)ut donde β(L)=β1L−...−βbLb, γ(L)=1−γ1L−...−γpLp y ϕ(L)=1−ϕ1L−...−ϕpLq
Por esta complicación en la interpretación de los βi, se prefiere usar modelos de regresión con errores ARMA, definido como sigue:
Yt=b∑i=0βiXt−i+ntnt=γ1nt−1+...+γpnt−p−ϕ1ut−1−...−ϕqut−q+ut En este caso, los coeficientes de regresión βi tienen la usual interpretación. Esta fácil interpretación lo hace más atractivo que el modelo anterior
Usando operadores de rezago el modelo puede escribirse como:
Yt=β(L)Xt+ϕ(L)γ(L)ut Softwares, como R, estiman este último modelo, así que los βs pueden interpretarse sin problema
Las tasas de interés de los bonos del Tesoro a corto y largo plazo están estrechamente vinculadas a las condiciones macroeconómicas. Si bien las tasas de interés de ambos tipos de bonos tienen las mismas tendencias a largo plazo, se comportan de manera bastante diferente a corto plazo. La diferencia en las tasas de interés de dos bonos con distintos vencimientos se denomina diferencial de plazo o Term Spread
La idea en este ejercicio es analizar los efectos del Term Spread sobre el crecimiento económico
Se tienen datos trimestrales para los Estados Unidos entre 1957Q1 y 2013Q4, para las siguientes variables:
En el siguiente link se encuentra el código utilizado en R:
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
Esc | Back to slideshow |