class: center, middle, inverse, title-slide .title[ # Estimación bajo exogeneidad secuencial ] .author[ ### Gustavo A. García
ggarci24@eafit.edu.co
] .date[ ###
Econometría avanzada II
PhD/Maestría en Economía
Universidad EAFIT
] --- <style> .notbold{ font-weight:normal } body { text-align: justify; } h1{ margin-top: -1px; margin-bottom: -3px; } .small-code pre{ margin-bottom: -10px; } .medium-code pre{ margin-bottom: 2px; } </style> <font size = "5"> <br> <br> <br> <br> <br> Link slides en formato [html](https://gusgarciacruz.github.io/EconometriaAvanzadaII/ExogeneidadSecuencial/ExogeneidadSecuencial.html) Link slides en formato [PDF](https://gusgarciacruz.github.io/EconometriaAvanzadaII/ExogeneidadSecuencial/ExogeneidadSecuencial.pdf) --- # <span style="font-size:80%">En este tema</span> - <span style="font-size:150%">[<span style="color:black">Motivación](#motivacion)</span> <br> <br> - <span style="font-size:150%">[<span style="color:black">Marco general](#marco)</span> <br> <br> - <span style="font-size:150%">[<span style="color:black">Estimación bajo exogeneidad secuencial](#estimacion)</span> <br> <br> - <span style="font-size:150%">[<span style="color:black">Modelos con variable dependiente rezagada](#rezagada)</span> <br> <br> - <span style="font-size:150%">[<span style="color:black">Ejercicio aplicado en R: modelos dinámicos con datos de panel](#r)</span> --- # <span style="font-size:80%">Lecturas</span> - <span style="font-size:150%">Wooldridge, J. (2010). *Econometric Analysis of Cross Section and Panel Data*. 2a edición. MA: MIT Press. <span style="color:blue">Sección 11.6 <br> <br> --- name: motivacion # <span style="font-size:80%">Motivación</span> <font size = "5"> - Los métodos de estimación usualmente asumen que las variables explicatorias son estrictamente exógenas (condicional sobre un efectos inobservables en el caso de efectos fijos) - Generalmente, efectos aleatorios y fijos son inconsistentes si una variable explicatoria en algún periodo de tiempo es correlacionado con `\(u_{it}\)` - Se debe, entonces, tener una forma general de obtener consistentes estimadores cuando `\(N \longrightarrow \infty\)` con `\(T\)` es fijo cuando las variables explicatorias no son estrictamente exógenas --- name: marco # <span style="font-size:80%">Marco general</span> <font size = "5"> El modelo de interés es `$$y_{it} = \textbf{x}_{it}\pmb{\beta} + c_i + u_{it}, t=1,2,...,T$$` `\(c_i\)` y `\(\textbf{x}_{it}\)` pueden estar correlacionadas y adicionalmente se permite que `\(u_{it}\)` a estar correlacionada con valores *futuros* de las variables explicatorias `\((\textbf{x}_{i,t+1}, \textbf{x}_{i,t+2},...,\textbf{x}_{iT})\)` <span style="color:blue"> `\(u_{it}\)` y `\(\textbf{x}_{i,t+1}\)` deben estar correlacionadas ya que `\(x_{i,t+1} = y_{it}\)`</span> No obstante, existen muchos modelos, incluyendo el modelo AR(1), para lo cual es razonable asumir que `\(u_{it}\)` esta incorrelacionado con actuales y pasados valores de `\(\textbf{x}_{it}\)` Para tratar esta correlación, Chamberlain (1992) introduce la <span style="color:blue">restricción de momentos secuenciales</span>: `$$E(u_{it}|\textbf{x}_{it},\textbf{x}_{i,t-1},...,\textbf{x}_{i1},c_i)=0, t=1,2,...,T$$` Cuando el anterior supuesto se mantiene, decimos que las `\(\textbf{x}_{it}\)` son <span style="color:blue">secuencialmente exógenas condicional a los efectos inobservables --- # <span style="font-size:80%">Marco general</span> <font size = "5"> El anterior supuesto es equivalente a `$$E(y_{it}|\textbf{x}_{it},\textbf{x}_{i,t-1},...,\textbf{x}_{i1},c_i)=E(y_{it}|\textbf{x}_{it},c_i)=\textbf{x}_{it}\pmb{\beta} + c_i$$` es claro entonces lo que implica la exogeneidad secuencial en las variables explicatorias: <span style="color:blue">después de que `\(\textbf{x}_{it}\)` y `\(c_i\)` han sido controladas, valores pasados de `\(\textbf{x}_{it}\)` no afectan el valor esperado de `\(y_{it}\)`</span> Esta condición es más natural que el supuesto de exogeneidad estricta, la cual requiere también condicionar sobre valores futuros de `\(\textbf{x}_{it}\)` --- # <span style="font-size:80%">Marco general</span> <spam style="font-size:115%"> <span style="color:blue">Ejemplo: Modelo estático con *feedback*</span> Consideremos el siguiente modelo panel estático `$$y_{it} = \textbf{z}_{it}\pmb{\gamma} + \delta w_{it} + c_i + u_{it}$$` donde `\(\textbf{z}_{it}\)` es estrictamente exógeno y `\(w_{it}\)` es secuencialmente exógena `$$E(u_{it}|\textbf{z}_{it},w_{it},w_{it-1},...,w_{i1},c_i)=0$$` Sin embargo, `\(w_{it}\)` es influenciado por valor pasado de `\(y_{it}\)` `$$w_{it} = \textbf{z}_{it}\xi + \rho_1 y_{it-1} + \psi c_i + r_{it}$$` Por ejemplo:<br> `\(y_{it}\)`: venta per capita de una vacuna en la ciudad `\(i\)` durante el año `\(t\)` <br> `\(w_{it}\)`: tasa de infección de un virus - El modelo entonces puede ser usado para probar si la vacuna esta influenciada por la propagación del virus - El efecto inobservado `\(c_i\)` contiene factores inobservables específicos a la ciudad - La ecuación de `\(w_{it}\)` es una forma de capturar el hecho que la propagación del virus esta influenciada por la vacunación pasada --- # <span style="font-size:80%">Marco general</span> <spam style="font-size:115%"> <span style="color:blue">Ejemplo: Modelo estático con *feedback*</span> Corroboremos exogeneidad estricta en el anterior modelo recursivo `$$E(w_{it+1}u_{it})=\rho_1E(y_{it}u_{it})= E(u_{it}^2)>0$$` Entonces, el supuesto de estricta exogeneidad se viola a menos que `\(\rho_1 = 0\)` Algunas veces en aplicaciones de modelos de datos panel se incluyen variables rezagadas en lugar de contemporáneas, que pueden mitigar el problema pero no lo resuelve La idea entonces es usar `\(w_{it-1}\)` en lugar de `\(w_{it}\)` en la ecuación principal de `\(y_{it}\)`, ya que pensamos que `\(w_{it}\)` y `\(u_{it}\)` están correlacionadas. El modelo será: `$$y_{it} = \textbf{z}_{it}\pmb{\gamma} + \delta w_{it-1} + c_i + u_{it}$$` En este caso `\(\textbf{x}_{it+1}=(\textbf{z}_{it+1},w_{it})\)`, así que `$$\begin{array}{cl} E(\textbf{x}_{it+1}'u_{it}) & \Longrightarrow E(\textbf{z}_{it+1}'u_{it})=0 \\ & \Longrightarrow E(w_{it}u_{it})\neq 0 \end{array}$$` Así que la exogeneidad estricta falla y en estos caso la condición de exogeneidad secuencial es más razonable --- name: estimacion # <span style="font-size:80%">Estimación bajo exogeneidad secuencial</span> <font size = "5"> La pregunta entonces que surge es: <span style="color:blue">Qué estimador podemos aplicar bajo exogeneidad secuencial?</span> - Usar una transformación para eliminar `\(c_i\)` y buscar variables instrumentales - El estimador de FE es inconsistente ya que el supuesto de exogeneidad estricta no se cumple - Para modelos bajo el supuesto de exogeneidad secuencial, <span style="color:blue">primeras diferencias es más atractivo --- # <span style="font-size:80%">Estimación bajo exogeneidad secuencial</span> <font size = "5"> Sea el modelo `$$y_{it} = \textbf{x}_{it}\pmb{\beta} + c_i + u_{it}$$` Se toman primeras diferencias para eliminar el efecto inobservable, esto es `$$(y_{it} - y_{it-1}) = (\textbf{x}_{it} - \textbf{x}_{it-1})\pmb{\beta} + (u_{it} - u_{it-1})$$` `$$\Delta y_{it} = \Delta \textbf{x}_{it}\pmb{\beta} + \Delta u_{it}$$` Bajo el supuesto de exogeneidad secuencial se tiene que `$$E(\Delta \textbf{x}_{it}' \Delta u_{it})=-E(\textbf{x}_{it}'u_{it})\neq 0$$` Lo que muestra que el estimador de primeras diferencias es inconsistente, así que es necesario buscar potenciales instrumentos para `\(\Delta \textbf{x}_{it}\)` --- # <span style="font-size:80%">Estimación bajo exogeneidad secuencial</span> <spam style="font-size:105%"> El supuesto de exogeneidad secuencial también implica que `$$E(\textbf{x}_{is}'u_{it})=0$$` `$$s=1,...,t; t=1,...,T$$` lo cual implica las siguientes condiciones de ortogonalidad `$$E(\textbf{x}_{is}'(u_{it}-u_{it-1}))= E(\textbf{x}_{is}'\Delta u_{it})=0$$` `$$s=1,...,t-1; t=2,...,T$$` Por tanto, en el tiempo `\(t\)`, la disponibilidad de instrumentos en la ecuación de primeras diferencias están en el vector `\(\textbf{x}_{it-1}^{0}\)` donde `$$\textbf{x}_{it}^{0}=(\textbf{x}_{i1}, \textbf{x}_{i2},...,\textbf{x}_{it})$$` El hecho que `\(\textbf{x}_{it-1}^{0}\)` esté incorrelacionado con `\(\Delta u_{it}\)` abre la posibilidad de varios procedimientos de estimación: 2SLS o GMM Por ejemplo, un estimador que use `\(\Delta \textbf{x}_{it-1}\)` como instrumento para `\(\Delta \textbf{x}_{it}\)`, se cumpliría que `$$E(\Delta \textbf{x}_{it-1}' \Delta u_{it})=0$$` El modelo de primeras diferencias podría ser estimado por *pooled* 2SLS --- # <span style="font-size:80%">Estimación bajo exogeneidad secuencial</span> <spam style="font-size:116%"> Una característica general del procedimiento *pooled* 2SLS es que no usa todos los instrumentos disponibles en cada periodo de tiempo, por lo tanto, el procedimiento no es eficiente El procedimiento óptimo es usar los instrumentos en una estimación por GMM Entonces, la matriz de instrumentos es definida por `$$\textbf{W}_i = \left[ \begin{array}{ccccc} \textbf{x}_{i1}^0 & \textbf{0} & \textbf{0} & \cdots & \textbf{0} \\ \textbf{0} & \textbf{x}_{i2}^0 & \textbf{0} & \cdots & \textbf{0} \\ \vdots & & & & \vdots \\ \textbf{0} & \textbf{0} & \textbf{0} & \cdots & \textbf{x}_{iT-1}^0 \end{array} \right]=\text{diag}(\textbf{x}_{i1}^0, \textbf{x}_{i2}^0,...,\textbf{x}_{iT-1}^0)$$` Debido a la exogeneidad secuencial, el número de instrumentos validos incrementa con `\(t\)` Como una cuestión práctica, la dimensión de columnas de `\(\textbf{W}_i\)` puede ser grande, especialmente cuando `\(T\)` es grande. Se sabe que el uso de muchas restricciones de sobre-identificación contribuye a que las propiedades de muestra finita de los GMM sean pobres, especialmente si muchos de los instrumentos son débiles <span style="color:blue">Lo recomendable, aunque no sea eficiente, es usar un par de rezagos como instrumentos --- name: rezagada # <span style="font-size:80%">Modelos con variable dependiente rezagada</span> <font size = "5"> Un caso especial de modelos bajo restricciones de exogeneidad secuencial son los modelos autorregresivos. Aquí estudiamos el modelo AR(1) (Arellano y Bond, 1991), que tiene la siguiente estructura cuando no tiene variables explicativas adicionales `$$y_{it} = \rho y_{it-1} + c_i + u_{it}, t=1,...,T$$` y el supuesto de exogeneidad secuencial es `$$E(u_{it}|y_{it-1},y_{it-2},...,y_{i0},c_i)=0$$` Una hipótesis interesante en este modelo es `\(H_{0}:\rho_1 = 0\)`, que significa que, después de que la heterogeneidad inobservable ha sido controlado, `\(y_{it-1}\)` nos ayuda a predecir `\(y_{it}\)`. Cuando `\(\rho_1 \neq 0\)`, decimos que `\(y_{it}\)` exhibe <span style="color:blue">dependencia de estado (*state dependence*)</span>: el estado actual de la variable de resultado depende del estado del último período, incluso después de controlar por `\(c_i\)` --- # <span style="font-size:80%">Modelos con variable dependiente rezagada</span> <font size = "5"> Estimación del modelo de datos panel dinámico - En el tiempo `\(t\)` en la ecuación de primeras diferencias `\(\Delta y_{it} = \rho \Delta y_{it-1} + \Delta u_{it}\)`, `\(t=2,...,T\)`, los instrumentos disponibles son `\(\textbf{w}_{it} = (y_{i0},...,y_{t-2})\)` - Anderson y Hsiao (1982): instrumento `\(y_{it-2}\)` o `\(\Delta y_{it-2}\)` - Arellano y Bond (1991): GMM usando todas las variables instrumentales - El estimador *Pooled* IV que usa `\(y_{i0}\)` como instrumento en `\(t=2\)` y luego `\((y_{it-2},y_{it-3})\)` para `\(t=3,...,T\)`. Este estimador es más eficiente que el enfoque Anderson y Hsiao, pero menos eficiente que el enfoque full GMM --- name: r # <span style="font-size:80%">Ejercicio aplicado en R: modelos dinámicos con datos de panel</span> <font size = "5"> En este ejercicio aplicado se van a utilizar los datos de Arellano y Bond (1991), en donde se estima una ecuación de empleo utilizando una muestra de empresas en UK. Se tiene información para 140 empresas en el periodo 1976 a 1984, en un panel desbalanceado. Se considera la siguiente ecuación de empleo dinámica `$$\begin{array}{cl} ln(empleo_{it}) = &\alpha_1 ln(empleo_{it-1}) + \alpha_2 ln(empleo_{it-2}) + \\ & \beta_1 ln(wage_{it}) + \beta_2 ln(wage_{it-1}) + \\ & \delta_1 ln(capital_{it}) + \delta_2 ln(capital_{it-1}) + \delta_3 ln(capital_{it-2}) + \\ & \gamma_1 ln(output_{it}) + \gamma_2 ln(output_{it-1}) + \gamma_3 ln(output_{it-2}) + e_{it} \end{array}$$` <p style="margin-bottom: -.8em"> En el siguiente link se encuentra el código utilizado en R: - [Código en R](https://gusgarciacruz.github.io/EconometriaAvanzadaII/ExogeneidadSecuencial/L3.R)