Wooldridge, J. (2013). Introducción a la econometría. Un enfoque moderno. 5a edición. Cenagage Learning Cap 16
Gujarati, D. y Porter, D. (2010). Econometría. 5a edición, Mc Graw Hill. Cap. 18, 19 y 20
Griffiths, W., Carter, R. y Judge, G. (1993). Learning and practicing econometrics. John & Sons, Inc. Cap. 17
Baltagi, B. (2011). Econometrics. Fifth Edition, Springer. Cap 10
En el tema anterior se mostró que el método de variables instrumentales puede resolver dos tipo de problemas: variables omitidas y error de medición
Otra forma importante de endogeneidad de las variables explicativas es la simultaneidad
Simultaneidad: ocurre cuando una o más de las variables explicativas se determinan conjuntamente con la variable dependiente
Es necesario entonces estudiar los métodos para estimar modelos de ecuaciones simultáneas (MES)
El ejemplo clásico de un MES es una ecuación de oferta y demanda para algún bien o insumo de producción. Sea, por ejemplo, hs las horas anuales de trabajo y w el salario por hora. Una función simple de oferta de mano de obra es
hs=α1w+β1z1+u1
z1: variable que afecta la oferta de mano de obra (por ejemplo, el salario del sector en la región analizada)
u1: término de error, contiene otros factores que afectan la oferta de mano de obra
α1: mide cómo cambia la oferta de mano de obra cuando el salario cambia. Si hs y w están en logaritmos, representa la elasticidad de la mano de obra
La anterior ecuación representa una ecuación estructura. Este nombre proviene del hecho de que la función de oferta de mano de obra es derivable de la teoría económica y tiene una interpretación causal
En términos económicos, esta elasticidad es importante ya que permite determinar cómo cambiará el número de horas que los trabajadores desean trabajar cuando las tasas impositiva sobre el ingreso salarial cambian
La ecuación de oferta de mano de obra parece similar a las vistas antes, pero presenta una diferencia: el salario no varia exogenamente
Se debe entender que existe una interacción entre oferta y demanda de mano de obra y de acuerdo a la teoría, se iguala esta oferta y demanda, determinando los valores de los salarios y las horas trabajadas en equilibrio
Para describir cómo se determinan los salarios y las horas en equilibrio, es necesario introducir la función de demanda de mano de obra:
hd=α2w+β2z2+u2
hd: horas demandadas (demanda de mano de obra)
z2: puede ser la extensión de tierra
La anterior ecuación también es una ecuación estructural, ya que proviene de la teoría: maximización de utilidad de los empleadores
Se tiene que:
En el análisis econométrico, las dos ecuaciones se vinculan sólo debido a que el salario y las horas observadas se determinan por la intercepción entre la oferta y la demanda. En otras palabras, para cada región i, las horas observadas hi y el salario observado wi están determinados por la condición de equilibrio
his=hid
Dado a que se observan sólo las horas laboradas del equilibrio, entonces las horas observadas se denotan con hi
Al combinar la condición de equilibrio con las ecuaciones de oferta y demanda se obtiene el sistema:
hi=α1wi+β1zi1+ui1
hi=α2wi+β2zi2+ui2
Estas dos ecuaciones constituyen un modelo de ecuaciones simultáneas (MES)
Características del MES:
Otro ejemplo de MES: índice de homicidios y tamaño de la fuerza policial
Cuánta más fuerza policial los índices de crime disminuyen. Esta relación se puede escribir como:
murdpc=β10+α1polpc+β11incpc+u1
murdpc: homicidios
polpc: número de policias
incpc: ingreso (se asume exógeno)
La pregunta que surge es: ¿es el número de policías es exógena? Probablemente no. El gasto en policias está determinado, al menos parcialmente, por su nivel de crimen. Esto implica la siguiente ecuación:
polpc=β20+α2murdpc+otros factores
Aunque sólo interesa la primera ecuación, es necesaria saber con precisión como se especifica la segunda con el fin de estimar la primera. Surge entonces un MES
Cuando una variable explicativa se determina en forma simultánea con la variable dependiente, dicha variable explicativa estará correlacionada con el término de error, con lo cual las estimaciones por MCO serán sesgadas e inconsistentes
Consideremos el siguiente modelo estructural de dos ecuaciones
y1=α1y2+β1z1+u1 y2=α2y1+β2z2+u2
z1 y z2 son exógenas (no se correlacionan con los errores)
Para mostrar que y2 se correlaciona con u1, se resuelven las dos ecuaciones para y2 en términos de las variables exógenas y el término de error
Insertando (1) en (2) y despejando y2 se obtiene:
y2=α2(α1y2+β1z1+u1)+β2z2+u2
(1−α2α1)y2=α2β1z1+β2z2+α2u1+u2
Suponiendo que α2α1≠1 para que se puede resolver para y2 y dividiendo por 1−α2α1, se tiene:
y2=π21z1+π22z2+ν2
π21=α2β1/(1−α2α1), π22=β2/(1−α2α1) y ν2=(α2u1+u2)/(1−α2α1)
y2 está expresada en términos de las variables exógenas y los términos de error, y representa la ecuación de la forma reducida para y2
π21 y π22 representan los parámetros de la forma reducida y están en función, no lineal, de los parámetros estructurales. El error de la forma reducida ν2 es una función lineal de los términos de error estructurales u1 y u2
Recordemos que el interés principal es estimar consistentemente la ecuación (1) a partir de los MCO y esto sólo se lograría si y2 y u1 no están correlacionados. Sin embargo, como muestra la ecuación (3), y2 y u1 están correlacionados, ya que ν2 es una función lineal de u1 y u2
Cuando y2 está correlacionado con u1 debido a la simultaneidad, se dice que MCO sufre de sesgo de simultaneidad
Sabemos que MCO es sesgado e inconsistente cuando se aplica a una ecuación estructural en un sistema de ecuaciones
Del tema anterior se explicó que el método de MC2E se puede utilizar para resolver el problema de variables explicativas endógenas
La pregunta que surge al aplicar MC2E a un MES, teniendo en cuenta que se tiene una ecuación estructural para cada variable endógena, es si hay suficientes variables instrumentales para estimar el sistema ⟹ si el sistema se encuentra identificado
Cuando se estima un modelo mediante MCO, la condición clave de identificación es que ninguna variable explicativa esté correlacionada con el término de error
No obstante, si se tiene algunas variables instrumentales, aún se pueden identificar (o estimar de manera consistente) los parámetros en una ecuación de MES, tal como con las variables omitidas o el error de medición
Supongamos que tenemos un sistema de oferta y demanda en equilibrio (esto es, qs=qd=q)
q=α1p+β1z1+u1 oferta
q=α2p+u2 demanda La pregunta entonces es ¿cuál de estas dos ecuaciones está identificada? La ecuación de demanda está identificada, mientras que la ecuación de oferta no
La idea es que se puede emplear z1 (esta variable se supone exógena a las ecuaciones de oferta y demanda) como VI para el precio en la ecuación de demanda. Pero ya que z1 aparece en la ecuación de oferta, no se tiene VI alguna para el precio en la ecuación de oferta
En forma general para un sistema de dos ecuaciones:
y1=β10+α1y2+z1ββ1+u1
y2=β20+α2y1+z2ββ2+u2
y1 y y2 son variables endógenas
z1=(z11,z12,...,z1k1) y z2=(z21,z22,...,z2k2) conjuntos de variables exógenas
El hecho de que z1 y z2 contengan, por lo general, diferentes variables exógenas significa que se tienen restricciones de exclusión en el modelo ⟹ variables exógenas que aparecen en la primera ecuación pero no en la segunda y viceversa
La pregunta, entonces, ahora es si es posible estimar los parámetros, por ejemplo, de la primera ecuación? Las condiciones de rango y orden para la identificación nos ayuda a responder esta pregunta
Condición de rango: La primera ecuación en un modelo de dos ecuaciones simultáneas se identifica si, y sólo si, la segunda ecuación contiene al menos una variable exógena (con un coeficiente diferente de cero) excluida de la primera
Condición de orden: para identificar la primera ecuación es necesario que al menos una variable exógena se excluya de esta ecuación
La condición de rango requiere más que la condición de orden, ya que es necesario que al menos una variable exógena excluida de la primera ecuación debe tener un coeficiente diferente de cero en la segunda ecuación ⟹ empíricamente esto se puede verificar mediante una prueba t o F
Otros ejemplos:
Oferta de mano de obra de las mujeres casadas
hours=β10+α1log(wage)+β11educ+β12age+β13kidslt6+β14nwifeinc+u1
log(wage)=β20+α2hours+β21educ+β22exper+β23exper2+u2
La primera ecuación satisface la condición de orden, ya que las dos variables exógenas exper y exper2 se omiten de esta ecuación
La segunda ecuación de salarios, se identifica si al menos una de las variables age, kidslt6 o nwifeinc tiene coeficiente diferente de cero en la primera ecuación
Inflación y apertura
inf=β10+α1open+β11log(pcinc)+u1
open=β20+α2inf+β21log(pcinc)+β22log(land)+u2
Bajo la condición de rango la primera ecuación está identificada siempre y cuando β22≠0, mientras que la segunda no. Pero lo que interesa es la primera ecuación, así que el sistema se podría estimar para determinar los efectos de la apertura sobre la inflación
En términos generales para un sistema de M ecuaciones las condiciones de orden y rango pueden expresarse de la siguiente forma, teniendo en cuenta la siguiente notación:
M = número de variables endógenas en el modelo
m = número de variables endógenas en una ecuación dada
K = número de variables exógenas en el modelo (incluyendo el intercepto)
k = número de variables exógenas en una ecuación dada
Condición de orden (condición necesaria pero no suficiente)
En un modelo de M ecuaciones simultáneas, para que una ecuación esté identificada, el número de variables exógenas excluidas de esa ecuación no debe ser menor que el número de variables endógenas incluidas en la ecuación menos 1, es decir:
K−k≥m−1
Si K−k=m−1, la ecuación está exactamente identificada, pero si K−k>m−1, estará sobreidentificada
Condición de rango (condición necesaria y suficiente)
En un modelo que contiene M ecuaciones con M variables endógenas, una ecuación está identificada si y sólo si puede construirse por lo menos un determinante diferente de cero, de orden (M−1)(M−1), a partir de los coeficientes de las variables (endógenas y exógenas) excluidas de esa ecuación particular, pero incluidas en las otras ecuaciones del modelo
Consideremos el siguiente ejemplo. Sea el siguiente sistema de ecuaciones donde Y son las variables endógenas y X las exógenas:
Y1t−β10−β12Y2t−β13Y3t−γ11X1t=u1t(1)Y2t−β20−β23Y3t−γ21X1t−γ22X2t=u2t(2)Y3t−β30−β31Y1t−γ31X1t−γ32X2t=u3t(3)Y4t−β40−β41Y1t−β42Y2t−γ43X3t=u4t(4)
Para facilitar las identificación se construyen las siguientes tablas:
Ecuación | 1 | Y1 | Y2 | Y3 | Y4 | X1 | X2 | X3 | |
---|---|---|---|---|---|---|---|---|---|
(1) | −β10 | 1 | −β12 | −β13 | 0 | −γ11 | 0 | 0 | |
(2) | −β20 | 0 | 1 | −β23 | 0 | −γ21 | −γ22 | 0 | |
(3) | −β30 | −β31 | 0 | 1 | 0 | −γ31 | −γ32 | 0 | |
(4) | −β40 | −β41 | −β42 | 0 | 1 | 0 | 0 | −γ43 |
Condición de orden:
Ecuación | # de exógenas excluidas (K-k) |
# de endógenas incluidas menos 1 (m-1) |
¿Identificada? | |
---|---|---|---|---|
(1) | 2 | 2 | Exactamente | |
(2) | 1 | 1 | Exactamente | |
(3) | 1 | 1 | Exactamente | |
(4) | 2 | 2 | Exactamente |
Se observa que desde la condición de orden todas las ecuaciones se encuentran identificadas. Ahora es necesario aplicar la condición de rango para determinar en efecto que cada ecuación esté identificada
Consideremos la primera ecuación. Para que esta ecuación esté identificada, se debe obtener por lo menos un determinante diferente de cero de orden 3×3, a partir de los coeficientes de las variables excluidas de esta ecuación, pero incluidas en otras: Y4, X2 y X3. Se tiene entonces la siguiente matriz:
A=[0−γ2200−γ32010−γ43]
El determinante de A es cero, por lo que su rango es menor que 3, con lo cual no se satisface la condición de rango y por tanto no está identificada. Queda para demostrar la condición de rango para las otras ecuaciones y determinar si están o no identificadas (ayuda: la ecuacuón 2 y 3 no están identificadas, mientras que la 4 si lo está)
En resumen, la condición de rango dice si la ecuación bajo análisis está identificada o no, en tanto que la condición de orden expresa si dicha ecuación está exactamente identificada o sobreidentificada
Si existe simultaneidad, los estimadores MCO serán inconsistentes, por lo que un primer análisis puede ser verificar la presencia de simultaneidad
En una prueba de simultaneidad se intenta averiguar si una variable explicativa está correlacionada con el término de error. En este caso se utilizará la prueba de error de especificación de Hausman
Analicemos esta prueba con el siguiente modelo del comportamiento del gasto gubernamental de Estados Unidos. Se tiene el siguiente modelo de ecuaciones simultáneas:
EXP=β1+β2AID+β3INC+β4POP+ui AID=δ1+δ2EXP+δ3PS+vi
EXP = gasto público de los gobiernos estatales y locales (endógena); AID = nivel de ayuda mediante subsidio federal (endógena); INC = ingreso de los estados (exógena); POP = población estatal (exógena); PS = población estudiantil de primaria y secundaria (exógena); u y v términos de error
Aquí el interés es estimar el efecto de las ayudas federales sobre el gasto público estatal, es decir, que la ecuación principal es la primera. Sin embargo, es necesario corroborar la existencia de simultaneidad entre EXP y AID
El test de Hausman comprende los siguientes pasos:
Mínimos Cuadrados Indirectos (MCI)
Cuando una ecuación estructural se encuentra exactamente identificada, el método para obtener las estimaciones de los coeficientes estructurales a partir de las estimaciones por MCO de los coeficientes en forma reducida se conoce como Método de Mínimos Cuadrados Indirectos (MCI)
MCI comprende tres pasos:
Limitaciones
Mínimos Cuadrados en Dos Etapas (MC2E)
Mínimos Cuadrados en Dos Etapas (MC2E)
Consideremos el siguiente ejemplo de oferta y demanda para explicar el método
Modelo estructural
q=α2p+ϵ oferta
q=β2p+β3y+β4w+u demanda
Forma reducida
q=π12y+π13w+v1
p=π22y+π23w+v2
Se observa que la ecuación de oferta se encuentra sobreidentificada, por lo que los MCI no llevarán a estimaciones únicas de los parámetros. La ecuación de demanda no se encuentra identificada, pero asumamos que el parámetro α2 de la ecuación de oferta es el de interés
Otro proceso de estimación de α2 es el de variables instrumentales. Sin embargo, si elegimos éste enfoque, tendríamos que elegir entre dos estimadores del parámetro α2: el primero utilizará y como instrumento y el segundo usaría w
Dado que ambos estimadores son consistentes, es necesario un criterio para elegir entre los dos. Un procedimiento razonable (y eficiente) implica elegir como un instrumento un promedio ponderado de las dos variables exógenas, eligiendo los pesos para maximizar la correlación entre el instrumento nuevo y p
Para obtener este instrumento, se realiza la regresión de p sobre y y w, y se calculan los valores ajustados ˆp que sería el instrumento. Luego se obtiene el estimador de α2:
ˆα2=∑ˆpq∑ˆpp
Mínimos Cuadrados en Dos Etapas (MC2E)
De manera formal, MC2E funciona de la siguiente forma:
Etapa 1: la ecuación de la forma reducida para p se estima usando MCO, esto es, la regresión de la variable endógena sobre todas las variables exógenas del sistema. A partir de esta regresión se determina los valores ajustados de la variable endógena ( ˆp)
Los valores ajustados por construcción serán independientes de los términos de error ϵ y u. El proceso de la primera etapa permite construir una variable que se relaciona en forma lineal con la variable explicativa que es endógena y es depurada de cualquier correlación con el término de error en la ecuación de la oferta
Etapa 2: Se estima la ecuación estructural de interés (ecuación de oferta) reemplezando la variable endógena ( p ) con la variable ajustada calculada en la primera etapa ( ˆp )
El uso de MCO en esta segunda etapa producirá un estimador consistente del parámetro de oferta α2, pero es necesario ajustar los errores estándar de las estimaciones por la inclusión de variables predichas en el modelo
MC2E elimina el problema de excesivos instrumentos con el uso de combinaciones de las variables exógenas para crear un nuevo instrumento
Cuando una ecuación es idenficada exactamente, la estimación por MC2E es idéntica a los MCI y a la de VI
Cuando una ecuación no está identificada, MC2E no es posible
Mínimos Cuadrados en Dos Etapas (MC2E)
Limitaciones
Mínimos Cuadrados en Tres Etapas (MC3E)
Zellner y Theil (1962) consideran la ineficiencia de los MC2E e implementan el mecanismo denominado Mínimos Cuadrados en Tres Etapas
MC3E es más eficiente asintóticamente que el estimador por MC2E
MC3E implica la aplicación de estimación de mínimos cuadrados generalizados a un sistema de ecuaciones, cada una de las cuales se ha estimado primero usando MC2E
MC3E funciona de la siguiente forma:
Consideraciones
El modelo aparentemente no relacionado (SUR, seemingly unrelated model) consiste de una serie de variables endógenas que son consideradas como un grupo debido a que tienen una relación conceptual estrecha entre sí
Como ejemplo, consideremos 5 firmas de acero: GM, Chrysler, GE, Westinghouse y US steel. Los datos consisten de series de tiempo de 20 años para las siguientes variables:
Iit = inversión bruta
Fit = valor de mercado de la firma al final del año previo
Cit = valor de las existencias de planta y equipo de la firma al final del año previo
donde i=1,...,5, t=1935,...1954. En cualquier momento t se pueden escribir las 5 ecuaciones:
I1t=β10+β11F1t+β12C1t+ϵ1t ................................ I5t=β50+β51F5t+β52C5t+ϵ5t
Cada ecuación puede ser estimada individualmente tomando t=1935,...1954 (cada firma lleva a cabo su propia política de inversión, por tanto se puede tratar estas ecuaciones como no relacionadas)
Por otro lado, todas las actividades económicas toman lugar en el mismo ambiente económico, por tanto puede esperarse que los 5 shocks ϵ1t,...,ϵ5t estén correlacionados
El procedimiento que toma en cuenta la correlación entre los errores en un sistema de ecuaciones, es llamado SUR
Generalmente, éste método de estimación difiere de los MCO excepto en dos caso:
Usando SUR para estimar conjuntamente las ecuaciones del sistema, permitiendo por correlación entre los errores de las ecuaciones, mejorará la eficiencia de la estimación
Limitación
Si existe una variable omitida o endógena en una de las ecuaciones, la estimación por SUR no será insesgada y consistente para cualquiera de las ecuaciones
El modelo general
La estimación SUR es la aplicación de la estimación de mínimos cuadrados generalizados a un grupo de ecuaciones aparentemente no relacionadas
Las ecuaciones están relacionadas por medio de las covarianzas no cero asociadas con los términos de error a lo largo de diferentes ecuaciones en un punto determinado en el tiempo
Generalizando el modelo a un sistema de G ecuaciones se tiene:
Yi=Xiββi+ui,i=1,2,...,G
Combinando las G ecuaciones se tiene
[Y1Y2...YG]=[X10...00X2...0............00...XG][ββ1ββ2...ββG]+[u1u2...uG]
El modelo general
De acuerdo con los supuestos del modelo aparentemente no relacionado, no hay autocorrelación dentro de las ecuaciones, pero existe correlación de ecuaciones cruzadas, es decir
ΩΩ=E(uu′)=[E(u1u′1)E(u1u′2)...EE(u1u′G)E(u2u′1)E(u2u′2)...E(u2u′G)............E(uGu′1)E(uGu′2)...E(uGu′G)]
=[σ11Iσ12I...σ1GIσ21Iσ22I...σ2GI............σG1IσG2I...σGGI]
Se observa que es una matriz no diagonal como en el caso de la matriz var-cov de los errores en la estimación MCO
Algunas aplicaciones importantes en economía de la estimación de modelos por SUR incluye:
El modelo general
La estimación más eficiente se obtiene aplicando la estimación de mínimos cuadrados generalizados (MCG) para obtener:
ˆβˆβMCG=(X′ΩΩ−1X)−1(X′ΩΩ−1Y)
Para un sistema de dos ecuaciones tendremos:
ˆβˆβMCG=[σ11X′1X1σ12X′1X2σ21X′2X1σ22X′2X2]−1[σ11X′1Y1σ12X′1Y2σ21X′2Y1σ22X′2Y2]
En la práctica, deben estimarse los elementos de ΩΩ. Zellner (1962) recomienda el siguiente procedimiento de estimación por MCG factibles:
ˆσii=N∑n=1e2in/(N−Ki),i=1,...,G ˆσij=N∑n=1einejn/N,i,j=1,...,G,i≠j
donde ein representan los residuales MCO de la i-ésimia ecuación. ˆσii es el estimador insesgado para σii, y ˆσij es el estimador consistente y asintóticamente eficiente (aunque no insesgado) de σij
Pruebas para detectar correlación contemporánea
Ya que la no diagonalidad de ΩΩ es el principal supuesto del método de estimación SUR, es importante probar H0:ΩΩ es diagonal ( σ12=σ13=...=σ1G=σ23=...=σ(G−1)G=0)
Breusch y Pagan (1980) derivaron una forma simple para realizar esta prueba y se basa en construir un estadístico de multiplicadores de lagrange (LM) sobre los coeficientes de correlación muestral de los residuales MCO. El estadístico tiene la forma:
LM=NG∑i=2i−1∑j=1r2ij∼χ2G(G−1)/2
donde N es el número de observaciones, G es el número de ecuaciones y rij=ˆσij/(ˆσiiˆσjj)1/2. Las ˆσ's son calculadas de los residuales MCO
En este ejercicio aplicado se va a analizar el comportamiento del gasto gubernamental para los estados de los Estados Unidos.
El sistema de ecuaciones que se va a estimar es:
EXPi=β1+β2AIDi+β3INCi+β4POPi+u1i
AIDi=δ1+δ2EXPi+δ3PSi+u2i
EXP: gasto público de los gobiernos estatales y locales (endógena)
AID: nivel de ayuda mediante subsidio federal (endógena)
INC: ingreso de los estados (exógena)
POP: población estatal (exógena)
PS: población estudiantil de primaria y secundaria (exógena)
u1i y u2i: términos de error
En los siguientes links se encuentran los datos y el código utilizado en R:
EXPi=β1+β2AIDi+β3INCi+β4POPi+u1i
AIDi=δ1+δ2EXPi+δ3PSi+u2i
Determinando si las ecuaciones están identificadas:
Condición de orden: para que una ecuación esté identificada es necesario
que al menos una variable exógena se excluya de la ecuación analizada
La ecuación (1) satisface la condición de orden ya que PS se encuentra excluida ⟹ exactamente identificada
La ecuación (2) satisface la condición de orden ya que INC y POP se encuentran excluidas ⟹ sobreidentificada
Condición de rango: una ecuación está identificada si, y sólo si, la segunda ecuación contiene al menos una variable exógena (con un coeficiente diferente de cero) excluida de la primera
Para corroborar esta condición se estiman por MCO las ecuaciones de la forma reducida:
EXPi=π1+π22INCi+π3POPi+π4PSi+ϵ1
AIDi=π5+π6INCi+π7POPi+π8PSi+ϵ2
Y luego se prueba que los coeficientes de las variables excluidas sean estadísticamente significativas
Cargando las librerias
library(stargazer); library(car); library(readxl); library(AER); library(systemfit)
Leyendo los datos
setwd("C:/Users/ggarci24/OneDrive - Universidad EAFIT/EAFIT/Cursos EAFIT/Econometria II/R/Tema 10")data <- read_excel("EX73.xlsx")
Estimamos por MCO la ecuación (1) y (2) en la forma reducida y corroboramos que el coeficiente asociado a PS, INC y POP sean o no estadísticamente significativos
EXP.reducida <- lm(EXP~INC+POP+PS, data=data)AID.reducida <- lm(AID~INC+POP+PS, data=data)
linearHypothesis(AID.reducida, "PS = 0")
Linear hypothesis testHypothesis:PS = 0Model 1: restricted modelModel 2: AID ~ INC + POP + PS Res.Df RSS Df Sum of Sq F Pr(>F) 1 47 2496640 2 46 2265748 1 230893 4.6877 0.0356 *---Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
linearHypothesis(EXP.reducida, c("INC = 0", "POP = 0"))
Linear hypothesis testHypothesis:INC = 0POP = 0Model 1: restricted modelModel 2: EXP ~ INC + POP + PS Res.Df RSS Df Sum of Sq F Pr(>F) 1 48 108094974 2 46 27978053 2 80116921 65.862 3.157e-14 ***---Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El coeficiente de PS es estadísticamente significativo, lo cual indica que la ecuación (1) está identificada. Los coeficientes de INC y POP son estadísticamente significativos, lo cual indica que la ecuación (2) está identificada
Prueba de simultaneidad
El test de Hausman comprende los siguientes pasos:
Obtenemos los residuales de las ecuaciones estimadas de la forma reducida
data$w <- residuals(AID.reducida)data$v <- residuals(EXP.reducida)
Estimamos los modelos incorporando los residuales para corroborar la existencia de simultaniedad. Notamos que los coeficientes de w y v son estadísticamente significativos al 10%, con lo cual hay problemas de simultaneidad
hausman1 <- lm(EXP~AID+INC+POP+w, data=data)summary(hausman1)
Call:lm(formula = EXP ~ AID + INC + POP + w, data = data)Residuals: Min 1Q Median 3Q Max -1114.12 -186.07 26.29 87.91 1069.76 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -8.941e+01 8.602e+01 -1.040 0.3041 AID 4.501e+00 7.643e-01 5.889 4.57e-07 ***INC 1.293e-04 4.222e-05 3.062 0.0037 ** POP -5.181e-01 1.118e-01 -4.633 3.09e-05 ***w -1.391e+00 8.023e-01 -1.734 0.0898 . ---Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Residual standard error: 367.3 on 45 degrees of freedomMultiple R-squared: 0.9935, Adjusted R-squared: 0.9929 F-statistic: 1716 on 4 and 45 DF, p-value: < 2.2e-16
hausman2 <- lm(AID~EXP+PS+v, data=data)summary(hausman2)
Call:lm(formula = AID ~ EXP + PS + v, data = data)Residuals: Min 1Q Median 3Q Max -294.040 -43.120 -5.014 72.491 188.044 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 37.32576 23.29099 1.603 0.115872 EXP 0.16408 0.01216 13.490 < 2e-16 ***PS 0.12207 0.05612 2.175 0.034803 * v 0.08774 0.02391 3.670 0.000628 ***---Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Residual standard error: 108.9 on 46 degrees of freedomMultiple R-squared: 0.9843, Adjusted R-squared: 0.9833 F-statistic: 962.6 on 3 and 46 DF, p-value: < 2.2e-16
Estimación de sistemas de ecuaciones
Primero se crea el sistema
eqEXP <- EXP ~ AID + INC + POPeqAID <- AID ~ EXP + PSeq.sys <- list(EXP = eqEXP, AID = eqAID)
MCO: ignorando la estructura de sistema de ecuaciones. Estos es equivalente a estimar cada ecuación por separado
MCO <- systemfit(eq.sys, method = "OLS", data = data)summary(MCO)
MC2E: equivalente a la estimación de variables instrumentales de la ecuación única. Para la estimación por MC2E es necesario tener variables instrumentales para la identificación. Los instrumentos son las variables exógenas
inst <- ~ INC + POP + PSMC2E.1 <- systemfit(eq.sys, method = "2SLS", inst = inst, data = data)summary(MC2E.1)
Note que lo anterior es lo mismo que hacer IV
IV <- ivreg(EXP ~ AID+INC+POP | INC+POP+PS, data=data)summary(IV)
inst1 <- ~ INC + POP + PSinst2 <- ~ INC + POPinstlist <- list(inst1, inst2)MC2E.2 <- systemfit(eq.sys, method = "2SLS", inst = instlist, data = data)summary(MC2E.2)
Modelo SUR
En el modelo SUR los residuales son correlacionados a través de las ecuaciones. La estimación se hace la siguiente forma:
SUR <- systemfit(eq.sys, method = "SUR", data = data)summary(SUR)
Test de Breusch-Pagan
Ho: la matrix de covarianza de los errores es diagonal, las ecuaciones son independientes. Recordemos que el estadístico tiene la forma
LM=NG∑i=2i−1∑j=1r2ij∼χ2G(G−1)/2 donde r=σij/(σiiσjj)1/2
Primero se calcula la matrix var-cov de los residuales estimados. Con la siguiente función nos muestra dicha matriz var-cov y la matriz de correlación de los residuales
summary(MCO, residCov = TRUE, equations = FALSE)
Ahora calculamos el r y lo comparamos con el coeficiente de correlación, deben dar igual
r <- (-25845.3)/((140757.9*14996.3)^(1/2))
Y procedemos calcular el estadístico de prueba
BP <- 50*((r)^2)BPpchisq(BP, df=1, lower.tail = F) # Pvalor de BPqchisq(0.05, df=1, lower.tail = F) # Chi de la tabla al 5% y con 1 gdl
Pvalor = 0, rechazamos Ho, es decir que la estimación SUR es adecuada
Estimando por MC3E el modelo SUR
En la anterior estimación del modelo SUR no se consideró el problema de la variable explicativa endógena. en particular, si las ecuaciones continen variables explicativas endógenas, SUR será sesgado e inconsistente
Así que es necesario estimar por MC3E que toma en cuenta la correlación contemporanea entre los residuales y la existencia de una variable explicativa endógena. Esto es como IV en el SUR
Las tres etapas serían:
Regrese cada variable endógena sobre todas las varaibles exógenas y calcule los valores predichos de las varaibles endógenas
Estime las ecuaciones estructurales por MCO, reemplazando las variables endógenas que se encuentran como explicativas por sus valores predichos de la primera etapa
Calcule las varianzas y covarianzas estimadas de los residuales de la etapa 2, y reestime las ecuaciones estructurales usando el método SUR
La estimación la podemos hacer de la siguiente forma:
MC3E <- systemfit(eq.sys, method = "3SLS", inst = inst, data = data)summary(MC3E)
Keyboard shortcuts
↑, ←, Pg Up, k | Go to previous slide |
↓, →, Pg Dn, Space, j | Go to next slide |
Home | Go to first slide |
End | Go to last slide |
Number + Return | Go to specific slide |
b / m / f | Toggle blackout / mirrored / fullscreen mode |
c | Clone slideshow |
p | Toggle presenter mode |
t | Restart the presentation timer |
?, h | Toggle this help |
s | Toggle scribble toolbox |
Esc | Back to slideshow |