FRANCISCO PARRA RODRÍGUEZ (Doctor en Economía. Universidad Nacional de Educación a Distancia) ECONOMETRÍA APLICADA I Econometria Aplicada I by Francisco Parra Rodríguez is licensed under a Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional License.
307
Embed
ECONOMETRÍA APLICADA I - Econometria aplicada · Máster en Economía Aplicada y Programa Modular Economía Aplicada. La parte que redacté de manual de Econometría y Econometría
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
FRANCISCO PARRA RODRÍGUEZ
(Doctor en Economía. Universidad Nacional de Educación a Distancia)
ECONOMETRÍA APLICADA I
Econometria Aplicada I by Francisco Parra Rodríguez is licensed under a Creative Commons
Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional License.
ÍNDICE
Parte I
PRESENTACIÓN ........................................................................................................................................ 4 1. LA ECONOMETRÍA: HISTORIA Y METODOLOGÍA .................................................................... 6
1.1. LOS ORÍGENES DE LA ECONOMETRIA ............................................................................... 6 1.2. LOS MODELOS ECONOMÉTRICOS...................................................................................... 12 1.3. LA METODOLOGÍA ECONOMÉTRICA ................................................................................ 14
2. EL MODELO LINEAL GENERAL .................................................................................................. 18 2.1. INTRODUCCIÓN ...................................................................................................................... 18 2.2. REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS MÍNIMOS CUADRADOS ORDINARIOS. ...................................................................................................................................... 18 2.3. REGRESIÓN LINEAL MÚLTIPLE .......................................................................................... 25 2.4. PROPIEDADES ESTADISTICAS DEl ESTIMADOR MÍNIMO CUADRADO. .................... 30 2.5. COEFICIENTES DE DETERMINACIÓN Y CORRELACIÓN PARCIAL ............................. 31
2.5.1. Coeficiente de determinación ............................................................................................. 31 2.5.2. Coeficiente de correlación parcial ...................................................................................... 35
2.6. INFERENCIA ACERCA DE LOS ESTIMADORES ................................................................ 35 2.6.1. Intervalos De Confianza ..................................................................................................... 36 2.6.2. Contrastes de Hipótesis ...................................................................................................... 39
2.7. TABLA DE ANALIS DE LA VARIANZA (ANOVA) ............................................................. 43 2.8. PREDICCIÓN EN EL MODELO DE REGRESIÓN ................................................................ 44 2.9. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON EXCEL ........................ 46 2.10. ESTIMACIÓN DE UN MODELO DE REGRESIÓN LINEAL CON R ........................... 54 2.11. PROBLEMAS .................................................................................................................... 59
3. EXTENSIONES AL MODELO DE REGRESIÓN LINEAL ............................................................ 62 3.1. INTRODUCCIÓN ...................................................................................................................... 62 3.2. HETEROSCEDASTICIDAD ..................................................................................................... 65
3.2.1. Test de Bartlett ................................................................................................................... 65 3.2.2. Contraste de Goldfeld-Quant .............................................................................................. 66 3.2.3. Contraste de White ............................................................................................................. 69
3.3 AUTOCORRELACIÓN ................................................................................................................... 71 3.3.1. Contraste de Durbin-Watson .................................................................................................... 71 3.3.1. Contraste de Breush-Godfrey ................................................................................................... 75
3.5.1. Omisión de una variable relevante...................................................................................... 80 3.5.2. Inclusión de una variable innecesaria ................................................................................. 81 3.5.3. Especificación funcional incorrecta .................................................................................... 82 3.5.4. Contraste de errores de especificación ................................................................................ 83
4. MODELOS CON ERRORES EN LAS VARIABLES ...................................................................... 95 4.1. INTRODUCCIÓN ...................................................................................................................... 95 4.2. TIPOS DE ERRORES DE MEDIDA ......................................................................................... 96
4.2.1. Errores de medida en la variable endógena ........................................................................ 96 4.2.2. Errores de medida en la variable exógena .......................................................................... 97
4.3. ESTIMACIÓN DE MODELOS CON ERRORES EN LAS VARIABLES ............................. 100 4.4. APLICACIÓN PRÁCTICA ..................................................................................................... 102 4.5. PROBLEMAS .......................................................................................................................... 104
5. MODELOS CON VARIABLES CUALITATIVAS ........................................................................ 107 5.1. MODELOS CON VARIABLES CUANTITATIVAS Y CUALITATIVAS COMO REGRESORES. ................................................................................................................................... 107
5.2. EL EMPLEO DE VARIABLES CUALITATIVAS PARA EL TRATAMIENTO DE LA ESTACIONALIDAD ........................................................................................................................... 122 5.3. APLICACIONES DE LAS VARIABLES CUALITATIVAS A LA REGRESIÓN POR TRAMOS. ............................................................................................................................................ 129 5.4. EL MODELO PROBABILÍSTICO LINEAL .......................................................................... 130 5.5. EL MODELO LOGIT .............................................................................................................. 132 5.6. EL MODELO PROBIT ............................................................................................................ 137 5.7. PROBLEMAS .......................................................................................................................... 142
6. MODELOS CON DATOS DE PANEL ........................................................................................... 145 6.1. INTRODUCCIÓN .................................................................................................................... 145 6.2. ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS DE PANEL ....................... 146 6.3. VENTAJAS Y DESVENTAJAS DE LOS MODELOS DE DATOS DE PANEL .................. 149 6.4. MODELO DE EFECTOS FIJOS ............................................................................................. 151 6.5. MODELO DE EFECTOS ALEATORIOS ............................................................................... 154 6.6. ELECCIÓN DE MODELO DE EFECTOS O EFECTOS ALEATORIOS .............................. 156 6.7. PROBLEMAS .......................................................................................................................... 163
7. MODELOS DE ECUACIONES SIMULTÁNEAS ......................................................................... 165 7.1. INTRODUCCIÓN .................................................................................................................... 165 7.2. FORMA ESTRUCTURAL Y REDUCIDA ............................................................................. 167 7.3. DETECCIÓN DE LA SIMULTANEIDAD. PRUEBA DE HAUSMAN ................................ 172 7.4. IDENTIFICACIÓN DEL SISTEMA ....................................................................................... 177
7.4.1. Condiciones de Orden y Rango en la Identificación ........................................................ 179 7.5. PROBLEMAS .......................................................................................................................... 183
8. MÉTODOS DE ESTIMACIÓN DE MODELOS DE ECUACIONES SIMULTÁNEAS ............... 185 8.1. INTRODUCCIÓN .................................................................................................................... 185 8.2. MÍNIMOS CUADRADOS INDIRECTOS (MCI) ................................................................... 185
8.2.1. Estimación de curvas de oferta y demanda por MCI ........................................................ 188 8.2.2. Estimación de Haavelmo de la propensión marginal al consumo por MCI ...................... 191
8.3. VARIABLES INSTRUMENTALES (VI) ............................................................................... 194 8.3.1. Estimación una función keynesiana de consumo por VI .................................................. 198
8.4. MÍNIMOS CUADRADOS EN DOS ETAPAS (MC2E) ......................................................... 201 8.4.1. Estimación de un modelo de gastos e ingresos por MC2E ............................................... 204
8.5. MODELOS RECURSIVOS ..................................................................................................... 210 8.5.1. Estimación de un Modelo Recursivo de Determinación de Precios y Salarios................. 213
8.6. EJEMPLO PRÁCTICO: ESTIMACIÓN DE UN MODELO EXACTAMENTE IDENTIFICADO POR MCI, VI Y MC2E ........................................................................................... 216 8.7. PROBLEMAS .......................................................................................................................... 223
9. MÉTODOS DE ESTIMACIÓN NO LINEALES ............................................................................ 226 9.1. INTRODUCCIÓN .................................................................................................................... 226 9.2. ESTIMACIÓN DE UN MODELO DE MODELOS NO LINEALES POR MINIMOS CUADRADOS ORDINARIOS. ........................................................................................................... 227 9.3. MÍNIMOS CUADRADOS NO LINEALES ............................................................................ 229
9.3.1. Algoritmo de Newton-Raphson ........................................................................................ 231 9.4. EL ESTIMADOR DE MÁXIMA VEROSIMILITUD ............................................................. 234 9.5. APROXIMACIÓN LINEAL DE TAYLOR ............................................................................ 236 9.6. PROBLEMAS .......................................................................................................................... 240
10. MÉTODOS DE ESTIMACIÓN NO PARAMÉTRICOS ............................................................. 242 10.1. INTRODUCCIÓN ............................................................................................................ 242 10.2. FUNCIÓN NUCLEO ....................................................................................................... 244 10.3. ESTIMADORES DE FUNCIÓN NUCLEO Y POLINOMIOS LOCALES .................... 249 10.4. REGRESIÓN POR SPLINES .......................................................................................... 259 10.5. APROXIMACIÓN POR SERIES DE FOURIER ............................................................ 268 10.6. PROBLEMAS .................................................................................................................. 274
ANEXO I. NOCIONES DE ALGEBRA MATRICIAL .......................................................................... 277 ANEXO II. TABLAS ESTADÍSTICAS .................................................................................................. 293 BIBLIOGRAFÍA ...................................................................................................................................... 302
PRESENTACIÓN
En el año 2004 el Departamento de Economía Aplicada y Estadística de la Universidad Nacional
de Educación a Distancia (UNED) encargó a los entonces profesores de la asignatura econometría
I de Administración y Dirección de Empresas y Económicas, elaborar un texto de econometría
que sirviera de bibliografía básica para la misma, dicho texto que se publicó en Ediciones
Académicas bajo el título de econometría, fue revisado y actualizado en 2007 y editado de nuevo
por Ediciones Académicas pero con un nuevo título: Econometría Aplicada. En lo que sé, el
manual sigue utilizándose como bibliografía en la UNED, ya que en septiembre del 2006 deje de
ser profesor de dicha asignatura. No obstante, durante el tiempo de docencia en la UNED también
participe en otros cursos de posgrado para los cuales también elaboré diferente material docente:
Curso de Contabilidad Nacional y Tablas Input-Output y Curso de Eficiencia y Productividad,
dentro del Programa de Doctorado del Departamento de Economía Aplicada y Estadística, y
Máster en Economía Aplicada y Programa Modular Economía Aplicada.
La parte que redacté de manual de Econometría y Econometría Aplicada se había basado a su vez
en los apuntes de otro curso de estadística y econometría para empleados públicos que impartí
junto a Mauricio Beltrán Pascual dentro de los programas de formación de funcionarios de la
Junta de Castilla y León. El curso se denominaba: Estadística Aplicada a la Administración
Pública, y los materiales del curso acabaron editándose por la Junta de Castilla y León, sin ISBN,
en una serie de Metodologías Estadísticas, bajo el título: Apuntes de Análisis Estadístico
Aplicados a la Administración Pública. La serie tuvo corta vida, ta solo dos números, y con el
tiempo el curso pasó a denominarse Aplicaciones Estadísticas en las Hojas de Cálculo, y Curso
de Estadística Descriptiva y Análisis de Datos con la Hoja de Calculo Excel, cuando se incluyó
en el año 2007 en los programas de formación del Centro de Estudios de la Administración
Regional del Gobierno de Cantabria. En el 2011 se programó el último de aquellos cursos, ya que
en el 2012 pase a impartir la asignatura de Econometría dentro de la licenciatura y grado de
Administración y Dirección de Empresas de la Universidad de Cantabria y andaba escaso de
tiempo.
Dado que había reunido un amplio material de recursos docentes tanto de la asignatura de
econometría I UNED, los cursos de postgrado en los que participe, como en los cursos impartidos
para las administraciones públicas, en 2007 abrí un blog en wordpress:
Http://econometria.wordpress.com/ en el que reuní una parte de aquellos documentos, que
posteriormente fui ampliando bien con el material de otros cursos que me fueron encargados
(Curso de Contabilidad Trimestral) y análisis estadísticos propios basados en Series de Fourier.
Del blog, los recurso más descargados fueros un curso de econometría básica, y otro de
econometría avanzado, que ha sido sucesivamente actualizado con los análisis estadísticos
basados en series de Fourier.
Dado que ha sido ya suficiente el tiempo que ha pasado desde la aparición del primer manual de
econometría editado por ediciones académicas, me propuse actualizar este con los contenidos que
se difunden a través del blog, ampliando los capítulos ya publicados, redactando nuevos capítulos
sobre econometría no parámetrica, cointegración, regresión en dinámica de la frecuencia y el uso
de filtros desestacionalizadores, e incorporando junto a los ejemplos desarrollados en Excel otros
desarrollados en R, software que está ganando mucho terreno en la docencia de la econometría.
Entre dichos materiales se incluye la base teórica de librería en R “descomponer” que elaboré
para extraer tendencias y estacionalidades en series de tiempo en base al periodograma de la serie
temporal. Dado que uno de los contenidos de los cursos de formación para las Administraciones
Públicas era la elaboración de números índices de precios y cantidades, se ha incluido otro
capitulo con estos contenidos, a pesar de que los números indices no es materia de las enseñanzas
de econometría. Al haber aumentado de forma notable el indice de capítulos, se ha dividido este
en dos partes, en la primera se incluyen los capítulos más generales sobre la técnica econométrica
y en una segunda parte los más específicos relativos a las series temporales.
Desde que cree el blog de econometría aplicada, he comprobado que la mayor parte de las
descargas proceden de América Latina, supongo que estos materiales están facilitando de alguna
u otra manera que los jóvenes latinoamericanos puedan disponer de materiales de econometría en
Castellano para completar sus estudios. Este es en definitiva el objetivo último de este manual
facilitar el estudio y la aplicación de la econometría a la comunidad de hispana de la manera más
abierta posible.
1. LA ECONOMETRÍA: HISTORIA Y METODOLOGÍA
1.1. LOS ORÍGENES DE LA ECONOMETRIA
La Econometría es una disciplina independiente de la Estadística mediante la que se trata de
contrastar la validez empírica de la teoría económica mediante modelos matemáticos y
estadísticos. Para lograr este objetivo se utiliza como instrumento básico el modelo econométrico,
el cual trata de ser una representación simplificada del mundo real mediante la que es posible
reproducir el comportamiento y las interrelaciones que se dan entre diversas variables
económicas.
El término 'econometría' fue utilizado por primera vez por Pawel Ciompa en 1910, siendo
rescatado por Frisch en su artículo de 1936 titulado “Note on term ‘Econometrics’”; este autor,
socio fundador de la Econometric Society, le asigna el significado que atribuimos en la actualidad
a este término. Dicho significado queda recogido en el primer artículo de los estatutos de la
mencionada sociedad, y en el mismo se menciona la necesidad del progreso de la teoría
económica mediante la utilización del análisis estadístico y matemático.
En un sentido más formal, se han propuesto a lo largo de la historia diferentes definiciones que
apuntan en la misma dirección e integran los mismos elementos (matemáticas, estadística y datos
económicos). Samuelson, Koopmans y Stone (1954) definen la Econometría como “el análisis
cuantitativo de fenómenos económicos actuales, basado en el desarrollo congruente de teoría y
observaciones, y relacionado por métodos apropiados de inferencia”; Intriligator (1978) señala
que es “la rama de la economía relacionada con la estimación empírica de las relaciones
económicas”. Chow (1983) la define como el “arte y ciencia de usar métodos para la medida de
relaciones económicas”. Stewart y Wallis (1984) consideran que la Econometría es aquella
ciencia que “se ocupa de la medición de las relaciones entre las variables económicas y de la
confrontación de la teoría con la evidencia empírica” . Finalmente, Greene (1993) señala que “es
el campo de la Economía que se refiere a ésta como aplicación de la Estadística Matemática y
los instrumentos de la Estadística Inferencial a la medición empírica de las relaciones postuladas
por la Teoría Económica”.
Si bien el término ‘econometría’ fue reconocido en 1936, se considera a Henry Moore (1914,
1917) el primer autor en efectuar una estimación de relaciones económicas de demanda a partir
de estadísticas económicas. Las regresiones lineales de Moore crearon escuela y entre sus
seguidores cabe destacar a Henry Schultz, Holbrook Working y Paul Douglas, entre otros.
Working (1927) planteó la estimación de mercados en equilibrio, descubrió en sus trabajos los
problemas asociados a los errores en las variables y planteó inicialmente la importancia de las
expectativas. Schultz (1938) publicó un libro íntegramente dedicado a la teoría y análisis de la
demanda en Estados Unidos, demostrando una preocupación permanente por la unión entre teoría
y medida.
La otra área de estudio con interés para los pioneros del análisis estadístico económico, la
constituían los ciclos económicos. Si bien en los trabajos iniciales de Sir William Petty se dejaba
constancia de los ciclos, no será hasta el siglo XIX cuando renacerá la curiosidad por su estudio.
Así, el físico francés Clement Juglar (1819-1905) es el primero en utilizar las series históricas
para el estudio del ciclo en los negocios, descubriendo un ciclo para la inversión de 7 a 11 años
de duración. A este trabajo le siguen los de Kitchin, Kuznets y Kondratieff, identificando un ciclo
de los inventarios de 3 a 5 años, un ciclo de la construcción de 15 a 25 años y un ciclo de
actividades a largo de 45 a 60 años.
En general estos estudios de los ciclos y los emprendidos posteriormente por Mitchell (1927) y
Burns y Mitchell (1947) en el National Bureau of Economic Research, fueron de tipo morfológico
y descriptivo, por lo que las relaciones entre variables constituían un segundo plano de interés.
No servirán, por tanto, de ayuda para el empuje del análisis econométrico ya que sus objetivos y
metodología son diferentes.
Por el contrario, los trabajos de Wright (1915, 1928), Working (1927), Tinbergen (1930) y Frisch
(1933) sobre análisis de la demanda, planteando el problema de la identificación en las relaciones
estructurales entre variables económicas, sientan las bases para el desarrollo econométrico que
culminaría en la creación de la Econometric Society en 1930, de la mano de Fisher, Frisch y Roos.
Dicha sociedad, junto con los trabajos de la Cowles Commission, sentaran las bases de la
Econometría actual.
La importancia asignada a la creación de la Econometric Society se debe a la obtención de una
agrupación de economistas con preocupaciones de tipo cuantitativo, creando un instrumento de
expresión de los mismos mediante la revista Econométrica. En ese momento la Econometría deja
de ser una actividad dispersa, facilitándose el intercambio de información entre investigadores,
convirtiéndose así en un movimiento organizado con un medio para el intercambio de ideas y
resultados.
Una vez creada la Econometric Society era importante disponer de una institución donde localizar
y centralizar las investigaciones sobre la nueva disciplina; éste será el papel a desempeñar por la
Cowles Commission. La Cowles Commission for Research in Economics, era una institución sin
fines lucrativos fundada por Alfred Cowles III, presidente de una sociedad de inversores. Su
objetivo era la aplicación de las matemáticas a la economía con el fin de obtener buenas
predicciones de las cotizaciones en Bolsa.
Sin embargo, no tardarán en aparecer las primeras críticas a los métodos utilizados por los
primeros económetras, Así, podemos encontrar la del propio Keynes juzgando a la econometría
como próxima a la alquimia y sin resultados fiables al considerar el contexto económico
difícilmente modelizable por relaciones matemáticas, o la de Milton Friedman dudando del
método de Tinbergen para seleccionar una teoría económica entre varias estimadas
empíricamente. Asimismo, un alumno de Frisch, Trygve Haavelmo (1943,1944) demuestra la
inconsistencia de la estimación por Mínimos Cuadrados Ordinarios (MCO) y la simultaneidad en
los sistemas macroeconómicos, poniendo de manifiesto la necesidad de cuestionar los
procedimientos basados en MCO. Haavelmo propone la introducción del modelo probabilístico
para sustentar la base de la metodología econométrica, modelo que será adoptado inicialmente
por la Cowles Commission para realizar estimación e inferencia.
En 1950 la Cowles Commission publicó la obra "Statistical Inference in Dynamic Economic
Models", obra elaborada por un equipo de prestigiosos investigadores del que formaron parte
Marschak, Tjalling, Koopmans, Hurwicz, Rubin, Klein y Anderson, que recogía todos los trabajos
y avances realizados en años anteriores y establece las normas básicas de la investigación
econométrica.
Todo el conocimiento acumulado en los años treinta y cuarenta conduce un espectacular
desarrollo de la Econometría durante los años cincuenta; de entre los avances que se producen en
la época cabe destacar los siguientes:
− A mediados de los años cincuenta aparece el método de estimación por Mínimos
Cuadrados en 2 Etapas (MC2E), desarrollado por Theil (1954, 1958) y Bassmann (1957),
el cual debido a su sencillez y facilidad de cálculo gozará de una gran aceptación como
método de estimación de modelos de ecuaciones simultáneas frente a los métodos de
Máxima Verosimilitud con Información Completa (MVIC), propuesto por Koopmans
(1950), y con Información Limitada (MVIL), propuesto por Anderson y Rubin (1949);
posteriormente, a finales de esta década, aparecerá el método de las Variables
Instrumentales (VI) propuesto por Sargan (1958).
− Klein y Goldberger (1955) desarrollan y perfeccionan su trabajo anterior, dando lugar a
uno de los modelos más populares entre los económetras: el modelo Klein-Goldberger,
el cual incorpora novedades a las especificaciones de los modelos macroeconómicos
precedentes, determinando el consumo no solamente a través de la renta, sino también a
través de los efectos riqueza e impuestos, e incorporando por primera vez funciones de
producción.
− Otro acontecimiento de importancia capital en el desarrollo de la econometría y los
grandes modelos estructurales se produce en 1958, cuando los editores de Econometrica
promueven un Congreso bajo el título de “Estimación de ecuaciones simultáneas:
¿Alguna sentencia?” y con el que se pretendía establecer un debate sobre el método
propuesto por la Cowles Commission. Como era de esperar, en dicho Congreso hubo
diferentes posiciones, destacando las de Liu (1960), Hildreth (1960), Christ (1960) y
Klein (1960).
Sin embargo, el esplendor de que gozó la Econometría en los años cincuenta pronto se vería
eclipsado por la crisis que se produjo a comienzos de los años setenta a causa de la elevación de
los precios energéticos, hecho que no pudo ser previsto por ningún modelo econométrico. Ello
afectó directamente al pensamiento económico general y al desarrollo posterior de la
Econometría.
Una de las primeras críticas que se lanzó en contra de los modelos econométricos era que se
habían dejado de lado los planteamientos microeconómicos, por lo que los modelos
econométricos que sólo utilizaban agregados macroeconómicos no podían representar de forma
consistente la conducta racional y optimizadora de los agentes económicos. Esta crítica propició
la incorporación de datos y relaciones microeconómicas, dando lugar a la rama conocida como
Microeconometría. Entre los principales desarrollos alcanzados en esta área cabe destacar los
siguientes:
− Por un lado, los Modelos con Variable Dependiente Cualitativa, en los que se considera
que la variable dependiente admite un conjunto acotado de valores discretos,
generalmente 0 ó 1, mediante los que es posible representar cualidades de los individuos.
Entre los trabajos pioneros en este campo están los de McFadden (1974, 1976) y
Amemiya (1978), en los que se considera una aproximación logística en la estimación de
estos modelos (modelo Logit), mientras que en Albright, Lerman y Manski (1977) se
estudia la aproximación mediante una distribución Normal (modelo Probit).
− Por otro lado, los Modelos de Datos de Panel en los que se incluye información de una
muestra de agentes económicos (individuos, empresas, bancos, ciudades, países, etc.)
durante un determinado período de tiempo, combinando así la dimensión temporal y la
dimensión estructural de los datos. Entre los trabajos más notables de esta línea, cabe
mencionar a Kuh (1959), Balestra y Nerlove (1966), Rosenberg (1973) y Swamy y
Mentha (1977).
Mención aparte merece el espectacular desarrollo que se produce en esta década del análisis
econométrico de series temporales, tanto de tipo multivariante como, especialmente, univariante.
Los modelos univariantes de series temporales giran, de forma mayoritaria, en torno a la
metodología desarrollada por Box y Jenkins (1970). Dichos autores proponen la construcción de
modelos sobre una variable temporal, tratándola como un mecanismo autónomo, cuya gran
ventaja es la mejora de las predicciones a corto plazo. La metodología Box-Jenkins supone la
ruptura con la econometría clásica y con el pensamiento económico en general al no existir una
relación con la teoría económica, por lo que no pueden ser considerados como una alternativa a
los modelos estructurales multiecuacionales.
Sin embargo, la principal crítica realizada durante los años setenta de los métodos econométricos
se centra en la identificación y estimación de modelos multiecuacionales. Partiendo del trabajo
de Muth (1961), Lucas (1972, 1973), Sargent (1973) y Sargent y Wallace (1975), abanderados de
la escuela de las expectativas racionales, plantean la duda sobre la permanencia a lo largo del
tiempo de los parámetros estructurales incluidos en los modelos macroeconómicos, ante cambios
en la política económica del gobierno. Es decir, no existe nada que nos garantice que la estructura
de las reglas de decisión de los agentes económicos quedará inalterada al modificar las reglas de
política económica; y dado que esta estructura es la que representa el modelo, no hay razón para
pensar que los parámetros del mismo sean fijos. Por tanto, si no separamos los parámetros de las
decisiones políticas de los de las relaciones económicas, los modelos que estimemos no podrán
ser utilizados en la toma de decisiones.
La solución adoptada para resolver este problema ha sido la inclusión del proceso de formación
de las expectativas racionales en los modelos econométricos, asegurando la coexistencia entre
expectativas y simulaciones mediante la imposición de restricciones paramétricas entre
ecuaciones.
Finalmente, otra crítica importante a la econometría clásica es la planteada por Sims (1980, 1982)
a comienzos de los años ochenta. La idea central de Sims es que no es necesaria la existencia de
una teoría económica a priori para establecer las restricciones que hagan posible la identificación
de modelos estructurales, ya que no es necesario para la previsión y simulación. Sims propone
una nueva clase de modelos como alternativa a los modelos de ecuaciones simultáneas, los
Vectores Autorregresivos (VAR), en los que no es necesario clasificar las variables en endógenas
y exógenas.
Sin embargo, el desconocimiento que los modelos VAR conllevan sobre las relaciones de tipo
estructural (variables endógenas, exógenas, forma estructural) no permite realizar una
aproximación a los efectos producidos por cambios en la política económica, con lo que su campo
de aplicación se limita a la simple previsión.
A finales de la década pasada. Granger y Newbold (1974) advirtieron sobre el peligro que supone
especificar relaciones espúreas, es decir, relaciones no de causalidad sino de casualidad. Sus
estudios aumentaron el interés por la modelización dinámica y las propiedades a largo plazo de
los modelos econométricos. Su contribución ha dado lugar a los conceptos de cointegración
(Granger, 1981), el test de raiz unitaria (Dickey y Fuller, 1979) y los modelos de corrección de
error (Sargent, 1984).
En los últimos años, en paralelo al avance de las nuevas tecnologías de la información y al
desarrollo de las grandes bases de datos, asistimos a un nuevo cambio conceptual de la teoría
econométrica, poniendose en cuestión los supuestos sobre la normalidad de la distribución de
probabilidad de las variables sujetas al análisis. Otros problemas que enfrentan los investigadores
hoy día son la existencia de datos imperfectos con poca correspondencia con las variables
definidas en los modelos económicos y el poco entendimiento del verdadero significado de
algunas pruebas de hipótesis. En consecuencia, se estan produciendo desarrollos teóricos que
permiten un mayor acercamiento a los procesos económicos tal y como se presentan y que no
exigen el supuesto de normalidad de las variables bajo estudio (o del término de error). Entre los
avances teóricos más recientes que merecen ser mencionados se encuentran el desarrollo de la
econometría no paramétrica y la econometría de series de tiempo no lineales.
1.2. LOS MODELOS ECONOMÉTRICOS
El método científico en las Ciencias Sociales se basa tanto en la deducción como en el
conocimiento empírico. La deducción es el proceso de razonamiento lógico que conduce a unas
conclusiones partiendo de unas premisas o informaciones iniciales. El conocimiento empírico
objetiva el conocimiento a través de la experiencia, de los hechos y de la Historia.
El punto de partida del investigador es la realidad, los hechos económicos tal y como se producen
en la sociedad. La lectura de esos datos y el conocimiento general de la realidad sugerirán al
investigador alguna hipótesis explicativa de las razones por las que los datos ofrecen una
determinada magnitud o evolución. Esas hipótesis son las que permiten organizar los datos y dan
lugar a la formulación de leyes, teorías y modelos.
Las leyes expresan las regularidades encontradas en las series de datos. Las teorías son una forma
de organizar las hipotéticas leyes y facilitan la comprensión del funcionamiento de la economía.
Finalmente, los modelos son construcciones intelectuales basadas en las teorías que permiten
realizar estimaciones de los efectos que pueden derivarse de cambios en los datos reales. Los
modelos constituyen por tanto un puente entre la teoría pura y el mundo real, pudiendo
contrastarse si una determinada teoría es una buena representación de los hechos que trata de
explicar o no.
En el caso de la ciencia económica, los modelos están basados generalmente en supuestos
simplificadores de la realidad y están formados generalmente por ecuaciones matemáticas que
relacionan distintas variables. Dichas variables pueden dividirse en variables exógenas, que son
aquellas cuyos valores deben ser tomados de la realidad; y variables endógenas, que son aquellas
cuyo valor es deducido al operar con las ecuaciones del modelo. Ambos tipos de variables se
relacionan mediante un conjunto de parámetros, los cuales deben ser estimados.
Los modelos permiten realizar predicciones económicas susceptibles de ser contrastadas con la
realidad. Dichas predicciones son probabilísticas y no deterministas; es decir, que con los modelos
económicos no es posible predecir con precisión cuál será, por ejemplo, el consumo exacto que
realizará un determinado individuo, pero sí se puede prever el comportamiento de grandes
agregados de consumidores estableciendo unos márgenes de error entre los que estará
comprendido, o lo que es lo mismo, estimando la probabilidad de que esa predicción se cumpla.
Según el objeto de análisis, podemos distinguir diversos tipos de modelos económicos:
− Modelos Macroeconómicos, cuando los modelos representan la economía en su totalidad;
se trata de modelos en los que generalmente existe poco detalle sectorial con los que se
pretende cuantificar los resultados de las políticas macroeconómicas, como puede ser un
aumento del gasto público o de la imposición directa. La mayoría de los economistas que
realizan predicciones utilizan tales modelos.
− Modelos Microeconómicos, los cuales analizan la situación de una cierta industria,
mercado o institución.
Asimismo, atendiendo al tipo de relaciones que se establecen entre las variables del modelo
podemos distinguir entre:
− Modelos Deterministas, en los que las relaciones exactas entre las variables del modelo
son exactas. Se trata generalmente de modelos en los que se parte de una o varias
variables, denominadas inputs, a partir de las cuales se intenta conocer el comportamiento
de otras variables, denominadas output, mediante diversas transformaciones
matemáticas. Un ejemplo de este tipo de modelos son las tablas input-output de Leontief.
− Modelos Estocásticos, en los que las relaciones entre las variables no son exactas, ya que
existe un componente de carácter aleatorio, denominado término de error o perturbación
aleatoria, que forma parte de las ecuaciones del modelo. Dicho componente aleatorio
recoge todos aquellos aspectos que no quedan especificados en la relación causal
establecida en el modelo tales como determinadas circunstancias acontecidas de carácter
impredecible (shocks) que influyen en la relación estudiada y los errores en la medición,
documentación y computación de las variables observables que aproximan las variables
teóricas del modelo. En la literatura económica, la mayor parte de los modelos
econométricos son de este tipo estocástico.
Según el tipo de datos de las variables utilizadas en el modelo, podemos distinguir entre:
− Modelos de Series Temporales, en los que se utilizan datos recogidos a lo largo de un
determinado periodo de tiempo: días, semanas, meses, trimestres o años. Ejemplos de
este tipo de variables son las cotizaciones diarias de las acciones, el Índice de Precios al
Consumo, la Encuesta de Población Activa, los datos anuales y trimestrales del Producto
Interior Bruto, etc.
− Modelos de Series de Corte Transversal, en los que se utilizan datos referidos a diferentes
individuos en un mismo momento del tiempo. Ejemplos de datos transversales serían los
productos consumidos por diferentes familias en un determinado año, las ventas que
realizan diversas empresas que forman una determinada industria en un determinado
trimestre, el paro registrado en los municipios españoles en un determinado semestre, etc.
− Modelos de Datos de Panel, en los que se combinan datos de diversos individuos
recogidos a lo largo del tiempo.
Considerando la existencia o no de retardos de las variables incluidas en el modelo podemos
diferenciar entre:
− Modelos Estáticos, cuando las relaciones entre las variables del modelo tienen lugar en
el mismo instante del tiempo tanto para la variable endógena como para todas las
variables explicativas del modelo.
− Modelos Dinámicos, cuando las relaciones entre las variables del modelo están referidas
a diferentes momentos en el tiempo, de forma que un modelo dinámico se construye con
variables retardadas.
Finalmente, según el número de variables endógenas que deseemos explicar podemos distinguir
entre:
− Modelos Uniecuacionales, que constan de una única variable endógena.
− Modelos Multiecuacionales, que poseen varias variables endógenas, algunas de las cuales
pueden ser a su vez variables explicativas en otras ecuaciones.
1.3. LA METODOLOGÍA ECONOMÉTRICA
En términos generales, la metodología econométrica tradicional considera los siguientes pasos en
lo referente a la elaboración de modelos:
1. Planteamiento de la teoría o hipótesis: generalmente se utiliza una construcción teórica
de la Macroeconomía y/o Microeconomía, como por ejemplo la función keynesiana de
consumo, la curva de Phillips, la teoría de la demanda del consumidor, etc.
2. Especificación: el siguiente paso es establecer la relación formal entre las variables a que
da lugar la teoría. Dicha relación se establece en forma matemática funcional, mediante
una ecuación o un sistema de ecuaciones. Las variables que reciben los efectos son las
variables endógenas, las cuales figuraran a la izquierda de las igualdades, mientras que
las que producen los efectos, son las denominadas variables exógenas, las cuales aparecen
en el lado derecho de las ecuaciones. Los efectos de cada variable exógena se cuantifican
a través de una serie de parámetros que debemos estimar. Asimismo, en cada ecuación
del modelo existirá un término de error o perturbación que recoge los efectos aleatorios
y que tendrá unas propiedades probabilísticas definidas.
Una vez establecida la relación funcional matemática, deberemos seleccionar datos de los
que dispongamos nos servirán para representar los valores de las variables teóricas. Por
ejemplo, si incluimos en el modelo como variable teórica la renta tendremos que elegir
los datos que utilizaremos para representar dicha variable de entre las encuestas de que
dispongamos: la renta familiar disponible, la renta interior, la renta nacional, etc. En
algunas ocasiones, puede ocurrir que no exista una variable estadística que responda a los
requisitos que exijamos, por lo que deberemos considerar la existencia de un posible error
de observación.
En definitiva, para la especificación de un modelo completo habrá que especificar
claramente lo siguiente:
− variables endógenas teóricas (y sus respectivos valores observados)
− variables exógenas teóricas (y sus respectivos valores observados)
− perturbaciones aleatorias (no observables)
− errores de observación en las variables endógenas
− errores de observación en las variables exógenas.
3. Selección de datos: una vez hemos especificado el modelo procederemos a la obtención
de un número de suficiente de datos que tengan las siguientes características:
− Suficientes: como mínimo para poder realizar la estimación, el número de
observaciones debe ser igual al número de parámetros que queremos estimar;
de lo contrario, la estimación obtenida no resultará fiable.
− Homogéneos: los datos deben estar expresados de una forma homogénea;
esto quiere decir que todos deben estar expresados en las mismas magnitudes
o valores y tienen que haber sido obtenidos por procedimientos estadísticos
semejantes. Asimismo, si fuera necesario, todas las variables deberán estar
corregidas de la misma manera de determinados efectos que se dan en las
variables económicas como la tendencia o la estacionalidad.
− Actuales: la falta de actualidad en los datos es un problema grave, en
particular si el modelo que construimos tiene como finalidad predecir los
valores futuros o realizar simulaciones de política económica.
4. Estimación: se trata del procedimiento utilizado para obtener el valor de los parámetros
del modelo. Habitualmente la técnica utilizada es el análisis de regresión que incluye
diferentes técnicas: Mínimos Cuadrados Ordinarios (MCO), Mínimos Cuadrados
Indirectos (MCI), Variables Instrumentales (VI), Mínimos Cuadrados en 2 Etapas
(MC2E), Mínimos Cuadrados Generalizados (MCG), etc.
Las técnicas econométricas requieren realizar cálculos a veces muy complejos, por ello
es de gran utilidad el auxiliarnos de herramientas como hojas de cálculo (Excel, Lotus
123, etc.) y programas estadísticos y econométricos (EViews, SPSS, SAS, etc.)
5. Validación: una vez que se han estimado los parámetros del modelo, habrá que verificar
que los valores obtenidos concuerdan con los postulados de la teoría que se ha utilizado
para la construcción del modelo.
La validación del modelo se realiza mediante la técnica estadística de inferencia o
contraste de hipótesis, que consiste en analizar mediante pruebas estadísticas la bondad
del ajuste y la significatividad estadística de los valores estimados, de tal forma que si el
modelo no ha dado los resultados esperados deberá perfeccionarse mediante:
− Un cambio en la forma matemática funcional del modelo.
− Incluyendo en el modelo alguna variable explicativa que haya sido omitida.
− Reemplazando las observaciones utilizadas para representar las variables
endógenas y explicativas por otras que posean un menor error de observación.
6. Utilización: una vez validado, el modelo econométrico puede ser utilizado para diversas
tareas tales como:
− Análisis estructural: cuantificar las relaciones que entre las variables endógenas
y exógenas.
− Predicción: dados unos valores de las variables explicativas, podemos obtener
mediante el modelo estimado el valor futuro que tomará la variable endógena.
− Simulación o evaluación de políticas: efectos que tienen sobre la variable
endógena (variable objetivo) las diferentes estrategias que se planteen sobre las
variables explicativas (variables de control).
2. EL MODELO LINEAL GENERAL
2.1. INTRODUCCIÓN
La regresión lineal es la técnica básica del análisis econométrico. Mediante dicha técnica tratamos
de determinar relaciones de dependencia de tipo lineal entre una variable dependiente o endógena,
respecto de una o varias variables explicativas o exógenas. Gujarati (1975), define el análisis de
regresión como el estudio de la dependencia de la variable dependiente, sobre una o más variables
explicativas, con el objeto de estimar o predecir el valor promedio poblacional de la primera en
términos de los valores conocidos o fijos (en medias muestrales repetidas) de las últimas.
En este capitulo abordaremos el estudio del caso de una única ecuación de tipo lineal con una
variable dependiente y una independiente, y la generalización del modelo al caso de múltiples
variables exógenas. Las extensiones del modelo lineal general se analizaran en capítulos
siguientes.
2.2. REGRESIÓN LINEAL SIMPLE. EL MÉTODO DE LOS
MÍNIMOS CUADRADOS ORDINARIOS.
Partimos de la existencia de una relación lineal entre una variable endógena (Y) y k variables
exógenas (Xi):
ikikiii eXXXY +++++= ββββ ...22110
Nuestro objetivo consiste en estimar los parámetros βi de la ecuación anterior a partir de los datos
muestrales de los que disponemos. Para ello utilizaremos el método de los Mínimos Cuadrados
Ordinarios (MCO), pero antes de ver en que consiste este método debemos plantear ciertas
hipótesis sobre el comportamiento de las variables que integran el modelo.
La variable et la denominamos término de perturbación o error, y en ella recogemos todos aquellos
factores que pueden influir a la hora de explicar el comportamiento de la variable Y y que, sin
embargo, no están reflejados en las variables explicativas, Xi. Estos factores deberían ser poco
importantes, ya que no debería existir ninguna variable explicativa relevante omitida en el modelo
de regresión. En caso contrario estaríamos incurriendo en lo que se conoce como un error de
especificación del modelo. El término de perturbación también recogería los posibles errores de
medida de la variable dependiente, Y.
De lo anterior se desprende que, a la hora de estimar los parámetros del modelo, resultará de vital
importancia que dicho término de error no ejerza ninguna influencia determinante en la
explicación del comportamiento de la variable dependiente. Por ello, si el modelo esta bien
especificado, cuando se aplica el método de Mínimos Cuadrados Ordinarios, cabe realizar las
siguientes hipótesis de comportamiento sobre el término de error:
1. La esperanza matemática de et es cero, tal que E(ei) = 0. Es decir, el comportamiento del
término de error no presenta un sesgo sistemático en ninguna dirección determinada. Por
ejemplo, si estamos realizando un experimento en el cual tenemos que medir la longitud
de un determinado objeto, a veces al medir dicha longitud cometeremos un error de
medida por exceso y otras por defecto, pero en media los errores estarán compensados.
2. La covarianza entre ei y ej es nula para ji ≠ tal que E(ei·ej) = 0. Ello quiere decir que el
error cometido en un momento determinado, i, no debe estar correlacionado con el error
cometido en otro momento del tiempo, j, o dicho de otro modo, los errores no ejercen
influencia unos sobre otros. En caso de existir este tipo de influencia o correlación, nos
encontraríamos ante el problema de la autocorrelación en los residuos, el cual impide
realizar una estimación por Mínimos Cuadrados válida.
3. La matriz de varianzas y covarianzas del término de error debe ser escalar tal que Var(ei)
= σ2I, i=1,…,n, donde I es la matriz unidad. Dado que siempre que medimos una
variable, se produce un cierto error, resulta deseable que los errores que cometamos en
momentos diferentes del tiempo sean similares en cuantía. Esta condición es lo que se
conoce como supuesto de homocedasticidad que, en caso de no verificarse, impediría un
uso correcto de la estimación lineal por Mínimos Cuadrados.
Estas hipótesis implican que los errores siguen una distribución Normal de media cero y varianza
constante por lo que, dado su carácter aleatorio, hace que los errores sean por naturaleza
impredecibles.
Asimismo, las variables incluidas en el modelo deben verificar que:
1. El comportamiento de la variable independiente Y se ajusta al modelo lineal durante todo
el periodo muestral, es decir, no se produce un cambio importante en la estructura de
comportamiento de Y a lo largo de la muestra considerada.
2. Las variables explicativas, Xi, son no estocásticas, es decir, son consideradas fijas en
muestreos repetidos.
3. El número de variables explicativas, k, siempre debe ser menor que el tamaño muestral,
n. Es decir, siempre debemos disponer de más observaciones que parámetros haya en el
modelo (coeficientes β).
Partiendo de la relación lineal más sencilla:
iii eXY ++= 110 ββ
Si suponemos que se verifican los supuestos anteriores, la estimación mínimo cuadrática de los
parámetros β0 y β1, dará como resultado gráfico una recta que se ajuste lo máximo posible a la
nube de puntos definida por todos los pares de valores muestrales (Xi,Yi), tal y como se puede
apreciar en el Figura 2.1.
Fig. 2.1. Nube de puntos o gráfico de dispersión con variables relacionadas linealmente
El término de error, ei, puede ser entendido, a la vista del gráfico anterior, como la distancia que
existe entre el valor observado, Yi, y el correspondiente valor estimado, que sería la imagen de
Xi en el eje de ordenadas. El objetivo de la estimación por Mínimos Cuadrados Ordinarios es,
precisamente, minimizar el sumatorio de todas esas distancias al cuadrado; es decir1:
∑ ∑∑= ==
−−=−=n
i
n
iiii
n
iii XYYYeMin
1 1
210
2
1
2 )ˆˆ()ˆ( ββ
Derivando esta expresión respecto a los coeficientes 0β y 1β e igualando a cero obtenemos el
sistema de ecuaciones normales:
XYXnY o
n
ii
n
ii 1
110
1
ˆˆˆˆ ββββ +=⇒+= ∑∑==
∑∑∑===
+=n
ii
n
ii
n
iii XXXY
1
21
10
1
ˆˆ ββ
1
Los parámetros y variables que llevan encima un símbolo de acento circunflejo (^) indican que son estimadas por lo que no se corresponden con el valor real del parámetro sino con el calculado por nosotros.
donde n representa el tamaño muestral y X e Y representan las medias de dichas variables.
Resolviendo dicho sistema de ecuaciones obtenemos la solución para los parámetros a y b:
( )( )
( )XY
XX
YYXX
o
n
ii
n
iii
1
1
2
11
ˆˆ
ˆ
ββ
β
−=
−
−−=
∑
∑
=
=
Ejemplo 2.1.
Supongamos que el director de una empresa piensa que la demanda de un producto que él
comercializa depende únicamente del precio de venta al público. Para estudiar la demanda de
este producto pretende estimar el siguiente modelo:
ttt eXY ++= 10 ββ
donde Yt es la cantidad vendida anualmente del bien Y en el año t, y Xt es el precio medio al cual
se vendió el bien Y durante el año t. Se dispone de los siguientes datos muestrales:
Año Yt Xt
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
10
12
13
14
15
17
20
21
22
20
19
18
16
15
15
14
14
13
12
13
A partir de estos datos iniciales podemos calcular la siguiente tabla:
Yt Xt ( )tY Y− )( XX t − ( )·( )t tY Y X X− − 2)( XX t −
2)( YYt −
10 19 -6.4 4.1 -26.24 16.81 40.96
12 18 -4.4 3.1 -13.64 9.61 19.36
13 16 -3.4 1.1 -3.74 1.21 11.56
14 15 -2.4 0.1 -0.24 0.01 5.76
15 15 -1.4 0.1 -0.14 0.01 1.96
17 14 0.6 -0.9 -0.54 0.81 0.36
20 14 3.6 -0.9 -3.24 0.81 12.96
21 13 4.6 -1.9 -8.74 3.61 21.16
22 12 5.6 -2.9 -16.24 8.41 31.36
20 13 3.6 -1.9 -6.84 3.61 12.96
Total 164 149 0 0 -79.6 44.9 158.4
Media 16.4 14.9
Aplicando las formulas vistas anteriormente:
11
2
1
0 1
( )( )79.6ˆ 1.7728
44.9( )
ˆ ˆ 16.4 ( 1.7728·14.9) 42.82
n
t tt
n
ti
X X Y Y
X X
Y X
β
β β
=
=
− −−= = = −
−
= − = − − =
∑
∑
de donde la ecuación de la recta estimada será: ttt eXY +−= 7728.182.42
Finalmente, sustituyendo en la expresión anterior los valores de Xt podemos obtener los valores
de tY y el valor de los términos de error et:
tY ttt YYe ˆ−=
9.13140312 0.86859688
10.9042316 1.09576837
14.4498886 -1.44988864
16.2227171 -2.22271715
16.2227171 -1.22271715
17.9955457 -0.99554566
17.9955457 2.00445434
19.7683742 1.23162584
21.5412027 0.45879733
19.7683742 0.23162584
2.3. REGRESIÓN LINEAL MÚLTIPLE
Pasamos a continuación a generalizar el modelo anterior al caso de un modelo con varias variables
exógenas, de tal forma que se trata de determinar la relación que existe entre la variable endógena
Y y variables exógenas: X1, X2.…, Xk. Dicho modelo se puede formular matricialmente de la
siguiente manera:
ikikii eXXXeXY ++++=+= ββββ ...· 2211 , i=1,2,…, n
donde:
=
nY
Y
Y
Y...
2
1
es el vector de observaciones de la variable endógena
[ ]k21
21
22221
11211
X ...X X
...
............
...
...
=
=
nknn
k
k
XXX
XXX
XXX
X es la matriz de observaciones de las variables
exógenas
=
Kβ
ββ
β...
2
1
es el vector de coeficientes que pretendemos estimar
=
ne
e
e
e...
2
1
es el vector de términos de error
Si en la expresión anterior se considerara que existe término independiente, β0, la matriz X
quedaría como:
11 1
21 21 3 k
1
1 ...
1 ... X X ... X
... ... ... ...
1 ...
1
k
k
n nk
X X
X XX
X X
= =
Y el modelo quedaría así:
ikikiioi eXXXY +++++= ββββ ...2211 , i=1,2,…, n
Suponiendo que se verifican las hipótesis que veíamos antes, el problema a resolver nuevamente
es la minimización de la suma de los cuadrados de los términos de error tal que:
( ) ( )∑ ∑ ∑= = =
−=−=n
i
n
i
n
iiii XYYYeMin
1 1 1
222 ˆˆ β
Desarrollando dicho cuadrado y derivando respecto a cada βi obtenemos el siguiente sistema de
ecuaciones normales expresado en notación matricial:
ˆ' · 'X X X Yβ =
en donde basta con despejar β premultiplicando ambos miembros por la inversa de la matriz
)'( XX para obtener la estimación de los parámetros del modelo tal que:
YXXX ')'(ˆ 1−=β
donde:
=
∑∑∑
∑∑∑
∑∑∑
===
===
===
n
tki
n
tiki
ti
n
tkii
n
ti
n
tii
n
tkii
n
tii
n
ti
XXXX
XXXXX
XXXXX
XX
1
2
12
n
11ki
12
1
22
112
11
121
1
21
...X
..................
...
...
'
=
∑
∑
∑
=
=
=
n
tiki
n
tii
n
tii
YX
YX
YX
YX
1
12
11
....
`
Si en el modelo existiera término independiente, β0, las matrices anteriores serían:
=
∑∑∑
∑∑∑
∑∑
===
===
==
n
tki
n
tiki
t
n
tkii
n
ti
n
ti
n
tki
n
ti
XXX
XXXX
XXn
XX
1
2
11
n
1ki
11
1
21
11
111
...X
..................
...
...
'
=
∑
∑
∑
=
=
=
n
tiki
n
tii
n
ti
YX
YX
Y
YX
1
11
1
....
`
El resultado de multiplicar dichas matrices conduce a la obtención de la estimación de los
parámetros βi del modelo:
( )
=
==
∑
∑
∑
∑∑∑
∑∑∑
∑∑
=
=
=
−
===
===
==
−
k
o
n
iiki
n
iii
n
ii
n
tki
n
tiki
t
n
tkii
n
ti
n
ti
n
tki
n
ti
YX
YX
Y
XXX
XXXX
XXn
YXXX
β
ββ
β
ˆ...
ˆ
ˆ
....
...X
..................
...
...
''ˆ 1
1
11
1
1
1
2
11
n
1ki
11
1
21
11
111
1
Cada uno de los coeficientes estimados, iβ , son una estimación insesgada del verdadero
parámetro del modelo y representa la variación que experimenta la variable dependiente Y cuando
una variable independiente Xi varía en una unidad y todas las demás permanecen constantes
(supuesto ceteris paribus). Dichos coeficientes poseen propiedades estadísticas muy interesantes
ya que. si se verifican los supuestos antes comentados, son insesgados, eficientes y óptimos.
Ejemplo 2.2.
Un investigador estudia el empleo en el sector turístico en España. Para ello dispone de
información relativa al empleo en los hoteles (Y), número de turistas medido en miles (X1), y la
estancia media de los turistas (X2) medida en días. Los datos disponibles son de corte transversal
y pertenecen a cada una de las 17 Comunidades Autónomas.
Los valores teóricos del estadístico para n=16 observaciones y k=1 variables explicativas, son
dD=0.98 y dU=1.24. Dado 0.62599 < 0.98 no podemos rechazar la hipótesis de la existencia de
autocorrelación positiva.
En R, el test de Durbin-Watson se encuentra en el Package (lmtest), y su sintaxis es: > dwtest(formula) Relaizar el ejercicio anterior requiere del siguiente programa R: > install.package(“bgtest”) > library(bgtest) > datos <- read.table(file="libro1.txt",header=T)
3.3.1. Contraste de Breush-Godfrey El test de correlación serial de Breusch–Godfrey es un test de autocorrelación en los errores y
residuos estadísticos en un modelo de regresión. Hace uso de los errores generados en el modelo
de regresión y un test de hipótesis derivado de éste. La hipótesis nula es que no exista correlación
serial de cualquier orden de ρ .
El test es más general que el de Durbin–Watson, que solo es válido para regresores no-estocásticos
y para testear la posibilidad de un modelo autoregresivo de primer orden para los errrores de
regresión. El test Breusch–Godfrey no tiene estas restricciones, y es estadísticamente más
poderoso que el estadístico d .
Los pasos para realizar el contraste son los siguientes:
1. Estimar el modelo original y obtener la serie de residuos estimados
2. Estimar la ecuación de regresión auxiliar:
tptptkkt eeXXe εδδϕϕα +++++++= −− ˆ...ˆ...ˆ 1111
3. Al aumentar el tamaño muestral, el producto ( ) 2Rpn − (donde n es el número de
observaciones,p , el número de retardos del error utilizados en la regresión auxiliar
y R2 es el coeficiente de determinación de dicha regresión) sigue una distribución
Chi-cuadrado con p grados de libertad, donde p es el número de variables
exógenas utilizadas en la segunda regresión. Se aceptará la hipótesis de existencia
de autocorrelación cuando el valor del estadístico supere el valor crítico de la
distribución Chi-cuadrado (c) al nivel de significación estadística fijado(
( ) cRpn >− 2).
Ejemplo 3.4.
El test de Breusch–Godfrey tambien se realiza con la librería R (lmtest), y se programa para
3=p del siguiente modo:
> install.package(“bgtest”) > library(gbtest) > bgtest(datos$PIB ~ datos$CEnEl,order=3) Breusch-Godfrey test for serial correlation of order up to 3 data: datos$PIB ~ datos$CEnEl LM test = 5.3733, df = 3, p-value = 0.1464
En este ejemplo el valor del estadístico ( ) 37,52 =− Rpn , dado que el valor de la
distribución Chi-cuadrado teórica para el nivel de significación 05,0=α da un valor crítico
81,7=c habría que rechazar la hipótesis de existencia de autocorrelación. El p-value es la
probabilidad asociada al estadístico calculado, al ser de 0,1454 y por tanto mayor que 0,05,
situaría al estadístico en la zona de aceptación de la 0H , la que constituyen los valores del
estadistico inferiores al valor crítico.
3.3. DEFICIENCIAS MUESTRALES: MULTICOLINEALIDAD
El fenómeno de la multicolinealidad aparece cuando las variables exógenas de un modelo
econométrico están correlacionadas entre sí, lo que tiene consecuencias negativas para la
estimación por MCO, ya que la existencia de una relación lineal entre las variables exógena,
implica que la matriz )'( XX va a tener determinante cero, es decir será una matriz singular y por
tanto no será invertible. Dado que YXXX ')'(ˆ 1−=β , no será posible calcular la estimación
mínimo cuadrática de los parámetros del modelo ni, lógicamente, la varianza de los mismos. Esto
es lo que se conoce por el nombre de multicolinealidad exacta.
Consideremos por ejemplo la relación lineal:
iiii uXXY +++= 22110 βββ
Supongamos que las variables independientes presentan relación lineal exacta:
ii cXX 12 =
La matriz (X’X) quedaría:
( )
=
∑∑∑∑∑∑∑∑
22212
21211
21
'
XXXX
XXXX
XXn
XX
sustituyendo iX2 por icX1 tenemos:
( )
=
∑∑∑∑∑∑∑∑
21
2211
21
211
11
'
XcXcXc
XcXX
XcXn
XX
Como el valor de un determinante no se altera si se resta de una fila o columna un múltiplo
constante de cualquier otra fila o columna. Si multiplicamos la segunda fila de (X’X) por c y
restamos el resultado de la tercera fila tenemos:
= ∑∑∑∑∑
000
21
211
11
XcXX
XcXn
A
puesto que 0' == AXX , la matriz (X’X) es singular y por tanto no invertible.
Sin embargo, en la práctica no nos encontraremos con un caso tan extremo como el que acabamos
de exponer, sino que generalmente nos encontraremos ante lo que se conoce como
multicolinealidad aproximada, siendo una de las columnas de la matriz )'( XX ,
aproximadamente, una combinación lineal del resto por lo que será una matriz aproximadamente
singular. Al no ser el determinante de )'( XX igual a cero, existirá inversa y podrán estimarse los
parámetros pero con las siguientes consecuencias:
1. Por un lado, pequeñas variaciones muestrales producidas al incorporar o sustraer un
número reducido de observaciones muestrales podrían generar importantes cambios
en los parámetros estimados.
2. Por otro lado, la matriz de covarianzas del estimador MCO, ( ) 12ˆˆ ' −= XXSS eββ , al ser
un múltiplo de 1)'( −XX , será muy grande por ser el determinante de )'( XX muy
pequeño por lo que la estimación realizada será muy poco precisa al ser la desviación
típica de cada parámetro muy elevada.
Las soluciones propuestas para resolver el problema de la multicolinealidad son variadas, si bien
en general resultan poco satisfactorias:
1. Una posibilidad, sugerida por Johnston (1984), consiste en excluir aquella variable
exógena que puede estar muy correlacionada con el resto y posteriormente estimar el
coeficiente asociado a dicha variable mediante otro procedimiento para incluirlo en el
modelo.
2. Otra posibilidad es la que se conoce como regresión cresta, introduciendo una constante
c en la matriz )'( XX de tal forma que el estimador de MCO quedaría como
YXcIXX k ')'(ˆ 1−+=β , evitando así la singularidad de la matriz. Evidentemente, los
coeficientes estimados estarán sesgados pero la matriz de covarianzas de los mismos será,
seguramente, menor que la que obtendríamos sin introducir la constante por lo que
probablemente la menor varianza compense en parte el sesgo introducido. Otra cuestión
no menos trivial es la selección del valor de c, para lo que no existe un método definido;
una posibilidad, sugerida por Hoerl y Kennard (1970) es comenzar con un valor muy
pequeño de c e ir aumentándolo hasta que observemos que las estimaciones comienzan a
estabilizarse.
3. También se ha sugerido la posibilidad de reformular el modelo, convirtiéndolo en un
modelo de varias ecuaciones (estimación por tramos).
4. Finalmente, cuando la multicolinealidad se debe a la presencia como variables
explicativas de varios retardos de una misma variable, puede especificarse una relación
entre sus coeficientes para eliminar alguno de los retardos del modelo.
3.4. ERRORES DE ESPECIFICACIÓN
Los errores de especificación hacen referencia a un conjunto de errores asociados a la
especificación de un modelo econométrico. En concreto cabe referirse a:
− Omisión de variables relevantes
− Inclusión de variables innecesarias
− Adopción de formas funcionales equivocadas
En Economía la teoría no suele concretar la forma funcional de las relaciones que estudia. Así,
por ejemplo, cuando se analiza la demanda se señala que la cantidad demandada es inversamente
proporcional al precio; cuando se estudia el consumo agregado se apunta que la propensión
marginal a consumir (relación entre renta y/o consumo) es mayor que cero y menor que uno. Por
otro lado es frecuente utilizar la condición “ceteris paribus” para aislar la información de otras
variables relevantes que influyen y/o modifican la relación estudiada. Por esta razón, la existencia
de errores de especificación en la relación estimada es un factor a considerar y a resolver en el
proceso de la estimación econométrica.
Con independencia de la naturaleza de los errores de especificación, dado que el proceso de
estimación MCO deben de cumplirse determinadas hipótesis básicas, que los estimadores MCO
deben de ser insesgados, eficientes y consistentes, y que el estimador de la varianza del término
de error ha de ser insesgado, debemos preguntarnos: ¿qué ocurriría con estas propiedades ante
errores de especificación?.
Para responder a esta cuestión, partimos del modelo de regresión lineal cuya especificación
general es:
Yi = βo+ β1 X1i +…+ ßk Xki + ei
Con las propiedades habituales:
Media cero : E(ei) = 0 i=1,…,n
Varianza constante : Var(ei) = σ2I i=1,…,n
Residuos incorrelacionados : Cov(ei,ej) = 0
No existencia de relación lineal exacta entre dos o más variables independientes
3.4.1. Omisión de una variable relevante Para analizar las consecuencias de la omisión de una variable relevante, vamos a partir del
siguiente modelo verdadero:
Yi = β0 + β1 X1i + β2 X2i + ei (3.1)
Sin embargo, por algún motivo, se ha procedido estimar el siguiente modelo:
Yi = α0 + α1 X1i + vi (3.2)
Dado que la variable excluida X2i está relacionada con la variable dependiente Yi, entonces se
deduce que:
vi= ß2 X2i + ei.
Estimando la pendiente α2 por MCO en el modelo (3.2), se obtiene:
( )( )2
11
111ˆ∑∑
−
−=
XX
yXX
i
iiα
siendo YYy ii −= , de forma que al sustituir yi por su expresión en el modelo verdadero (3.1)
quedaría:
( )( )( )
( ) ( )( ) ( )( )2
11
11222111
2
11
2
11
2211111ˆ
∑∑∑∑
∑∑
−
−+−−+−=
−
++−=
XX
eXXXXXXXX
XX
exxXX
i
iiiii
i
iiii ββββα
Al tomar esperanzas condicionales con respecto a los valores de las variables independientes y
dado que E(e| x1, x2, …, xk) = 0, se obtiene que:
( ) ( )( )( )2
11
2211211ˆ
∑∑
−
−−+=
XX
XXXXE
i
iiββα
lo que implica que )ˆ( 1αE no será igual a β1, por lo que estará sesgado siendo su sesgo:
( )( )( )2
11
22112
∑∑
−
−−
XX
XXXX
i
iiβ
Expresión cuyo signo viene determinado por el signo del coeficiente β2 y por el sentido de la
correlación entre las variables X1 y X2.
Con respecto a la varianza, dado que de la estimación MCO resulta que:
( ) ( ) ( )22,1
2
11
2
11
ˆrXX
Vari
e
−−=∑
σβ
donde r21,2 es el R2 resultante de regresar X1 sobre X2.
Y además:
( ) ( )2
11
2
1ˆ∑ −
=XX
Vari
vσα
entonces )ˆ( 1αVar será diferente de )ˆ( 1βVar , y por lo general será mas pequeña ya que
0<r21,2<1; pero aún en el caso en que r2
1,2=0, que implicaría que X1 y X2 no están correlacionadas,
y aunque el estimador MCO de α1 no fuera insesgado (ya que el sesgo de las variables omitidas
se anularía porque el termino ( )( )
( )2
11
2211
∑∑
−
−−
XX
XXXX
i
ii
sería cero), las varianzas serían ya de por
sí diferentes debido en la estimación de la ecuación (3.1) y en la de la ecuación (3.2).
3.4.2. Inclusión de una variable innecesaria Supóngase ahora que el modelo verdadero es:
Yi = β0 + β1 X1i + ei (3.3)
Pero se especifica el siguiente modelo:
Yi = αo + α1 X1i + α2 X2i + vi (3.4)
Los estimadores MCO de (3.4) son ahora sesgados y consistentes, ya que 00 )ˆ( βα =E ,
11)ˆ( βα =E y 0)ˆ( 2 =αE ; a este respecto hay que tener presente que al ser X2 una variable
innecesaria el parámetro estimado no será significativamente distinto de cero.
Pero como desde el punto de vista de las varianzas ahora resulta que:
( ) ( )2
11
2
1ˆ
∑ −=
XXVar
i
eσβ
( ) ( ) ( )22,1
2
11
2
11
ˆrXX
Vari
v
−−=∑
σα
Puesto que 0< r21,2<1, se cumpliría que )ˆ()ˆ( 11 βα VarVar ≥ , es decir, la varianza de la
estimación MCO de α1 sería mayor que la estimación MCO de β1.
3.4.3. Especificación funcional incorrecta Si especificamos la forma funcional de una relación (ya sea lineal, cuadrática, cúbica,
exponencial, logarítmica, etc.) y la verdadera relación presenta una forma diferente a la
especificada tiene, en algunos casos, las mismas consecuencias que la omisión de variables
relevantes, es decir, proporciona estimadores sesgados e inconsistentes. En general, una
especificación funcional incorrecta lleva a obtener perturbaciones heteroscedásticas y/o
autocorrelacionadas, o alejadas de los parámetros de la distribución del término de error del
modelo correctamente especificado.
3.4.4. Contraste de errores de especificación
Para constatar la presencia de errores de especificación en los modelos se utiliza la prueba general
de errores de especificación de Ramsey. Dicha prueba, en su versión más sencilla, se realiza
mediante los siguientes pasos:
1. A partir del modelo especificado, obtenemos iY estimada, es decir iY .
2. Se efectúa una nueva regresión incluyendo iY en alguna forma, con uno o varios
regresores adicionales, por ejemplo:
iiiii eYYXY ++++= 33
2210
ˆˆ ββββ (3.5)
3. Considerando el R2 obtenido en el modelo inicialmente especificado, 2AR , y el R2
obtenido en la segunda regresión, 2BR , se construye el siguiente estadístico:
( )
( )
2 2
21
( )
B A
B
R R
lFR
n k
−
=−−
El cual se distribuye según una F de Snedecor con l, n–k grados de libertad, siendo l
el número de regresores nuevos incluidos en el segundo modelo y n – k el número de
observaciones menos el numero de parámetros del segundo modelo.
4. Si el valor F calculado es significativo al nivel deseado, tcoFF >exp se puede aceptar
la hipótesis de que el modelo está mal especificado.
Ejemplo 3.5.
Utilizando los datos del modelo del grado de ocupación hotelera estimado en el capitulo anterior,
vamos a plantear la hipótesis de la existencia de algún error de especificación en el modelo.
Utilizando los datos del modelo, efectuamos la regresión siguiente:
iiiiii eYYXXY +++++= 34
2322110
ˆˆ βββββ
Para el que obtenemos el siguiente resultado:
Estadísticas de la regresión Coeficiente de correlación múltiple 0.92689061 Coeficiente de determinación R2 0.8591262 R2 ajustado 0.81216826 Error típico 5.50047546 Observaciones 17
Dado que el modelo estimado obtenía un R2 ajustado de 0,794; construimos el estadístico de
prueba:
( )
( )
( )2 2
2
0.812 0.794
2 0.57(1 0.812)1
12( )
B A
B
R R
lFR
n k
− −
= = =−−−
Con un nivel de significación de α=0.05, obtenemos el valor teórico correspondiente a una
distribución F con 2 grados de libertad en el numerador y 12 en el denominador, que es de 3.49.
Dado que tcoFF <exp no se rechaza la hipótesis de que el modelo esté mal especificado.
3.5. MINIMOS CUADRADOS GENERALIZADOS. En el modelo lineal general estableciamos como hipótesis de trabajo para el termino de error tener
una media cero, una varianza constante y no estar autocorrelacionado; es decir:
Media cero : E(ei) = 0 i=1,…,n
Varianza constante : Var(ei) = σ2I i=1,…,n
Residuos incorrelacionados : Cov(ei,ej) = 0
Ahora vamos a mantener la hipótesis de media nula, es decir,
E(ei) = 0 , i=1,…,n
Pero se va a admitir la posibilidad de que las varizanzas y covarianzas del termino de error estén
multiplicads por un factor escalar tal que:
E(ei ,ej) = σ2Ω , i=1,…,n
Donde σ2 es desconocida y Ω es una matriz conocida de orden n simétrica y definida positiva.
Recordemos que los errores son heteroscedásticos cuando su varianza varía a lo largo del tiempo.
Entonces, suponiendo que no existe autocorrelación en los residuos, la matriz de varianza y
covarianzas de los errores tendría la forma:
=
=Ω=
2
22
21
2
1
22
...00
............
0...0
0...0
...00
............
0...0
0...0
),(
nn
ji eeE
σ
σσ
λ
λλ
σσ
Si en lugar de heteroscedasticidad, existiera alguna forma de autocorrelación en el término de
error tal que 0),( ≠ji eeE , la matriz de varianzas-covarianzas de los errores autocorrelacionados
tendrá la siguiente forma:
=Ω=
−−
−
−
1...
............
...1
...1
),(
21
21
11
22
nn
n
n
ji eeE
ρρ
ρρρρ
σσ
En resumen, la existencia de heteroscedasticidad y autocorrelación violan las hipótesis de trabajo
sobre el término de error que requiere MCO; en ese caso, los estimadores obtenidos por este
procedimiento no serán los más eficientes, es decir, no serán los que garanticen la mínima
varianza entre todos los estimadores lineales.
El método de Mínimos Cuadrados Generalizados (MCG) permite obtener estimadores eficientes
cuando MCO proporciona estimaciones cuyo termino de error no tiene la forma de ruido blanco,
es decir, no tiene media cero, varianza constante y no está autocorrelacionado.
Supóngase que las varianzas heteroscedásticas 2iσ son ahora conocidas. El uso de Mínimos
Cuadrados Generalizados equivale a redefinir las variables utilizadas en el modelo original de
regresión tal que todas ellas quedan divididas por iσ :
i
ii
i
jiji
i
ii
eekj
XX
YY
σσσ==== *** ,,...,2,,
El término de error transformado tiene ahora una varianza homocedástica:
Var(*ie ) = E(
*ie )2 = E
2
i
ie
σ= 2
1
iσ E(ei)2 = 2
1
iσ (2iσ ) = 1
Posteriormente se realiza la regresión mínimo cuadrática con el modelo transformado:
ikikiii eXXXY **...** 22110* +++++= ββββ
El estimador βMCG será:
( ) ( ) YPPXXPPXYXXXMCG11111**1** ''''''ˆ −−−−−−
==β
Siendo:
=−
n
P
σ
σ
σ
1...00
............
0...10
0...01
2
1
1
Si llamamos entonces 111 ' −−− =Ω PP , el estimador βMCG quedaría como:
( ) YXXXMCG111 ''ˆ −−− ΩΩ=β
Por tanto, el método de MCG consiste en aplicar MCO sobre las variables transformadas, las
cuales sí satisfacen las hipótesis teóricas establecidas para MCO.
Así, por ejemplo, si detectamos la presencia de autocorrelación, y se cree que las perturbaciones
se generan de la manera siguiente:
1t t te eρ ε−= +
Donde ρ se conoce como coeficiente de autocorrelación, siendo 11 <<− ρ y tε satisface los
supuestos MCO clásicos (esto es, media cero, varianza constante y ausencia de autocorrelación)
El estimador MCG se obtendría realizando la siguiente transformación:
b) Obtenga los residuos y representarlos gráficamente. Comentar los resultados.
c) Calcule el estadístico d de Durbin-Watson e interprete el resultado
3.2. Utilizando los siguientes datos de corte transversal de 20 individuos:
i Y X 1 5 4.3 2 11.1 4.6 3 3.2 2.4 4 7.9 2.4 5 25.5 26.4 6 3.8 4.2 7 11.1 5.5 8 9.9 4.7 9 13.3 2.2
10 1.5 4 11 6.4 4 12 8.9 8.4 13 8.1 3.3 14 13.5 4.7 15 4.7 5.2 16 7.5 3.6 17 4.7 3.6 18 8 4 19 7.5 3.9 20 9 2.1 a) Efectúe la regresión MCO de Y sobre X y realice un gráfico de los residuos de la
regresión. b) En base al gráfico de los residuos si concluye que hay heteroscedasticidad en la
varianza del error, realice un contraste estadístico para verificarlo.
3.3. Con los siguientes datos de X e Y
Y X 217 6.5 136 4.6 67 2.4 66 2.4 93 3.4 36 1.1
173 5.5 139 4.7 61 2.2 58 2.1 55 2
212 6.4 92 3.3
138 4.7 37 1.2
152 5 243 7
Se ha obtenido la siguiente estimación:
Y=8.25+3.68 X R2=0.9846. Comprobar si el modelo está bien especificado.
3.4. Comente los resultados con el siguiente programa R4 realizado con datos del PIB en indices de volumen y horas trabajadas de la Contabilidad Regional de España en Cantabria :
El estadístico F al ser mayor que el valor teórico permite rechazar la hipótesis oH por lo que cabe
admitir que transmisión autómatica ó manual tiene relación con el consumo de gasolina de este
conjunto de automóviles. De hecho el codigo “***” nos muestra que la variable es significativa a
un α muy bajo.
La variable gear, hace referencia al numero de marchas delanteras, variable que toma valores:
3,4 y 5.
> mtcars$gear [1] 4 4 4 3 3 3 3 4 4 4 4 3 3 3 3 3 3 4 4 4 3 3 3 3 3 4 5 5 5 [30] 5 5 4 Otra posibilidad de obtener la tabla anova es definir el modelo lineal y utilizar la función
“anova”.
> reg <- lm(mtcars$mpg ~ mtcars$gear) > anova(reg) Analysis of Variance Table Response: mtcars$mpg Df Sum Sq Mean Sq F value Pr(>F) mtcars$gear 1 259.75 259.749 8.9951 0.005401 ** Residuals 30 866.30 28.877 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Al igual que en laso anterior la variable tambien tiene relación con el consumo de gasolina, sería
significativa a un 001.0=α .
Realizamos ahora un modelo anova con el descrito en la teoría con la función siguiente:
> model.tables (mod1, type = "mean") Tables of means Grand mean 20.09062 mtcars$am mtcars$am 0 1 17.147 24.392 Warning message: In replications(paste("~", xx), data = mf) : non-factors ignored: mtcars$am
Incorporamos ahora la variable que nos informa del número de marchas y estudiamos sus efectos
A su vez la varianza del término de perturbación, se calcularía a partir de p:
)1())(1()( 1010 ppXXeVar iii −=+−−= ⋅ββββ
Una problemática inherente a los estimadores MCO de estos modelos, son los siguientes:
− La perturbación aleatoria (ei) no sigue una distribución Normal. Es sencillo observar este
hecho ya que el carácter binario (1 ó 0) de la variable endógena afecta a la distribución
de la perturbación, teniendo ésta una distribución Binomial7. Este problema se atenúa
cuando se utilizan tamaños de muestra (N) grandes en donde la distribución Binomial es
susceptible de aproximarse a una Normal.
− La perturbación aleatoria no tiene una varianza constante (es heteroscedástica), lo cual
supone una falta de eficiencia. Para solucionarlo habría que realizar transformaciones
que nos diesen una perturbación homocedástica; esta transformación consiste en
multiplicar todas las variables por una cierta cantidad que elimine el problema de la
heteroscedasticidad. Dicha cantidad es:
)1)((
1
1010 ii XX ββββ))))
−−+
siendo oβ y 1β los estimaciones MCO del modelo.
− No obstante, el mayor problema que plantean estos modelos es que las predicciones
realizadas sobre la variable endógena no siempre se encuentran en el intervalo [0,1], ya
que pueden ser mayores que cero y menores que uno. Este problema tiene dos soluciones,
una es tomar como valor cero todas las estimaciones de la variable endógena con valores
negativos, y uno cuando estas resulten mayores que uno; la segunda, solución es utilizar
funciones de distribución que estén acotadas entre cero y uno como son la Logística y la
Normal; de éstas se derivan los modelos Logit y Probit que pasamos a ver a continuación.
7
La distribución binomial se basa en una prueba conocida como experimento de Bernouilli o problema de las pruebas repetidas, que consiste en averiguar la probabilidad de que en “n” extracciones o pruebas se hayan conseguido X valores de 1 y/o (n-X) valores de 0.
5.5. EL MODELO LOGIT
El problema que presentan los modelos probabilísticos lineales en cuanto a la existencia de
predicciones establecidas fuera rango (negativas o mayores que uno), es debido a que utilizan una
función de probabilidad que depende linealmente de las variables explicativas (X), que se
resolverían acotando dicha distribución de probabilidad. El modelo Logit en concreto utiliza, para
ello, la función de distribución logística:
Figura 5.3. Curva Logística
Debido a que la función de distribución logística no tiene forma lineal, el modelo Logit se estima
de forma diferente, así en vez de minimizar las sumas de las diferencias al cuadrado entre los
valores observados y los estimados por el modelo, el carácter no lineal de los modelos Logit
requiere la utilización del método de Máxima Verosimilitud para ser estimado, maximizando la
verosimilitud de que un suceso tenga lugar, aunque se podría estimar por MCO mediante una
transformación logarítmica de los datos (Gujarati, 1997).
La probabilidad de que Yi=0 (p) se define ahora mediante la siguiente expresión:
)1(
1ze
p −+=
donde Z = β0 + β1X1 + β2X2 +… + βkXk, siendo β i son los coeficientes a estimar y Xi es el vector
de variables independientes
La probabilidad de que Yi=1 (1-p) sería:
)1(
1)1(
zep
+=−
En consecuencia, la razón entre ambas será igual a:
zz
z
ee
e
p
p =++=
− − )1(
)1(
)1(
Tomando el logaritmo natural de la expresión anterior se obtiene
iz
i
ii Xe
p
pL 10)ln(
)1(ln ββ +==
−=
(5.16)
Donde Li es el denominado Logit.
Los coeficientes β indican el cambio en el Logit causado por el cambio en una unidad en el valor
de Xi, mientras que los eβ definen el cambio en la razón de probabilidades
− )1( pp
causado
por el cambio en una unidad en el valor de Xi. Si β es positivo, eβ será mayor que 1, es decir,
− )1( pp
se incrementará; si β es negativo, eβ será menor que 1, es decir,
− )1( pp
disminuirá. Adicionalmente, puede demostrarse que el cambio en la probabilidad (p) causado por
el cambio en una unidad en el valor de Xi es β
− )1( pp
, es decir, depende no sólo del
coeficienteβ, sino también del nivel de probabilidad a partir del cual se mide el cambio.
A la hora de estimar un modelo Logit, hay que tener presente que para estimar el modelo además
de los valores Xi, se necesitan los valores del Logit (Li). Por otro lado, hay que tener presente que
la estimación de los coeficientes de modelo (5.16) se realiza utilizando el método de Máxima
Verosimilitud, es decir, eligiendo como estimadores de los coeficientes β a aquellos que
maximizan la función de verosimilitud, construida sobre la base de )1(
1ze
p −+= . Pero si
tenemos la posibilidad de agrupar los datos individuales, entonces podría estimarse el modelo por
MCO.
Ejemplo 5.3.
Supongamos, que estamos investigando la posibilidad de la relación que se da a nivel individual
entre disponer vivienda propia (p=1) o no poseer vivienda propia (p=0). Si disponemos de la
información agrupada que aparece en la siguiente tabla sobre la población que investigamos:
Ingreso (miles de $) Numero de familias Número de familias con vivienda propia 6 40 8 8 50 12 10 60 18 13 80 28 15 100 45 20 70 36 25 65 39 30 50 33 35 40 30 40 25 20
Fuente: Gujarati (1997)
Si se conoce la probabilidad de tener o no tener casa a partir de:
i
ii N
np =ˆ
donde ni es el número de sujetos que para cada nivel i de la variable X (en el ejemplo, cada nivel
de ingreso) que cumplen la condición (tener vivienda), y Ni es el número total de sujetos en cada
categoría.
Se puede estimar
− )ˆ1(
ˆln
i
i
p
p y resolver la estimación del Logit (5.16) por MCO. Una vez
estimados los parámetros iβ , tendremos una estimación del logaritmo de la razón de
probabilidades; es decir:
iz
i
ii Xe
p
pL 10
ˆˆ)ln()ˆ1(
ˆlnˆ ββ +==
−=
Y aplicando antilogaritmos, tenemos que:
)ˆ1(
ˆ
i
iz
p
pe
−=
lo que permite dar una solución a la posibilidad de determinar la probabilidad de disponer de
vivienda para un individuo dado su nivel de ingresos.
Sin embargo, dado que en la estimación MCO del modelo Logit se pueden presentar problemas
de heteroscedasticidad, Gujarati (1997) propone realizar los siguientes pasos para resolver el
Logit:
1. Para cada nivel de ingreso (Xi), se calcula la probabilidad pi de disponer casa.
2. Para cada Xi se obtiene el Logit mediante:
−=
)ˆ1(
ˆlnˆ
i
ii p
pL
3. Realizar la siguiente transformación:
iiiiioii wXwBwBLw ε++= 1
que se escribe como:
iiioi vXBwBL ++= *1
* (5.17)
donde las ponderaciones )ˆ1(ˆ iiii ppNw −=
4. Estimar (5.17) mediante MCO.
5. Establecer intervalos de confianza y/o pruebas de hipótesis en el marco usual de
MCO, teniendo presente que las conclusiones serán válidas únicamente si se dispone
de una muestra grande de datos.
Utilizando las cifras de la tabla anterior, realizamos las siguientes transformaciones:
Donde I i es negativa siempre que pi<0.5; en la práctica se agrega el número 5 a I i y a su resultado
se le denomina Probit. Es decir, Probit=5+I i
Ahora, para estimar los parámetros β se regresa:
I i= β0+β1Xi + ui
El término de la perturbación es no obstante heteroscedástico. Gujarati (1999) sugiere que se
realice la transformación comentada en el caso del modelo Logit, para que el modelo
transformado sea homocedástico.
Ejemplo 5.3 (cont.)
Los resultados de la regresión anterior, realizados sin considerar la transformación que propone
Gujarati y utilizando como regresor los I i que acabamos de calcular, son los siguientes:
Estadísticas de la regresión Coeficiente de correlación múltiple 0.98943031 Coeficiente de determinación R2 0.97897234 R2 ajustado 0.97634388 Error típico 0.0892711 Observaciones 10
Coeficientes Error típico Término constante
-1.01557838 0.05805496
Xi 0.0484664 0.00251134
Según dichos resultados, una familia con un ingreso medio de 20000$, obtendría el siguiente valor
probit:
I i / (X=20)= –1.018+0.048*20= –-0.0556
Por tanto, la probabilidad que corresponde a dicho valor en la función de distribución Normal
sería de un 47.78% de disponer de vivienda propia.
La estimación en R del modelo probit, se programa:
> probit <- glm(prob ~ datos$Ingreso, family = binomial(link="probit")) Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! > summary(probit) Call: glm(formula = prob ~ datos$Ingreso, family = binomial(link = "probit")) Deviance Residuals: Min 1Q Median 3Q Max -0.087368 -0.051317 -0.006763 0.030342 0.124273 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -1.00836 0.87615 -1.151 0.250 datos$Ingreso 0.04842 0.03876 1.249 0.212 (Dispersion parameter for binomial family taken to be 1) Null deviance: 1.7207 on 9 degrees of freedom Residual deviance: 0.0366 on 8 degrees of freedom AIC: 12.02 Number of Fisher Scoring iterations:
5.7. PROBLEMAS
5.1. Disponemos de una base de datos con los siguientes datos de un grupo de personas: Sexo,
Estado Civil, Años de Experiencia Laboral, Salario por hora, Edad, Sector en el que trabaja
(agricultura, industria, construcción y servicios) y Categoría Profesional (directivo,
comercial, administrativo, técnico, oficial, auxiliar). Elabore un modelo uniecuacional
explicativo del salario que obtiene cada persona.
5.2. .
Disponemos de un conjunto de datos sobre las ventas de diferentes empresas ( )iY , sus gastos de
publicidad( )iX y un indicativo de su tamaño( )iT , que consiste en una variable binaria que toma
valor 1 para las pequeñas y medianas empresas y 0 para las grandes.
a) Se quiere contrastar si el efecto de la publicidad sobre las pequeñas y medianas empresas
es igual al de las grandes. Establezca una esfecificación del modelo y el contraste de
hipótesis que considere más adecuado.
b) Utilizando dicha especificación, como se determinaría el efecto de la publicidad sobre las
ventas de las pequeñas empresas y como se determinaría el efecto sobre las grandes.
a) Realice la representación gráfica de los datos.
b) ¿Considera que el modelo se ajusta a un modelo de regresión por tramos?
c) En caso afirmativo, estime el modelo.
5.4. Utilizando datos de una encuesta realizada entre en 1974/1975 en donde se pregunta sobre estar de acuerdo ó en desacuerdo con la afirmación de que las mujeres tienen que
dedicarse al cuidado del hogar y dejar el país en manos de los hombres, se ha realizado una regresión logistica entre el porcentaje de personas que se muestran de acuerdo con dicha información, el numero de años que han estudiado y su sexo. El conjunto de datos se obtiene en:
> install.packages("HSAUR") > data("womensrole", package="HSAUR") Se ha realizado el siguiente programa R:
> fm1 <- cbind(agree,disagree) ~ sex+education > glm_1 <- glm(fm1, data=womensrole, family = binomial()) > summary(glm_1) Call: glm(formula = fm1, family = binomial(), data = womensrole) Deviance Residuals: Min 1Q Median 3Q Max -2.72544 -0.86302 -0.06525 0.84340 3.13315 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.50937 0.18389 13.646 <2e-16 *** sexFemale -0.01145 0.08415 -0.136 0.892 education -0.27062 0.01541 -17.560 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 451.722 on 40 degrees of freedom Residual deviance: 64.007 on 38 degrees of freedom AIC: 208.07 Number of Fisher Scoring iterations: 4
a) Comente los resultados obtenidos.
b) Realice una regresión probit con estos datos
5.5. Considere el siguiente modelo probit estimado:
Pr( , ) ( 1.1 0.2 0.09 )i i i i iy S W S W= Ψ − + +
donde iy es una variable que toma valor 1 si el individuo i dispone de vehículo propio ,iS es
una variable que toma valor 1 si el individuo i es varon y 0 si es muje, yiW es el salario mensual
del individuo i en miles de euros.
a) Considere un hombre y una mujer que cobran 1500 euros al mes, calcular que
probabilidad tienen de disponer de vehículo propio.
b) Que diferencia de probabilidad tienen de disponer de vehículo propio un
hombre que cobra 1500 euros al mes y una mujer que cobra 2500.
SOLUCIONES
5.1. A realizar por el lector
5.2 a) Se estima el siguiente modelo ( )0 1 1i i i i iY X X T eβ β δ= + + + , y se contrasta la
hipótesis nula 0 1: 0H δ = b) El efecto de la publicidad sobre las ventas de las PYMES
vendría dado por 1 1( )β δ+ y la de las grandes por 1( )β
5.3 a) A realizar por el lector. b) Se estima el siguiente modelo de variables cualitativas para
la regresión por tramos DXXXY )(71,1791.1396.103 *−++= donde 6* =X ;
Un modelo de datos de panel es, según la definición más extendida, un modelo que utiliza
muestras recogidas a individuos a lo largo de instantes de tiempo. Los modelos de datos de panel
incluyen así información de una muestra de agentes económicos (individuos, empresas, bancos,
ciudades, países, etc.) durante un período determinado de tiempo, combinando, por tanto, la
dimensión temporal y estructural de los datos.
Los modelos de datos de panel se aplican a conjuntos o bases de datos de series de tiempo
agregadas para los mismos individuos; éstos conjuntos de datos suelen tener un número
relativamente grande de individuos y pocas observaciones en el tiempo, o por el contrario
podemos tener datos para un número grande de periodos pero para un número pequeño de
individuos. Un ejemplo de este tipo de bases de datos es el panel de hogares de la Unión Europea
(70.000 hogares en la UE), las encuestas de opiniones empresariales del Ministerio de Industria
(3.000 empresas), los índices Nielsen (5.000 hogares en España) para medir la audiencia
televisiva, etc. Estos conjuntos de datos que son conocidos como datos de panel o datos
longitudinales hay que diferenciarlos de las encuestas transversales que son repetidas en el tiempo
pero no a los mismos individuos (por ejemplo, la Encuesta de Población Activa)8.
El principal objetivo que se persigue al agrupar y estudiar los datos en panel es capturar la
heterogeneidad no observable entre los agentes económicos como entre periodos temporales.
Dado que esta heterogeneidad no se puede detectar exclusivamente con estudios de series
temporales, ni tampoco con estudios de corte transversal, hay que realizar un análisis más
dinámico incorporando a los estudios de corte transversal la dimensión temporal de los datos.
Esta modalidad de analizar la información es muy usual en estudios de naturaleza empresarial, ya
que los efectos individuales específicos de cada empresa y los efectos temporales del medio son
determinantes cuando se trabaja con este tipo de información.
8
En los paneles de datos a veces también hay que sustituir individuos por falta de respuesta, pero no es el caso de las encuestas transversales en donde la muestra se renueva de forma sistemática, de manera que a un periodo de tiempo determinado, por ejemplo un año, los hogares de la muestra sean diferentes a los del periodo anterior. La falta de respuesta en los datos de panel como en otro tipo de encuesta a la hora de los análisis estadísticos deben de depurarse, bien eliminando todos los datos del individuo con falta de respuesta o eliminando únicamente los individuos con falta de respuesta en cada variable analizada.
Los efectos individuales específicos se definen como aquellos que afectan de manera desigual a
cada uno de los agentes de estudio contenidos en la muestra (individuos, empresas, bancos). Estos
efectos son invariables en el tiempo y se supone que afectan de manera directa a las decisiones
que toman dichas unidades. Usualmente, se identifica este tipo de efectos con cuestiones de
capacidad empresarial, eficiencia operativa, el “saber-hacer” (Know-how), acceso a la tecnología,
etc.
Por su parte, los efectos temporales son aquellos que afectan por igual a todas las unidades
individuales del estudio y que, además, varían en el tiempo. Este tipo de efectos suele asociarse,
por ejemplo, a shocks macroeconómicos que afectan por igual a todas las empresas o unidades de
estudio (una subida de los tipos de interés, un incremento de los precios de la energía, un aumento
de la inflación, etc.), o a cambios en la regulación de mercados (ampliación de la Unión Europea,
reducción de tarifas arancelarias, aumento de la imposición indirecta, etc.).
6.2. ESPECIFICACIÓN GENERAL DE UN MODELO DE DATOS D E
PANEL
La especificación general de un modelo de regresión con datos de panel es la siguiente:
∑=
++=K
jit
jjititit eXY
1
βα
donde i = 1,......N se refiere al individuo o a la unidad de estudio (corte transversal), t = 1,...T a la
dimensión en el tiempo, Yit sería la variable a explicar correspondiente a cada unidad de estudio,
α es un escalar con N×T parámetros que recoge los efectos específicos del i-ésimo individuo en
cada momento del tiempo, β es un vector de K parámetros que se asocian a las j=1,….K variables
explicativas j
itX .
A partir del modelo general, y con base en ciertos supuestos y restricciones acerca del valor de
algunos de los parámetros, se derivan las diferentes variantes de modelos de datos de panel que
resumimos a continuación en la siguiente tabla.
MODELOS ALTERNATIVOS PARA COMBINAR DATOS DE SERIES DE TIEMPO Y DE CORTE TRANSVERSAL
TIPO DE MODELO EXPRESIÓN CARACTERÍSTICAS Modelo Lineal
∑=
++=K
jit
ji
jititit eXY
1
βα
Modelo Estático de Datos de Panel. ∑
=
++=K
jit
jjititit eXY
1
βα
Modelo Estático de Datos de Panel de una Vía (one-way) (A) ∑
=
++=K
jit
jjititit eXY
1
βα iit αα =
Modelo Estático de Efectos Fijos con variable dummy (los coeficientes constantes se estiman a partir de variables cualitativas) (B)
∑=
++=K
jit
jjitiit eXiY
1
βα i es un vector de variables
cualitativas y αi es un vector de coeficientes constantes.
Modelo Estático de Datos de Panel de Doble Vía (two-ways) (C)
∑=
++=K
jit
jjititit eXY
1
βα tiit λµαα ++=
Modelo de Regresiones Aparentemente No Relacionadas (SUR)9
∑=
++=K
jit
ji
jititit eXY
1
βα iit αα =
Modelo Dinámico de Datos de Panel ∑
=− +++=
K
jit
jjittiitit eXYY
11, βϑα tiit λµαα ++=
En un modelo de datos de panel, las variables explicativas pueden ser de tres tipos:
− Una variable por cada individuo, sin que exista referencia temporal en dicha variable:
las variables son las mismas para cada unidad de corte transversal y se refieren a
atributos del individuo o agente, por ejemplo, el tipo de empresa, su tamaño, la forma
gerencial; el sexo de un trabajador, el nivel de formación, la profesión y otras
características sociales de los individuos.
− Una variable por periodo, pero sin que existan diferencias en el valor que toma la
variable en cada individuo: las variables toman distintos valores en cada periodo
temporal pero no varían entre los individuos. Como ejemplo de este tipo de variables
cabe citar a la tasa de inflación, los tipos de interés, etc.
− Una variable que cambia en el tiempo y por individuo: se trata de variables que
cambian entre individuos en un momento del tiempo, y que además cambian a lo
largo del tiempo. Como ejemplo de estas variables se pueden mencionar los ingresos
9 Siglas de Seemingly Unrelated Regression
totales, el nivel de beneficios, el stock de capital o el nivel de endeudamiento, entre
otras.
Los modelos de datos de panel se interpretan a través de sus componentes de error. Considerando
la notación matricial abreviada de un modelo general de datos de panel:
ititit uXY += β' (6.1)
El término de error uit incluido en la ecuación (6.1), puede descomponerse de la siguiente manera:
ittiit eu ++= λµ (6.2)
donde µi representa los efectos no observables que difieren entre las unidades de estudio pero no
en el tiempo (capacidad empresarial, eficiencia de cada unidad, etc.…); λt identifica los efectos
no cuantificables que varían en el tiempo pero no entre las unidades de estudio; y eit se refiere al
término de error puramente aleatorio.
La mayoría de los análisis realizados con datos de panel utilizan el modelo de componente de
error conocido como one way para el cual λt =0 (modelo A). Las diferentes variantes para el modelo
one way de componentes de errores surgen de los distintos supuestos que se hacen acerca del
término µi, pudiéndose presentar tres posibilidades:
− El caso más sencillo es el que considera 0=iµ ; es decir, la no existencia de
heterogeneidad no observable entre los individuos o empresas.
− La segunda posibilidad consiste en suponer a iµ un efecto fijo y distinto para
cada individuo o empresa. En este caso, la heterogeneidad no observable se
incorpora a la constante del modelo (iα ).
− Finalmente, la tercera alternativa es tratar a iµ como una variable aleatoria no
observable que varía entre individuos/empresas pero no en el tiempo.
Bajo la primera especificación, los µit satisfacen todos los supuestos del modelo lineal general y,
por tanto, se emplea como método de estimación MCO, obteniendo estimadores lineales e
insesgados y con la ventaja de ganar grados de libertad.
Ahora bien, en los casos en que se rechaza el supuesto de homogeneidad en un sistema de datos
de panel, es decir, que existe heterogeneidad no observable ya sea a través del tiempo, entre
unidades de estudio (individuos) o en ambos sentidos, debe buscarse una especificación que la
capture de forma apropiada con el fin de evitar que los estimadores de los parámetros de las
variables explicativas estén sesgados.
6.3. VENTAJAS Y DESVENTAJAS DE LOS MODELOS DE DATOS
DE PANEL
Los modelos de datos de panel presentan una serie de ventajas y desventajas en comparación con
los modelos de series temporales y de corte transversal. Las más relevantes son las siguientes:
Ventajas
− La técnica permite al investigador económico disponer de un mayor número de
observaciones, incrementando los grados de libertad, reduciendo la multicolinealidad
entre las variables explicativas y, en última instancia, mejorando la eficiencia de las
estimaciones econométricas.
− Tal y como se mencionó anteriormente, la técnica permite capturar la heterogeneidad no
observable ya sea entre unidades individuales de estudio como en el tiempo. Con base en
lo anterior, la técnica de datos de panel permite aplicar una serie de contrastes para
confirmar o rechazar dicha heterogeneidad y determinar cómo capturarla.
− Los datos de panel suponen, e incorporan al análisis, el hecho de que los individuos o
agentes económicos (consumidores, empresas, regiones, países, etc.…) son heterogéneos.
Los análisis de series de tiempo y de corte transversal no incorporan esta heterogeneidad
corriendo así el riesgo de obtener resultados sesgados.
− Permiten estudiar mejor la dinámica de los procesos de ajuste, ya que a través de ellos se
pueden analizar los cambios en el tiempo de las distribuciones transversales.
− Permiten elaborar y probar modelos relativamente complejos de comportamiento en
comparación con los análisis de series temporales y de corte transversal. Un ejemplo claro
de este tipo de modelos es aquel que trata de medir niveles de eficiencia técnica por parte
de unidades económicas individuales.
− Finalmente, puesto que las unidades transversales de un panel de datos normalmente se
refieren a individuos, familias o empresas, se evitan los sesgos que aparecen cuando se
trabaja con variables agregadas.
Desventajas
− En términos generales, las desventajas asociadas a la técnica de datos de panel se
relacionan con los procesos para la obtención y el procesamiento de la información
estadística sobre las unidades individuales de estudio; es decir cuando ésta se obtiene por
medio de encuestas, entrevistas o utilizando algún otro medio de inferencia estadística de
los datos. Ejemplos de este tipo de limitaciones son los problemas de selección no
aleatoria de la muestra, de recogida de datos con inadecuadas tasas de cobertura de la
población, porcentajes de no respuesta, preguntas confusas, distorsión deliberada de las
respuestas, etc.
− Asimismo, una escasa dimensión temporal puede invalidar alguno de los elementos
teóricos de los modelos de datos de panel.
− Por ultimo, algunas investigaciones han demostrado que la utilización de modelos de
efectos fijos produce resultados significativamente diferentes al los modelos con efectos
aleatorios cuando se estima una ecuación usando una muestra de muchas unidades de
corte transversal con pocos periodos de tiempo (700 individuos con 5 periodos, por
ejemplo).
6.4. MODELO DE EFECTOS FIJOS
Como ya se mencionó, los modelos de datos de panel permiten contemplar la existencia de efectos
individuales específicos a cada unidad, invariables en el tiempo, que determinan la manera en que
cada unidad de corte transversal toma sus decisiones.
Estos modelos asumen que los efectos de las variables omitidas, ya sean específicas a cada
individuo y/o que cambian en el tiempo, no son importantes en forma individual, pero sí en
conjunto.
Por otro lado, dado que el efecto de las variables omitidas se supone constante en el tiempo para
cada individuo, o que no varía en todos los individuos en un determinado momento en el tiempo,
o una combinación de ambos, se pueden capturar en el término constante de un modelo de
regresión como un promedio que toma en cuenta explícitamente la heterogeneidad entre
individuos y/o en el tiempo contenida en los datos.
Según la forma de incorporar la heterogeneidad no observada, se pueden diferencian los modelos
de efectos fijos y modelos de efectos aleatorios. Los modelos de efectos fijos se conocen también
como modelos mínimos cuadráticos con variables ficticias.
Los modelos de datos de panel de efectos fijos tienen la siguiente expresión general:
∑=
++=K
jit
jjitiit eXY
1
βα
donde itY es la variable dependiente, ,itα es un escalar que recoge los efectos específicos del i–
ésimo individuo y se supone constante en el tiempo, y ,jitX es el vector de las k variables
explicativas y ,jβ de los K parámetros que recogen los efectos de las variables explicativas; eit
es el termino de error que se suponen aleatorios distribuidos con media cero y varianza constante
de valor 2eσ . El panel de datos corresponde a i = 1,2..., N unidades o individuos de corte
transversal, observados para los períodos t = 1,2..., T.
Por tanto, lo que se pretende resolver es un sistema de regresiones específicas con N ecuaciones
de corte transversal: itjj
itititii eXXXY +++++= βββα ...2211 y T observaciones.
Su notación matricial abreviada es:
ititiit eXY ++= βα '
Agrupando las observaciones temporales, para cada unidad transversal se llega al siguiente
modelo:
ititit eXiY ++= βα '
que en el supuesto de una única variable explicativa tendría la siguiente expresión:
+
+
=
NT
T
T
N
NT
T
T
N
N
NT
T
T
N
e
e
e
e
e
e
X
X
X
X
X
X
i
i
i
Y
Y
Y
Y
Y
Y
.
.
.
.
.
.
.
.
.
.
.
...00
......
0...0
0...0
.
.
.
.
.
2
1
1
21
11
2
1
1
21
11
2
1
2
1
1
21
11
β
α
αα
Con este modelo se considera que las variables explicativas afectan por igual a las unidades de
corte transversal y que éstas se diferencian por características propias de cada una de ellas,
medidas por medio de la intercepción en el origen. Es por ello que las N intercepciones se asocian
con variables dummy con coeficientes específicos para cada unidad, los cuales se deben estimar.
La estimación de iα y β se realiza por MCO, si bien hay que tener presente que este modelo
presenta una pérdida importante de grados de libertad. Un test útil en este tipo de modelos es
realizar la prueba F, para comprobar si αα =i para cualquier i. Por otro lado, cabe señalar que
cuando se quiera incluir un término constante hay que introducir únicamente N-1 variables
ficticias.
Otra manera de plantear este modelo es especificándolo en desviaciones respecto a la media, es
decir, restando a cada variable la media en el periodo para cada unidad i-esima. El estimador a
utilizar en este caso tiene la siguiente expresión:
( )( ) ( )( )
−−
−−= ∑∑∑∑= =
−
= =
''ˆ1 1
1
1 1iit
N
i
T
tiitiit
N
i
T
tiit YYXXXXXXβ (6.3)
donde ,i iY X son las medias muestrales del individuo i-ésimo.
El estimador de la varianza de β es:
( ) ( ) ( )1
2
1 1
ˆ ˆ 'N T
e it i it ii t
Var X X X Xβ σ−
= =
= − − ∑∑
donde 2ˆ eσ es la varianza residual, calculada como
2 'ˆu
e e
NT N Kσ =
− − , donde e’e es la suma de
los residuos del modelo al cuadrado.
En general, el estimador de mínimos cuadrados ordinarios (MCO) es apropiado cuando los
residuos son incorrelados en el tiempo y homocedásticos en los cortes transversales.
Los efectos fijos se estiman en un segundo paso a través de la siguiente ecuación:
( )T
XYXY
T
titi
iii
∑=
−=−= 1
'
'
ˆˆˆ
ββα (6.4)
El modelo anterior puede extenderse al modelo de efectos fijos de doble vía, en el que aparecen
también los efectos no observables temporales, tal que:
itittiit eXY +++= βδα '
Expresión que equivale a introducir dos conjuntos de variables ficticias, unas individuales y otras
temporales; en este caso el estimador MCO tendría las mismas propiedades del modelo anterior.
El estimador a utilizar tendría la siguiente expresión:
( )( ) ( )( )
+−−+−−
+−−+−−= ∑∑∑∑= =
−
= =
''ˆ1 1
1
1 1
YYYYXXXXXXXXXXXX tiit
N
i
T
ttiittiit
N
i
T
ttiitβ
donde ,i iY X , son las medias muestrales del individuo i-ésimo, tt XY , las medias muestrales del
periodo t, y XY, las medias muestrales de las variables para todos los N individuos y T periodos.
Los efectos fijos se estiman en un segundo paso a través de las siguientes relaciones:
( ) ( ) βα ˆˆ 'XXYY iii −−−=
( ) ( ) βδ ˆˆ 'XXYY ttt −−−=
6.5. MODELO DE EFECTOS ALEATORIOS
A diferencia del modelo de efectos fijos, el modelo de efectos aleatorios considera que los efectos
individuales no son independientes entre sí, sino que están distribuidos aleatoriamente alrededor
de un valor dado. Una práctica común en el análisis de regresión es asumir que el gran número
de factores que afectan al valor de la variable dependiente pero que no han sido incluidas
explícitamente como variables independientes del modelo, puede resumirse apropiadamente en
la perturbación aleatoria.
Así, en este modelo se considera que tanto el impacto de las variables explicativas como las
características propias de cada unidad son diferentes.
El modelo de efectos aleatorios o modelo de componentes de la varianza asume que el término
itα es la suma de una constante común α , una variable aleatoria específica de corte transversal
e invariante en el tiempo iµ asociada a cada individuo e incorrelada con el residuo ite , y otro
asociado al tiempo λt, también incorrelacionado con el residuo ite .
En lugar de tratar iµ como una constante fija, esta especificación asume que ),0( 2µσµ Ni ≈
independiente e igualmente distribuida, e incorrelada con ite y itX .
A su vez el modelo también requiere que tλ está incorrelado en el tiempo tal que 0),( =stE λλ
, y además está incorrelada coniµ , ite y itX .
Si suponemos que 0=tλ , la especificación del modelo entonces se convierte en:
itiitj
j
i
jitit eXY +=+=∑
=
µεεβ it1
,
La estimación de este modelo exige de la utilización de Mínimos Cuadrados Generalizados pues
los residuos del modelo están correlacionados entre sí al estar iµ incluido tanto en itε como en
isε , para .st ≠
El estimador apropiado de este modelo expresado en desviaciones a la media es, por tanto:
( ) ( ) ( )( )
−−
−−+= ∑ ∑∑ ∑= =
−
= =
'1
'1ˆ
1 1
'
1
1 1
'iit
N
i
N
iiitiiiit
N
i
N
iiitiiMCG YXXXQYX
TXXXXQXX
Tψβ
donde:
22
2
µε
ε
σσσψ
T+=
'1
eeT
IQ T ⋅−=
Generalmente las varianzas2µσ (varianza entre grupos) y
2εσ no son conocidas y, por tanto, habrá
que estimar un valor para ψ . Para estimar dicho valor un camino sería utilizar las estimaciones
de las varianzas de los residuos obtenidas en la solución MCO del modelo.
6.6. ELECCIÓN DE MODELO DE EFECTOS O EFECTOS
ALEATORIOS
La decisión acerca de la estructura apropiada para el análisis, es decir, efectos fijos vs efectos
aleatorios, dependerá de los objetivos que se persigan.
Así, Hausman (1978) aconseja utiliza el modelo de efectos fijos para realizar inferencias sobre la
muestra utilizada, mientras que el de efectos aleatorios resulta más útil para realizar inferencias
sobre la población.
Adicionalmente, si el interés del estudio particular está puesto en los coeficientes de las pendientes
de los parámetros, y no tanto en las diferencias individuales, se deberá elegir un método que
relegue estas diferencias y trate la heterogeneidad no observable como aleatoria.
El contexto de los datos, es decir, cómo fueron obtenidos y el entorno de donde provienen,
determinan también la elección del modelo. Con el modelo de efectos fijos la heterogeneidad no
observable se incorpora en la ordenada al origen del modelo y con el de efectos aleatorios, como
ya se mencionó, se incorpora en el término de error, modificándose la varianza del modelo.
Asimismo, emplear un modelo de efectos fijos o aleatorios genera diferencias en las estimaciones
de los parámetros en los casos en que se cuenta con T pequeño y N grande. En estos casos debe
hacerse el uso más eficiente de la información para estimar esa parte de la relación de
comportamiento contenida en las variables que difieren sustancialmente de un individuo a otro.
En principio, el enfoque de efectos fijos es más atractivo, ya que no requiere realizar supuestos
paramétricos sobre la distribución condicional de la heterogeneidad inobservable. Sin embargo,
su desventaja es que solo puede utilizarse en ciertas distribuciones y requiere hacer supuestos
muy restrictivos sobre la distribución del término de error como lo son las hipótesis que exige el
método MCO.
A este respecto hay que tener presente que el modelo de efectos fijos asume la existencia de
diferencias entre unidades que se capturan en forma de movimientos de la curva de regresión.
(Fig. 6.1).
Figura 6.1.
El modelo de efectos fijos, si se estima utilizando variables dummy no identifica directamente la
causa de la variación en el tiempo y los individuos, e implica un alto coste informativo en términos
de grados de libertad. En cuyo caso deben realizarse algunas consideraciones con respecto a la
estructura de los datos, dado que si N es grande y T pequeño, podría darse el caso en que el
número de parámetros en el modelo de efectos fijos sea muy grande en relación con el número de
datos disponibles, lo que daría lugar a parámetros poco significativos y una estimación ineficiente.
Para elegir entre los estimadores del modelo fijo y aleatorio puede utilizarse el test de Hausman,
que compara directamente ambos estimadores. El contraste se basa en el hecho de que bajo la
hipótesis de que [ ] 0=iti XE α el estimador del modelo de efectos aleatorios ( )EAβ es
asintóticamente más eficiente que el estimador MCO del modelo de efectos fijos ( )EFβ ; sin
embargo, si [ ] 0≠iti XE α , el estimador MCO mantendrá la consistencia, mientras que el
estimador MCG será sesgado e inconsistente.
El estadístico propuesto por Hausman es:
[ ] qqVarqm ˆ)ˆ(ˆ 1' −=
donde EFEAq ββ ˆˆˆ −= , y la matriz diagonal )ˆ()ˆ()ˆ( EFEA VarVarqVar ββ −= . Bajo la hipótesis
nula [ ] 00 == iti XEH α el estadístico m se distribuye como una variable 2kχ .
Ejemplo 6.1.
A continuación vamos a realizar un ejemplo de estimación de un modelo de datos de panel, con
las series temporales de créditos y depósitos de las cajas de ahorro de Castilla y León por
provincias, el objetivo de la investigación es comprobar qué parte de los depósitos se queda en
Castilla y León en forma de créditos y verificar si hay diferencias en los comportamientos
provinciales. Los datos utilizados corresponden al periodo 1998-2003 y tienen periodicidad
trimestral.
En primer lugar, utilizamos un modelo de datos de panel fijo de la forma siguiente:
ititit uXiY ++= βα '
donde itY son los créditos que prestan las cajas de ahorro en las nueve provincias de la región
(N=9), y itX los depósitos de las cajas de ahorro en cada una de las nueve provincias de la región.
El número de observaciones temporales es T = 22.
Los datos de los créditos totales concedidos por las Cajas de Ahorro en las nueve provincias de
Coeficientes Error típico Estadístico t AV 82.5909183 74.062306 1.11515456 BU 543.61444 154.683995 3.51435479 LE 760.615561 135.247529 5.62387768 PA 248.928645 66.1017603 3.76583988 SA 58.0469567 106.602347 0.54451856 SG 77.3436176 71.092936 1.08792268 SO -52.4921486 62.268669 -0.84299455 VA 1323.60383 89.8271126 14.7350148 ZA 66.2517949 66.1422793 1.00165576 Β 0.48266722 0.03002785 16.0739855
Se puede apreciar que tanto el estadístico F, como la distribución asociada a los estimadores de
los coeficientes iα descarta la hipótesis de igualdad de dichos coeficientes (el valor teórico del
estadístico F en las tablas es 1.88), lo que hace significativa con un nivel de confianza del 95% la
existencia de heterogeneidad en el comportamiento de cada provincia.
Si utilizamos el modelo (6.2) y el procedimiento descrito para obtener el estimador (6.3) y los
coeficientes (6.4), obtendríamos los siguientes resultados en la estimación MCO.
( )( )
( )( )48266722.0
18.832723809
5.404107385ˆ
1 1
1 1 ==
−−
−−=
∑∑
∑∑
= =
= =N
i
T
tiitiit
N
i
T
tiitiit
MCO
XXXX
YYXX
β
El coeficiente αi correspondiente a Ávila se obtiene como:
La librería “plm” ofrece recursos en R para estimar modelos data panel.
> install.packages("plm") En esta librería tenemos un conjunto de datos panel relativos a 10 empresas para las que
disponemos de los siguientes cifras: año, invesión bruta, valor de la empresa y capital. El
conjunto de datos es para el periodo de 1935 a 1954.
> data("Grunfeld", package="plm") > str(Grunfeld) 'data.frame': 200 obs. of 5 variables: $ firm : int 1 1 1 1 1 1 1 1 1 1 ... $ year : int 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 ... $ inv : num 318 392 411 258 331 ... $ value : num 3078 4662 5387 2792 4313 ... $ capital: num 2.8 52.6 156.9 209.2 203.4 ... En el conjunto de datos los campos identificativos de las empresas y años deben de ser índices.
Para estimar un modelo de data panel de efectos fijos que relacione la inversión realizada por la
empresa con su valor contable y su capital, se requiere la siguiente sentencia R:
La expresión para la ecuación (7.3) recordemos que es:
Qt=α11Pt+β11Prt+β12Rt + u1t
El primer paso consiste en realizar la regresión por MCO del precio de la carne de porcino (Pt)
sobre las tres variables exógenas del modelo: Precio relativo de la carne de aves frente a la carne
de porcino (Prt), Precio relativo de los piensos frente a la carne de porcino (Ft) y Renta "per
capita" (Rt), para lo que estimamos la relación:
Pt=π21Prt+π22Rt+π23Ft +e1t
Los resultados obtenidos son los siguientes:
Coeficientes Error típico Estadístico t Término constante 2.33947783 0.24298863 9.62793124 Precio relativo de la carne de aves frente a la carne de porcino
-0.34549619 0.28538168 -1.21064604
Precio relativo de los piensos frente a la carne de porcino
-0.43015941 0.30002065 -1.43376601
Renta per capita -0.55315522 0.16144429 -3.42629156
El siguiente paso es plantear la ecuación (7.3) pero añadiendo la nueva variable estimada:
Qt=α12Pt+β11Prt+β12Rt +λ tP + u1t
Los resultados obtenidos en el segundo paso son los siguientes:
Coeficientes Error típico Estadístico t Término constante -9037.89318 2676.96924 -3.37616624 Precio carne de porcino -240.316755 429.828674 -0.55909894 Precio relativo de la carne de aves frente a la carne de porcino 2350.58492 794.500316 2.95857014 Renta per capita 5440.9149 789.283782 6.89348372
tP 3356.23732 1182.18626 2.83900891
Considerando que el valor de la t de Student en las tablas es de 2.67 para un nivel de confianza
del 95%, se descarta la posibilidad de que el coeficiente asociado a tP pueda ser considerado
igual a cero.
Por otro lado, si generamos el residuo vt tenemos que:
Aplicando el método de Pyndick y Rubinfeld ahora debemos estimar la siguiente ecuación:
Qt=α12Pt+β11Prt+β12Rt +λ vt + u1t
Obteniéndose los siguientes resultados:
Coeficientes Error típico Estadístico t Término constante -9037.89318 2676.96924 -3.37616624 Precio carne de porcino 3115.92057 1101.27729 2.82936968 Precio relativo de la carne de aves frente a la carne de porcino 2350.58492 794.500316 2.95857014 Renta per capita 5440.9149 789.283782 6.89348372 vt -3356.23732 1182.18626 -2.83900891
Nuevamente el parámetro λ es estadísticamente distinto de cero, por lo que podemos afirmar que
el precio de la carne de porcino pueda ser considerado como endógeno en la ecuación de demanda.
7.4. IDENTIFICACIÓN DEL SISTEMA
En la expresión 1B−Π = −Γ podemos observar que los parámetros de la forma reducida son una
combinación lineal de los parámetros de la forma estructural del modelo (Y BX UΓ + = );
asimismo, dado que no existe simultaneidad en la forma reducida, podemos estimar sus
parámetros sin problema por MCO. Sin embargo, ¿cómo podemos para saber si es posible
recuperar todos y cada uno de los parámetros de la forma estructural (elementos de las matrices
B y Γ A) a partir de las estimaciones de los parámetros de la forma reducida (elementos de la
matriz Π )? Para responder a esta pregunta antes de proceder a la estimación del modelo, debemos
realizar la identificación del sistema de ecuaciones simultáneas; una vez realizada podemos
encontrarnos en alguna de las siguientes situaciones:
− Una ecuación estará no identificada cuando no tengamos suficiente información para
estimar los parámetros de la forma estructural de la ecuación.
− Por su parte, una ecuación estará sobreidentificada cuando haya más de una
combinación posible de valores estimados para los parámetros de la forma estructural.
− Finalmente, diremos que una ecuación está exactamente identificada cuando sea posible
obtener una única estimación de los parámetros estructurales.
− En caso de que todas las ecuaciones de un modelo multiecuacional en su forma estructural
sean exactamente identificadas, diremos que el sistema está exactamente identificado,
pudiéndose recuperar de forma unívoca los elementos de las matrices B y A a partir de
las estimaciones de la matriz Π .
Ejemplo 7.3.
Consideremos el modelo clásico de oferta y demanda del Ejemplo 7.1, en el que se ha omitido la
variable Prt de la ecuación (7.4):
Qt=α11Pt+β11Prt+β12Rt + u1t, α11<0 (7.9)
Qt=α21Pt+β23Ft + u2t, α21>0 (7.10)
Se trata de un modelo con las siguientes características:
− La ecuación de demanda (7.9) tiene dos variables endógenas (Pt y Qt) y dos exógenas (Prt
y Rt)
− La ecuación de oferta (7.10) tiene dos variables endógenas (Pt y Qt) y una exógena (Ft).
La forma reducida del modelo es:
Qt=π11Ft+π12Prt+π13Rt
Pt=π21Ft+π22Prt+π23Rt
Relacionando los parámetros de la forma estructural con los de la forma reducida se obtiene un
sistema de 6 ecuaciones y 5 incógnitas, que se corresponden a los coeficientes a estimar en el
modelo de oferta y demanda, tal que:
21 11
11 121 11 21 11 21
23
11 21 11 21
11 2321 11 21 12
11 21 11 21 11 2111 12 13
21 22 23 2311 12
11 21 11 21 11 21
0
0 01 1B
α αβ βα α α α
βα α α α
α βα β α βα α α α α απ π π
π π π ββ βα α α α α α
−
− − − − − Π = −Γ = − −− − −
− − − − − = − − − − −
A partir de los parámetros de la forma reducida podemos obtener los valores de los coeficientes
asociados al modelo; por ejemplo, si dividimos π13 por π23 obtenemos el valor de α11 que:
1311
23
παπ
=
Pero para algunos parámetros se pueden obtener dos soluciones:
1121
21
1221
22
παππαπ
=
=
De lo que se deduce que la ecuación (7.10) del modelo está sobreidentificada.
7.4.1. Condiciones de Orden y Rango en la Identificación Para comprobar si las ecuaciones de un sistema de ecuaciones están identificadas se utilizan dos
sencillas condiciones. Por un lado, tenemos la condición de orden, según la cual para que una
ecuación esté identificada debe verificarse que el número de variables exógenas excluidas en la
ecuación j debe ser, al menos, tan alto como el número de variables endógenas incluidas en dicha
ecuación.
En términos matemáticos deberá cumplirse que:
K – k ≥ m – 1 (7.11)
Donde:
K = número de variables exógenas en el modelo.
k = número de variables exógenas en una ecuación dada.
m = número de variables endógenas en una ecuación dada.
En particular, tomando en consideración el signo de la desigualdad tenemos que
• Si K – k < m – 1, diremos que la ecuación está subidentificada por lo que no será posible
estimar el sistema al no haber información suficiente para ello (en términos algebraicos,
diríamos que es un sistema incompatible).
• Si K – k = m – 1, la ecuación está exactamente identificada lo que implica que tenemos
información suficiente para poder estimar el modelo y recuperar los parámetros de la
forma estructural (en términos algebraicos, se trataría de un sistema compatible
determinado).
• Si K – k > m – 1, la ecuación está sobreidentificada existiendo varias soluciones posibles
para los parámetros de la forma estructural a causa de un exceso de información, si bien
en este caso la estimación de los parámetros de la forma estructural es viable utilizando
el método de Mínimos Cuadrados en 2 Etapas que veremos en el siguiente capítulo (en
términos algebraicos, tendríamos un sistema compatible indeterminado).
La condición de orden de identificación puede simplificarse sumando (M–m) a ambos lados de la
desigualdad (7.11), siendo M el número de ecuaciones del modelo, tal que:
(K – k) + (M – m) ≥ (m – 1) + (M – m)
Operando queda:
(K – k) + (M – m) ≥ M – 1
Con ello, para aplicar la condición de orden ahora sólo tenemos que contar el número de variables
endógenas y exógenas excluidas en la ecuación analizada y comparar dicho número con el total
de variables endógenas del sistema menos uno.
De esta forma, si el número de variables endógenas y exógenas excluidas supera al número de
ecuaciones menos uno, la ecuación analizada estará sobreidentificada; si es igual estará
exactamente identificada; y si es menor estará subidentificada.
Sin embargo, la condición de orden es una condición necesaria pero no suficiente para la
identificación, por lo que es necesario plantear otra condición que sí es necesaria y suficiente. Se
trata de la condición de rango, que pasamos a ver a continuación.
La condición de rango señala que en un modelo que contiene M variables endógenas en M
ecuaciones, una ecuación estará identificada si y sólo si puede construirse al menos un
determinante diferente de cero, de orden ( 1) ( 1)M M− × − a partir de los coeficientes de las
variables endógenas y predeterminadas excluidas de la ecuación que se analiza, pero incluidas en
el resto de ecuaciones del modelo.
En resumen, para llevar a cabo la identificación de un sistema de ecuaciones simultáneas deben
seguirse los siguientes pasos:
1. Aplicar la condición de orden para saber si una ecuación está subidentificada,
exactamente identificada o sobreidentificada.
2. Aplicar la condición de rango; en caso de verificarse confirmaremos el resultado
obtenido con la condición de orden.
Ejemplo 7.4.
Volviendo al modelo de ecuaciones simultáneas de oferta y demanda del Ejemplo 7.3, tenemos
que:
− Variables predeterminadas del modelo K=3.
− Variables predeterminadas en la ecuación de demanda k=2.
− Variables predeterminadas en la ecuación de oferta k=1.
− Número de ecuaciones en el modelo M=2.
− Variables endógenas en la ecuación de demanda m=2.
− Variables endógenas en la ecuación de oferta m=2.
Qt=α11Pt+β11Prt+β12Rt + u1t, α11<0 (7.9)
Qt=α21Pt+β23Ft + u2t, α21>0 (7.10)
La condición de orden de identificación del modelo quedaría establecida como sigue:
1. La ecuación de demanda, tal y como se ha formulado, contiene dos variables endógenas y dos
exógenas, y excluye una variable (Ft), que sería igual al número de endógenas incluidas en la
ecuación menos una, estando por tanto la ecuación de demanda exactamente identificada.
K–k=m–1 ⇒ 3-2=2-1 ⇒ 1=1
2. Por su parte, la ecuación de oferta, posee dos variables endógenas y una exógena, excluyendo
por tanto 2 variables (Prt y Rt), lo que supera al número de endógenas incluidas en la ecuación
menos una, por lo que la ecuación de oferta está sobreidentificada, tal que:
K–k=m–1 ⇒ 3-1>2-1⇒ 2>1
Procedemos a confirmar los resultados obtenidos con la condición de orden aplicando la
condición de rango. Dicha condición establece que una ecuación está identificada, si y sólo si
puede construirse por lo menos un determinante diferente de cero, de orden ( 1) ( 1)M M− × − a
partir de los coeficientes de las variables (endógenas y predeterminadas) excluidas de esa
ecuación particular, pero incluidas en las otras ecuaciones del modelo; en nuestro caso, dicho
determinante debe ser de orden(2 1) (2 1)− × − = 1.
Para analizar la condición de rango lo más práctico es formar la siguiente tabla con los coeficientes
asociados a las variables endógenas y predeterminadas:
Qt Pt Prt Rt Ft Ecuación de demanda 1 α11 β11 β12 0 Ecuación de oferta 1 α21 0 0 β 23
A continuación debemos comprobar si existe algún determinante no nulo asociado a las matrices
que se pueden formar con los coeficientes asociados a las variables excluidas.
En la ecuación de demanda se verifica la condición de rango ya que existe un determinante no
nulo10 de orden 1 1 × , 23β tal y como puede apreciarse en la siguiente tabla:
Qt Pt Prt Rt Ft Ecuación de demanda 1 α11 β11 β12 0 Ecuación de oferta 1 α21 0 0 β 23
10
A priori, se supone que ningún parámetro es igual a cero.
En la ecuación de oferta también se cumple la condición de rango ya que existen dos
determinantes no nulos de orden 1 1× : 11β y 12β :
Qt Pt Prt Rt Ft Ecuación de demanda 1 α11 β11 β12 0 Ecuación de oferta 1 α21 0 0 β 23
En conclusión, la ecuación de demanda está exactamente identificada y que la ecuación de oferta
está sobreidentificada, resultado este que ya se intuía en el Ejemplo 7.3.
7.5. PROBLEMAS
7.1. Considere el siguiente modelo de oferta y demanda de dinero en desviaciones respecto a la
media:
1 2 3 1
1 2
Dt t t t t
Ot t t
D Ot t
M Y R P u
M Y u
M M
β β βα
= + + +
= +
=
Discuta la identificabilidad de las ecuaciones del modelo.
7.2. Estudie la identificabilidad del siguiente modelo de ecuaciones simultáneas:
1 13 3 11 1 13 3 1
21 1 2 21 1 22 2 2
32 2 3 32 2 33 3 3
t t t t t
t t t t t
t t t t t
y y x x u
y y x x u
y y x x u
α β βα β βα β β
+ + + =+ + + =+ + + =
7.3. Dado el siguiente modelo estructural:
1 12 2 11 1 1
2 21 1 22 2 2
t t t t
t t t t
y y x u
y y x u
α βα β
= + += + +
Se ha estimado la forma reducida, obteniendo los siguientes valores:
1 1 2
2 1 2
5 8
6 2t t t
t t t
y x x
y x x
= += −
A partir de las estimaciones obtenidas, recupere los valores de los parámetros estructurales.
7.4. En el modelo de gasto público de Pindyck y Rubinfeld:
i
i
vPSEXPAID
uPOPINCAIDEXP
+++=++++=
321
4321
δδδββββ
donde EXP es el gasto público de cada región, AID las ayudas que recibe del gobierno
central, INC los ingresos tributarios de las regiones, POP la población y PS la población en
edad escolar.
En principio INC, POP y PS se consideran exógenas. Debido a la posibilidad de que existiera
simultaneidad entre EXP y AID, se efectúa una regresión de AID sobre INC, POP y PS, siendo
iw los términos de error calculados en dicha regresión, obteniéndose los siguientes resultados
(entre paréntesis se presenta la desviación típica de cada parámetro estimado):
ˆ89.41 4.50 0.00013 0.518 1.39
( 1.44) (0.89) (0.50) ( 0.02) ( 0.93)iEXP AID INC POP w= − + + − −
− − −
Para una muestra de tamaño N=25 y al 95% de confianza, ¿sería válida la estimación de la
primera ecuación por MCO? ¿Y para un nivel de confianza del 90%?
SOLUCIONES
7.1. La ecuación de demanda está subidentificada y la ecuación de oferta está
sobreidentificada.
7.2. Las tres ecuaciones están exactamente identificadas.
7.3. 12 21 11 22
6 144; ; 29;
5 5α α β β= = − = − = −
7.4. La estimación es válida al 95% de confianza pero no al 90%, ya que en ese caso el
coeficiente asociado a iw sería significativo.
8. MÉTODOS DE ESTIMACIÓN DE MODELOS DE
ECUACIONES SIMULTÁNEAS
8.1. INTRODUCCIÓN
Como acabamos de ver en el capítulo anterior, la estimación de la forma estructural de modelos
de ecuaciones simultáneas utilizando el método de Mínimos Cuadrados Ordinarios presenta
importantes problemas ya que los estimadores son inconsistentes. Por ello, en este capítulo vamos
a ver diferentes métodos de estimación mediante los que sí es posible obtener estimaciones
consistentes de los parámetros del modelo.
8.2. MÍNIMOS CUADRADOS INDIRECTOS (MCI)
Este método resulta válido únicamente para la estimación de modelos de ecuaciones exactamente
identificados y permite estimar los coeficientes de la forma estructural a partir de las estimaciones
MCO de los parámetros de la forma reducida del modelo.
Sea el siguiente modelo de ecuaciones simultaneas:
Podemos poner la ecuación (8.6) en forma matricial:
12
21 1 11 21 111 11
22 2 12 22 2 112 12
11
12
2 1 21 1
1
.. .. .
.. ..
. .. . . . .. .. .
. .. . . . .. .. .
.. .. .
n m
n m n
T nT T T mTT T
m
Y Y X X XY v
Y Y X X XY v
Y Y X X XY v
γ
γδδ
δ
= +
O también:
[ ] [ ] [ ]111 vXYy +
=
δγ
(8.7)
El estimador MCO de (8.7) será:
[ ] [ ]11
1
11
ˆˆ
yX
YXY
X
Y
=
−
δγ
Operando, tenemos que:
[ ] [ ] [ ]
+
=
−
ivXYX
YXY
X
Y
δγ
δγ
11
1
11
ˆˆ
[ ] [ ] [ ]1 1
1 11 1 11 1 1
1
Y vY Y Y
Y X Y X Y XXvX X X
γδ
− − = +
[ ]1
1 111
1
Y vY
Y XXvX
γδ
− = +
Dado que Y1 y v1 están correlacionados, al tomar esperanzas resulta que:
[ ]
≠
+
=
−
δγ
δγ
δγ
1
11
1
11
ˆˆ
Xv
vYXY
X
YEE
En definitiva, la correlación que existe entre las matrices Y1 y v1 es la que provoca que la
estimación MCO de la ecuación (8.6) proporcione estimadores que no satisfagan las propiedades
de consistencia e insesgadez.
Dado que los problemas de estimación vienen dados por la correlación existente entre las matrices
Y1 y v1, para eliminar dichos problemas es necesario disponer de otra matriz, Z*, denominada
matriz de variables instrumentales, que deberá incluir como mínimo tantas variables como
columnas tenga la matriz Y1 y cumplir dos condiciones:
− Las variables que contiene esta nueva matriz deben estar correlacionadas con las
variables incluidas en Y1.
− La correlación entre las variables que aparecen en Z* y v1 ha de ser nula.
Tal y como vimos en el capítulo 4, en los modelos uniecuacionales las variables instrumentales
son variables ajenas al modelo, altamente correlacionadas con la variable que sustituyen como
explicativa e independientes a su vez de la perturbación aleatoria. En el caso de los modelos de
ecuaciones simultaneas, cabe la posibilidad de seleccionar variables instrumentales de entre las
variables exógenas y predeterminadas que no han sido incluidas en la ecuación que se estima.
Asimismo, hay que tener presente que el número de variables instrumentales no debe ser menor
que el número de variables endógenas que aparecen como explicativas.
Veamos a continuación cómo estimar una ecuación por variables instrumentales. Sea una matriz
de variables instrumentales Z* de la forma:
* *21 1 11 21 1* *
22 2 12 22 2*
* *2 1 2
.. ..
.. ..
. .. . . . .. .
. .. . . . .. .
.. ..
n m
n m
T nT T T mT
Y Y X X X
Y Y X X X
Z
Y Y X X X
=
donde los instrumentos *
1Y están correlacionados con Y1 pero no con el término de error v1.
Expresando la matriz de variables instrumentales en términos matriciales:
[ ]XYZ *1
* =
y premultiplicando la expresión (8.7) por Z* ’ se obtiene:
[ ] [ ] [ ]* * *
1 1 11 1 1·
Y Y Yy Y X v
X X X
γδ
= +
De donde se obtiene el Estimador de Variables Instrumentales (VI):
[ ] [ ]1
*1
1
1
*1
ˆˆ
yX
YXY
X
Y
=
−
δγ
Si denominamos [ ]1Z Y X= , tenemos entonces que:
( ) 1* *1
ˆ' '
ˆB Z Z Z y
γ
δ− = =
La matriz Z* de instrumentos deberá cumplir las siguientes propiedades asintóticas:
• ZZT
ZZp *'
* 'lim ∑=
es una matriz no singular que indica la existencia de
correlación entre las endógenas y sus instrumentos.
• ***'
** 'lim
ZZT
ZZp ∑=
es una matriz simétrica definida positiva
• 0'
lim 1*
=
T
vZp que expresa la ausencia de correlación entre los
instrumentos y el término de perturbación.
Si se verifican estas condiciones, entonces el estimador VI es consistente (aunque no es
insesgado), siendo su matriz de varianzas y covarianzas:
( ) ( ) ( )1
1 12 * * * *'
ˆcov( ) ' ' 'vB Z Z Z Z Z Zσ− − =
Siendo 1
2 1 1( ) '( )ˆv
y ZB y ZB
T kσ − −=
−
No obstante hay que tener presente la indeterminación que la estimación VI provoca en modelos
simultáneos con ecuaciones sobreidentificadas. Por ejemplo, consideremos el siguiente modelo
en el que la primera ecuación está sobreidentificada:
Y1t+α21Y2t+β11X1t=u1t
α12Y1t+Y2t+β22X2t + β23X3t =u1t
Para estimar la primera ecuación por VI podemos utilizar como instrumento de Y2t las variables
exógenas X2t ó X3t , de tal forma que Z* puede ser:
31 1121 11
32 1222 12* *
3 12 1
a b
T TT T
X XX X
X XX XZ Z
X XX X
= =
M MM M
Por lo que las estimaciones VI obtenidas utilizando la matriz *aZ y
*bZ serán diferentes.
8.3.1. Estimación una función keynesiana de consumo por VI
Se parte de nuevo del modelo macroeconómico Keynesiano de la renta de equilibrio:
Ct = α+βYt
Yt = Ct + I t
donde Ct es el consumo, I t es la inversión e Yt la renta nacional.
Se utiliza I t como instrumento en la estimación de Ct, de forma que las matrices de variables
endógenas, exógenas e instrumentos serán:
1
21
1
2
1
2
.
1
1
..
1
1
1*
..
1
T
T
T
C
Cy
C
Y
YZ
Y
I
IZ
I
=
=
=
Con las que calculamos:
1*
1 1
1*1
1
1* *
2
1 1
'
'
'
T
tt
T T
t t tt t
T
tt
T
t tt
T
tt
T T
t tt t
T Y
Z Z
I I Y
C
Z y
I C
T I
Z Z
I I
=
= =
=
=
=
= =
=
=
=
∑
∑ ∑
∑
∑
∑
∑ ∑
Con los datos de las series de la Contabilidad Nacional Trimestral Española utilizados en el
ejemplo anterior, la estimación de los coeficientes por VI es:
1116 967 747 0.3636
221 1934 1490 0.7289B
− = =
De forma que la estimación VI de la función de consumo resulta ser:
Ct = 0.3636 + 0.7289Yt
Si la suma residual del modelo es 3.17, tenemos que la varianza del error de estimación es:
1
2 1 1( ) '·( ) 3.170.028
116 2v
y ZB y ZB
T kσ − −= = =
− −
Con lo que la matriz de varianzas y covarianzas de los estimadores es:
( ) ( ) ( )1
1 11 12 * * * *
' 116 967 116 221 116 967ˆ ' ' ' 0.028
221 1934 221 444 221 1934
0.1856 0.09290.028
0.0058 0.0030
v Z Z Z Z Z Zσ− −
− − = =
− = −
Para contrastar si la propensión marginal al consumo es significativamente distinta de cero,
necesitamos su desviación típica tal que:
ˆ( ) 0.028 0.0030 0.0092DesvTipβ = × =
Dado que la desviación típica es βσ = 0.0092, el estadístico t es:
ˆ 0.728979.23
0.0092t
β
βσ
= = =
Valor sensiblemente superior a 1.645, valor tabulado para una distribución t de Student con 114
grados de libertad al 95% de confianza.
Resultado que confirma que el parámetro β es significativamente distinto de cero, por ser mayor
que el valor de teórico de una t de Student (ttco=1.980) con 112 grados de libertad con un nivel de
confianza del 95%.
A su vez la varianza del parámetro α es:
ˆ( ) 0.028 0.1798 0.00503Var α = ⋅ =
Al ser la desviación típica 0.07ασ = ; el estadístico t es, por tanto:
ˆ 0.263.61
0.07t
α
ασ
= = =
por lo que α resulta también estadísticamente significativo.
8.4. MÍNIMOS CUADRADOS EN DOS ETAPAS (MC2E)
El método denominado Mínimos Cuadrados en 2 Etapas (MC2E), al igual que los métodos de
Mínimos Cuadrados Indirectos y Variables Instrumentales, intenta dar una solución al problema
de la inconsistencia de los estimadores MCO en los sistemas de ecuaciones simultáneas. Sin
embargo, este método presenta la ventaja adicional de que puede utilizarse tanto en ecuaciones
exactamente identificadas como sobreidentificadas.
En particular, en el caso de las ecuaciones sobreidentificadas, la aplicación del método MC2E
ofrece un único valor para cada parámetro, que puede considerarse una combinación lineal de los
diversos estimadores que se obtendrían aplicando MCI. Por su parte, si se utiliza MC2E en
ecuaciones exactamente identificadas se obtiene la misma estimación que con los métodos MCI
y VI.
El método MC2E, como su propio nombre indica, consta de dos etapas:
− En una primera etapa, para eliminar la correlación existente entre la(s) variable(s)
endógena(s) y el término de error, se realiza la regresión de la(s) variable(s)
endógena(s) sobre todas las variables predeterminadas del modelo.
− Posteriormente, en una segunda etapa las regresiones efectuadas en la primera etapa
se utilizan para sustituir las variables endógenas de la ecuación inicial por los valores
estimados en la primera etapa. Seguidamente se estima la relación original con los
nuevos valores.
Por ejemplo, si partimos de un modelo de ecuaciones simultáneas con dos variables endógenas
Y1, Y2, y cuatro variables exógenas X1 , X2, X3, X4, la estimación por MC2E de la siguiente ecuación
del modelo:
ttttt uXXYY 2424323201212 ++++= βββα
Requiere en la primera etapa estimar:
Y1t=π10+π11X1t+π12X2t+π13X3t+π13X3t+v1t
De tal forma que:
ttt vYY 111ˆ +=
En la segunda etapa se reemplaza Y1t por los valores estimados en la etapa anterior tY1 , quedando
ahora la ecuación original como:
tttttt uXXvYY 24243232011212 )ˆ( +++++= βββα
tttttt uvXXYY 2121424323201212ˆ +++++= αβββα
*2424323201212
ˆttttt uXXYY ++++= βββα
La estimación de esta ecuación nos asegura la consistencia de las estimaciones MCO, al no estar
correlacionada tY1 con Y2t y a la vez sí estar muy correlacionada con X3 y X4 .
El método MC2E puede también resolverse de forma matricial: supongamos que la relación i-
ésima del modelo es:
yi =Yjαj + Xjβj+uj
donde yi es el vector de la variable endógena, Yj es la matriz de las variables endógenas
predeterminadas y Xj es la matriz de las variables exógenas de la ecuación.
Entonces los estimadores MC2E del modelo se obtienen resolviendo:
$
$
$' $ $'
' $ '
$'
'
αβ
j
j
j j j j
j j j j
j i
j i
Y Y Y X
X Y X X
Y y
X y
=
−1
(8.8)
siendo:
$ ( ' ) 'Y X X X X Yj j= −1
' 1ˆ ˆ ' ( ' ) 'j j j jY Y Y X X X X Y−=
' 1ˆ ' ( ' ) 'j j j iY y Y X X X X y−=
ˆ ' 'j j j jY X Y X=
Donde X es la matriz de todas las variables exógenas del modelo.
Así, por ejemplo en la estimación MC2E del modelo:
y1=α11y2+β11x1+u1
y2=α11y1+β22x2+β23x3+u2
Hay que estimar la primera relación del modelo, teniendo presente que yi=y1 , Yj=y2 y Xj=x1
[ ]Y X y x y x y x
X X
x x x x x
x x x x x
x x x x x
X X x
X y x y
j
j j
j i
'
'
'
'
=
=
=
=
∑ ∑ ∑
∑ ∑ ∑∑ ∑ ∑∑ ∑ ∑∑∑
2 1 2 2 2 3
12
1 2 1 3
2 1 22
2 3
3 1 3 2 32
12
1 1
Para estimar la segunda ecuación del modelo hay que tener presente que yi=y2 , Yj=y1 y
[ ]32 xxX j =
1 1 1 2 1 3
22 2 3
22 3 3
2 2
3 2
'
'
'
j
j j
j i
Y X y x y x y x
x x xX X
x x x
x yX y
x y
=
=
=
∑ ∑ ∑∑ ∑∑ ∑∑∑
Los errores asociados a los coeficientes se calculan a través de la formulación asintótica de la
matriz de covarianzas para muestras finitas, es decir:
112
ˆ '( ' ) ' 'ˆˆ ' '
j j j j jj
j j j jj
Y X X X Y Y XVar
X Y X X
ασ
β
−− =
(8.9)
siendo:
( ) ( )2
'ˆ ˆˆ ˆˆ
i j j j j i j j j j
j
y Y X y Y X
T k
α β α βσ
− − − −=
−
es decir, la suma residual del modelo dividida por los grados de libertad de la ecuación que se
estima (número de observaciones menos número de parámetros que se estiman).
8.4.1. Estimación de un modelo de gastos e ingresos por MC2E Supongamos que una empresa pretende conocer la evolución de sus ingresos (ING), teniendo en
cuenta los gastos de explotación (GAS), el capital invertido (SK), el número de trabajadores (L) y
un índice de actividad económica (ACT). Para ello, plantea el siguiente modelo de ecuaciones
simultáneas expresado en desviaciones con respecto a la media:
INGt = a1GASt + a2SKt +a3Lt + ut
GASt = b1INGt + b2ACTt + vt
Para estimar el modelo la empresa dispone de la siguiente matriz de sumas de productos cruzados
de las variables del modelo:
ING GAS SK L ACT
ING 11.25 -5.63 -11.25 22.50 -5.63
GAS -5.63 90.00 -5.63 22.50 -4.50
SK -11.25 -5.63 11.25 5.00 7.00
L 22.50 22.50 5.00 22.50 2.00
ACT -5.63 -4.50 7.00 2.00 11.25
Aplicando las condiciones de orden y rango tenemos que:
La estimación de la ecuación de precios por MCO es:
Estadísticas de la regresión Coeficiente de correlación múltiple 0.84337111 Coeficiente de determinación R2 0.71127483 R2 ajustado 0.7040567 Error típico 0.01762477 Observaciones 83
Coeficientes Error típico Estadístico t Constante 0.01272847 0.00410008 3.104446 Crecimiento de los salarios medios por ocupado del trimestre anterior
0.68870367 0.0541869 12.7097812
Crecimiento anual de la productividad 0.18542501 0.11484988 1.61449891
En consecuencia, la función de precios de la economía española es la siguiente:
Pt=0.0127+0.6887Wt-1+0.1854Lt+u1t
Por su parte, la estimación de la ecuación de salarios ofrece los siguientes resultados:
Estadísticas de la regresión Coeficiente de correlación múltiple 0.86580246 Coeficiente de determinación R2 0.74961391 R2 ajustado 0.74335425 Error típico 0.02010504 Observaciones 83
Coeficientes Error típico Estadístico t Término constante 0.03663072 0.01505487 2.43314844 Crecimiento del deflactor PIB 1.00434242 0.07172996 14.0017142 Tasa de desempleo -0.0015008 0.00069398 -2.16258469
La función de salarios de la economía española quedaría como sigue:
Wt= 0.0366–0.0015Ut+1.004Pt+u2t
En la que se puede apreciar como el aumento de la tasa de paro desacelera el crecimiento de los
salarios en España.
8.6. EJEMPLO PRÁCTICO: ESTIMACIÓN DE UN MODELO
EXACTAMENTE IDENTIFICADO POR MCI, VI Y MC2E
A continuación se presenta un ejemplo en el que se aplican todos los métodos de estimación presentados a lo largo del capítulo. Para ello, retomamos el ya conocido modelo de oferta y demanda clásico, en el que se ha omitido la variable Ft por no ser significativa, tal que:
Qt=a1Pt+a2Rt+u1t
Pt=b1Qt+b2Prt+u2t
La matriz de sumas de productos cruzados de las variables del modelo es la siguiente:
Q P R Pr Q 3.5 3 1 1
P 3 11.5 1 3
R 1 1 1 0
Pr 1 3 0 1
A fin de saber qué método de estimación es el más apropiado, procedemos a la identificación del
modelo aplicando las condiciones de orden y rango:
Q P R Pr 1ª Ecuación 1 a1 a2 0 2ª Ecuación b1 1 0 b2
1ª ecuación Rang[b2] = 1 = 2–1 Ec. Identificada
2ª ecuación Rang[a2] = 1 = 2–1 Ec. Identificada
Al estar ambas ecuaciones exactamente identificados podemos aplicar indistintamente los tres
métodos descritos en el capítulo (MCI, VI, MC2E), ya que las estimaciones obtenidas por
cualquiera de ellos serán iguales.
Mínimos Cuadrados Indirectos
La forma reducida del modelo es:
Qt= π11Rt + π12Prt+e1t
Pt= π21Rt + π22Prt +e2t
La estimación de los parámetros de la forma reducida es:
1211 21
212 22
Pr 1 1ˆ 'Pr PrPr Pr 1 3
t t t tt t t
t t t tt t t
R Q R PR R
Q PR
π ππ π
− Π = = =
∑ ∑∑ ∑∑ ∑∑ ∑
A partir de los parámetros de la forma reducida, podemos recuperar los parámetros estructurales
mediante la siguiente expresión:
ˆ BΓΠ = −
Por tanto:
1 2
1 2
1 01 1
1 01 3
a a
b b
− = −
A partir de las matrices anteriores podemos construir el siguiente sistema de ecuaciones:
1 2
1
1
1 2
1
1 3 0
1 0
3
a a
a
b
b b
− =− =− =− =
Despejando los parámetros del sistema de ecuaciones anterior obtenemos que:
a1 = 0.33, a2 = 0.67 , b1 = 1, b2 = 2
Por lo que el modelo estimado es:
Qt = 0.33Pt + 0.67Rt+u1t
Qt = Pt + 2Prt+u2t
Variables Instrumentales
1ª Ecuación
Vamos a utilizar la variable Prt como instrumento de Pt para la estimación de la primera ecuación,
por lo que las matrices de variables endógenas, exógenas e instrumentos serán, respectivamente:
1 1 1 1 1
2 2 2 2 21
Pr
Pr *
PrT T T T T
Q P R R
Q P R Ry Z Z
Q P R R
= = =
M M M M M
A partir de dichas matrices podemos calcular:
* *12
Pr Pr Pr' '
Pt t t t t t
t t t t t
P R QZ Z Z y
R R R Q
= =
∑ ∑ ∑∑ ∑ ∑
Siendo la estimación de la primera ecuación:
( )1
11 * *1
2
3 0 1 0.33' '
1 1 1 0.67
aZ Z Z y
a
−− = = =
2ª Ecuación
En este caso, se utiliza Rt como instrumento de Qt, siendo las matrices de variables endógenas,
exógenas e instrumentos respectivamente:
1 1 1 1 1
2 2 2 2 21
Pr Pr
Pr Pr *
Pr PrT T T T T
P Q R
P Q Ry Z Z
P Q R
= = =
M M M M M
Con las que podemos obtener:
* *12
Pr' '
Pr Pr Prt t t t t t
t t t t t
R Q R R PZ Z Z y
Q P
= =
∑ ∑ ∑∑ ∑ ∑
La estimación de la segunda ecuación resulta ser:
( )1
11 * *1
2
1 0 1 1' '
1 1 3 2
bZ Z Z y
b
−− = = =
Mínimos Cuadrados en 2 Etapas
1ª Ecuación
Dado que ya hemos estimado la forma reducida del modelo al aplicar Mínimos Cuadrados
Indirectos, aprovecharemos el resultado obtenido en ese apartado ya que en la primera etapa es
necesario estimar:
Pt= π21Rt + π22Prt +e2t
La estimación dió el siguiente resultado:
Pt = Rt + 3Prt +e2t
En la segunda etapa debemos calcular:
12
1 1
22
ˆ ˆ ˆ( ' ) '
ˆt t t t t
t tt t t
P PRa Q PX X X Y
a Q RPR R
−
− = =
∑ ∑ ∑∑∑ ∑
Previamente debemos obtener los productos cruzados asociados a tP :
2 2 2 2 2 2ˆ ( 3Pr ) 1 +3 Pr 2·1·3 Pr 10t t t t t t tP R R R= + = + =∑ ∑ ∑ ∑
2
ˆ (1 3) 1Prt
t tt t
RP R
R
= =
∑∑ ∑
ˆ (1 3) 4Pr
t tt t
t
RQQ P
Q
= =
∑∑ ∑
La estimación de la primera ecuación resulta ser:
1
1
2
10 1 4 0.33
1 1 1 0.67
a
a
− = =
También podemos estimar la ecuación aplicando la forma matricial del estimador; así,
denominando yi=Qt, Yj=Pt y Xj=[Rt] tenemos que:
2
' Pr
'
'
j t t t t
j j t
j i t t
Y X R P P
X X R
X y R Q
=
=
=
∑ ∑∑∑
Por tanto:
' 1
12
2
'
ˆ ˆ ' ( ' ) '
Pr· · 10
Pr PrPr Pr
j j j j
t t t tt t t
t t t tt t t
Y Y Y X X X X Y
R P R PR R
P PR
−
−
=
= =
∑ ∑∑ ∑∑ ∑∑ ∑
( )'ˆ ' 1j j j j t tY X Y X PR= = =∑
' 2 1j j tX X R= =∑
' 1
12
2
'
ˆ ' ( ' ) '
Pr· · 4
Pr PrPr Pr
j j j j
t t t tt t t
t t t tt t t
Y y Y X X X X y
PR Q RR R
P QR
−
−
=
= =
∑ ∑∑ ∑∑ ∑∑ ∑
' 1j j t tX y R Q= =∑
Sustituyendo los valores en la expresión matricial del estimador tenemos que:
1 1
1
2
ˆ ˆ ˆ ˆ' ' 10 1 4 0.33'ˆ 1 1 1 0.67'' '
j j j j j i
j ij j j j
Y Y Y Xa Y y
a X yX Y X X
− − = = =
2ª Ecuación
Nuevamente utilizamos los resultados obtenidos al estimar la forma reducida al aplicar MCI, dado
que ahora hay que estimar la siguiente relación:
Qt= π11Rt + π12Prt +e1t
Recordemos que el resultado que se obtuvo fue:
Qt = Rt + Prt +e1t
En la segunda etapa debemos calcular:
12
1 1
22
ˆ ˆ ˆPr( ' ) '
ˆ PrPr Pr
t t t t t
t tt t t
Q Qb Q PX X X Y
b PQ
−
− = =
∑ ∑ ∑∑∑ ∑
Previamente debemos obtener los productos cruzados asociados a tP :
2 2 2 2 2 2ˆ ( Pr ) 1 +1 Pr 2·1·1 Pr 2t t t t t t tQ R R R= + = + =∑ ∑ ∑ ∑
2
Prˆ Pr (1 1) 1Prt t
t tt
RQ
= =
∑∑ ∑
ˆ (1 1) 4Pr
t tt t
t t
R PQ P
P
= =
∑∑ ∑
La estimación de la segunda ecuación es:
1
1
2
2 1 4 1
1 1 3 2
b
b
− = =
Alternativamente podemos estimar la ecuación aplicando la forma matricial del estimador; así,
denominando yi=Pt, Yj=Qt y Xj=[Prt] tenemos que:
2
' Pr
' Pr
' Pr
j t t t t
j j t
j i t t
Y X R Q Q
X X
X y P
=
=
=
∑ ∑∑∑
Por tanto:
' 1
12
2
'
ˆ ˆ ' ( ' ) '
Pr· · 2
Pr PrPr Pr
j j j j
t t t tt t t
t t t tt t t
Y Y Y X X X X Y
RQ R QR R
Q QR
−
−
=
= =
∑ ∑∑ ∑∑ ∑∑ ∑
( )'ˆ ' Pr 1j j j j t tY X Y X Q= = =∑
' 2Pr 1j j tX X = =∑
' 1
12
2
'
ˆ ' ( ' ) '
Pr· · 4
Pr PrPr Pr
j j j j
t t t tt t t
t t t tt t t
Y y Y X X X X y
R Q R PR R
Q PR
−
−
=
= =
∑ ∑∑ ∑∑ ∑∑ ∑
' Pr 3j j t tX y P= =∑
Sustituyendo los valores en la expresión matricial del estimador tenemos que:
1 1
1
2
ˆ ˆ ˆ ˆ' ' 2 1 4 1'ˆ 1 1 3 2'' '
j j j j j i
j ij j j j
Y Y Y Xb Y y
b X yX Y X X
− − = = =
Como puede comprobarse, las estimaciones obtenidas por los tres métodos coinciden al estar las
ecuaciones del modelo exactamente identificadas.
8.7. PROBLEMAS
8.1. Dado el siguiente modelo expresado en desviaciones con respecto a la media:
1 12 2 11 1 12 2
2 21 1 23 3
t t t t t
t t t t
Y b Y a X a X u
Y b Y a X v
= + + += + +
Siendo Yi, variables endógenas, y Xi variables exógenas, estime los parámetros de la forma
reducida del modelo y, a partir de ellos, obtenga las expresiones para los parámetros de la
forma estructural. Para ello, utilice las siguientes matrices producto:
10 0 0 5 10
( ' ) = 0 20 0 ; ( ' ) = 40 20
0 0 10 20 30
X X X Y
8.2. Partimos del siguiente sistema de ecuaciones simultáneas:
1 11 2 10 11 12 1
2 21 1 20 2
t t t t t
t t t
Y Y I G u
Y Y u
β α α αβ α
= + + + += + +
Donde Y1t es la renta nacional (PIB), Y2t es la oferta monetaria, I t el gasto en inversión y Gt el
gasto del gobierno. Estime consistentemente la segunda ecuación del modelo a partir de los
siguientes datos:
Y1 Y2 I G
Y1 38.05 29.73 7.07 5.31
Y2 23.29 5.55 4.15
I 1.33 9.90
G 0.74
1 20,64; 0,5; 1,19; 0,90; 9Y Y I G N= = = = =
8.3. Considere el siguiente sistema de ecuaciones simultáneas:
1 11 2 11 1 1
2 21 1 22 2 23 3 2
t t t t
t t t t t
y y z u
y y z z u
α βα β β
= + += + + +
Las variables y1 e y2 son endógenas y z1, z2 y z3 son exógenas. Todas las variables están en desviaciones respecto a la media y la suma de sus productos cruzados aparece en la siguiente matriz:
y1 y2 z1 z2 z3
y1 50
y2 15 10
z1 1 0 4
z2 3 0 0 5
z3 5 2 0 0 2
En base a esta información estime por Mínimos Cuadrados en dos Etapas la primera ecuación y estime por Mínimos Cuadrados Indirectos la segunda ecuación.
8.4. Considere el siguiente sistema de ecuaciones simultáneas:
1 11 1 12 2
2 21 1 22 2
t t t t
t t t t
Y a X a X u
Y b Y a X v
= + += + +
Siendo Yit variables endógenas y Xit variables exógenas, ambas expresadas en desviaciones respecto a sus medias. Para ello utilice la siguiente matriz de sumas de productos cruzados:
Y1 Y2 X1 x2
Y1 103 47 152 152
Y2 22 70 68
X1 300 100
X2 200
SOLUCIONES
8.1. 12 11 12 21 232 3 1 6 4 3 presenta dos soluciones, al igual queb / ; a / ; a / ; b a= = − =
8.2. 2 1 20.8627 0.0521t t tY Y u= − +
8.3. 1 2 1 1 2 3 22.5 0.25 ; t t t t t t ty y z u y z u= + + = +
8.4. 1 1 2 2 1 20.304 0.608 ; 0.3738 0.056t t t t t t t tY X X u Y Y X v= + + = + +
9. MÉTODOS DE ESTIMACIÓN NO LINEALES
9.1. INTRODUCCIÓN
La teoría económica propone modelos de relación entre variables económicas, pero generalmente
deja indeterminada la forma funcional de dichas relaciones, por lo que en ocasiones dichas
relaciones pueden ser de tipo no lineal. La cuantificación de dichas relaciones exige un
tratamiento distinto al del caso lineal, utilizando técnicas de estimación que generalmente
implican un mayor coste computacional pero que a cambio ofrecen un mejor ajuste.
Por ello, en el presente capítulo se abordan algunas soluciones de cálculo para cuantificar este
tipo de relaciones, las cuales generalmente exigen la utilización de algoritmos de optimización
numérica en los que, a partir de una expresión general que representa una función de pérdida o de
ganancia, de forma iterativa se evalúa una función objetivo, que variará dependiendo del
procedimiento de estimación elegido, para las distintas combinaciones de los valores numéricos
de los parámetros. El resultado de la estimación final será aquel conjunto de valores paramétricos
que hagan mínima o máxima (según se defina) dicha función objetivo.
Las relacionales no lineales que trataremos no hacen referencia a las variables explicativas sino a
los parámetros incluidos en las relaciones del modelo, ya que las primeras pueden eliminarse
mediante la transformación de datos apropiada. Por ejemplo, si la ecuación que tuviéramos que
estimar fuera:
tttx
t xxey t εβββ +++= 32210 )·ln(1
Bastaría con realizar los siguientes cambios de variable para poder estimar la ecuación mediante
métodos lineales:
ttt
xt
xxz
ez t
322
1
)·ln(
1
==
De tal forma que ahora deberíamos estimar:
tttt zzy εβββ +++= 22110
Ecuación que es completamente lineal tanto en las variables como en los parámetros.
Sin embargo, si el modelo fuera de la forma:
tx
tttexy εβββ ββ +++= 232
2110
No sería posible hacer un cambio de variable similar al que hemos propuesto anteriormente, por
lo que habrá que estimarlo mediante procedimientos de tipo no lineal.
9.2. ESTIMACIÓN DE UN MODELO DE MODELOS NO LINEALES
POR MINIMOS CUADRADOS ORDINARIOS.
Los modelos a estimar no tienen porque ser funciones lineales, pero dado que el método MCO se
aplica exclusivamente a modelos de dependencia lineal, este método podrá utilizarse en todos
aquellos modelos que pueden transformarse en funciones lineales.
Son ejemplos de funciones no lineales que pueden transformarse a lineales, las siguientes:
a) Función Polinómica
La función polinómica:
ktkttt XXXY ββββ ++++= ...2
210
se transforma en lineal:
ktkttt XXXY ββββ ++++= ...22110
Haciendo:
1
22
t t
t t
kkt t
X X
X X
X X
=
=
=M
b) Función Potencial
La función potencial btt aXY = se transforma en lineal tomando logaritmos tal que:
tt XbaY logloglog +=
y se estima:
*10
*
ttXY ββ +=
Haciendo:
tt
tt
XX
YY
log
log*
*
=
=
En consecuencia:
0βea = y 1β=b
c) Función Exponencial
La función exponencial tX
t abY = se transforma en lineal tomando logaritmos tal que:
bXaY tt logloglog +=
y se estima:
ttXY 10
* ββ +=
Haciendo:
* logt tY Y=
En consecuencia 0βea = y 1βeb =
d) Función Logarítmica
La función logarítmica tt XbaY log+= puede estimarse haciendo * logt tX X= , aplicando
MCO después a la expresión:
*10 ttXY ββ +=
En consecuencia 0β=a y 1β=b
9.3. MÍNIMOS CUADRADOS NO LINEALES
El primer método que pasamos a abordar para estimar relaciones de tipo no lineal es el de
Mínimos Cuadrados No Lineales, que no es más que una generalización del procedimiento del
método de Mínimos Cuadrados Ordinarios que venimos utilizando a lo largo del libro. En efecto,
la idea de partida del método mínimo-cuadrático no exige en ningún momento la linealidad del
modelo, si bien la resolución analítica del mismo se complica bastante cuando el modelo no es
lineal.
Consideremos la siguiente expresión de un modelo no lineal:
itt XfY εβ += ),( (11.1.)
Donde f es una función cuya primera derivada es no lineal en β.
El método de Mínimos Cuadrados No Lineales, al igual que su homólogo lineal, trata de
minimizar el sumatorio de los errores del modelo al cuadrado, es decir:
[ ]∑∑==
−==T
ttt
T
tt XfYSR
1
2
1
2 );()(Min βεββ
(11.2.)
Derivando la expresión anterior, obtenemos las condiciones de primer y segundo orden,
necesarias y suficientes para la obtención del mínimo:
Condición de 1º orden
[ ] 0);(
·);(2)(
1
=∂
∂−−=
∂∂
∑=
T
t
ttt
XfXfY
SR
βββ
ββ
Condición de 2º orden
∂∂∂
−−∂
∂∂
∂=
∂∂∂
∑∑==
T
t
ttt
T
t
tt XfXfY
XfXfSR
1
2
1
2
'
);())·;((
'
);(·
);(2
'
)(
ββββ
ββ
ββ
βββ
Matriz que debe ser definida positiva.
Ejemplo 9.1.
Sea el modelo:
tx
tteY εββ β ++= 2
10
Minimizamos la expresión del sumatorio de los residuos del modelo al cuadrado tal que:
[ ]∑∑==
+−==T
t
xt
T
tt
teYSR1
210
1
2 )()( Min 2ββ
ββεβ
Derivando la expresión anterior, tenemos que:
20 1
10
( )2 ( ) 0t
Tx
tt
SRY eββ β β
β =
∂ = − − − = ∂ ∑
2 20 1
11
( )2 ( ) 0t t
Tx x
tt
SRY e eβ ββ β β
β =
∂ = − − − = ∂ ∑
2 20 1 1
12
( )2 ( ) 0t t
Tx x
t tt
SRY e x eβ ββ β β β
β =
∂ = − − − = ∂ ∑
Las ecuaciones obtenidas no poseen una solución analítica directa por lo que es necesario un
método iterativo para obtener los valores de los parámetros βi. Uno de los métodos utilizados para
resolver este tipo de problemas es el algoritmo de Newton-Raphson que pasamos a examinar a
continuación.
9.3.1. Algoritmo de Newton-Raphson
Supongamos que disponemos de una estimación iβ del mínimo β de la función );( βtXf ,
cuyas derivadas son continuas. Si consideramos un entorno del punto iβ , el valor numérico de f
en un punto de dicho entorno puede aproximarse mediante un desarrollo en serie de Taylor de
orden 2 tal que:
[ ] [ ] )ˆ()ˆ()'ˆ(2
1)ˆ()ˆ()ˆ()();( 2'
iiiiiit fffMXf βββββββββββ −∇−+−∇+=≅
Donde )ˆ( if β∇ y )ˆ(2if β∇ son, respectivamente, el gradiente (vector k x 1) y la matriz hessiana
(matriz simétrica de orden k x k) de la función )(βf evaluados en el punto iββ ˆ= .
Podemos mejorar la estimación actual, iβ , reemplazándola por aquel vector que minimice la
expresión cuadrática anterior tal que:
[ ] 0)ˆ()ˆ()ˆ( *2 =−∇+∇=∂∂
iii ffM βββββ
De donde obtenemos que:
[ ] )ˆ()ˆ(ˆˆ 12*1 iiii ff βββββ ∇∇−==
−
+ (11.3.)
La expresión (11.3) permite aproximarse al valor desconocido del vector de parámetros β a partir
de un vector inicial de estimaciones iβ suficientemente próximo a él.
Debe observarse que el punto *β que escogemos como nueva estimación minimiza realmente el
valor de f en el entorno de iβ si la matriz hessiana )ˆ(2if β∇ es definida positiva, lo que estará
garantizado si f es convexa en el punto iβ (es decir, si dicho punto estaba ya lo suficientemente
próximo a un mínimo local de f).
El procedimiento iterativo mediante el que se sustituyen las sucesivas estimaciones obtenidas a
través de la expresión (11.2) como punto de partida en la siguiente etapa del procedimiento hasta
que se satisfagan los criterios de convergencia que el investigador determine (por ejemplo, que la
diferencia entre las estimaciones de los parámetros obtenidos en cada etapa sea inferior a una
determinada cantidad) es lo que se conoce como algoritmo de Newton-Raphson.
La utilización de este algoritmo exige que se verifiquen dos supuestos: por un lado, deben existir
las derivadas que en él aparecen; asimismo, el hessiano de la función debe ser invertible.
El algoritmo de Newton-Raphson permite obtener numéricamente el estimador mínimo-
cuadrático de un modelo en el que Y es una función no lineal de β. En tal caso, la función objetivo
será la que vimos en (11.1), es decir:
[ ]∑=
−==T
ttt XfYSRf
1
2);()()( βββ
Se trata de hallar aquel vector de coeficientes β que minimiza la suma residual al cuadrado,
)(βSR . Para ello tomaremos las expresiones del gradiente y de la matriz hessiana que veíamos
anteriormente:
[ ] 0);(
·);(2)(
1
=∂
∂−−=
∂∂
∑=
T
t
ttt
XfXfY
SR
βββ
ββ
∂∂∂
−−∂
∂∂
∂=
∂∂∂
∑∑==
T
t
ttt
T
t
tt XfXfY
XfXfSR
1
2
1
2
'
);())·;((
'
);(·
);(2
'
)(
ββββ
ββ
ββ
βββ
Y las sustituiremos en la expresión (11.3) que define las etapas del algoritmo tal que:
[ ]
∂∂
−
∂∂∂
−−∂
∂∂
∂+= ∑∑∑
=
−
==+
T
t
ttt
T
t
tT
t
ttii
XfXfY
XfXfY
XfXf
1
1
1
2
11
);(·);(·
'
);())·;((
'
);(·
);(ˆˆβ
ββββ
βββ
ββ
βββ
Una vez se haya logrado la convergencia del algoritmo, se toma como matriz de varianzas y
covarianzas del estimador obtenido, el producto de la estimación de 2εσ y la inversa de la matriz
hessiana:
[ ] 122 )ˆ(−
∇ if βσ ε
Por lo que la distribución asintótica del vector de estimadores será:
[ ]
∇
−122 )ˆ(,ˆii fN βσβ ε
Ejemplo 9.2.
Veamos cómo se aplicaría algoritmo de Newton-Raphson al modelo que veíamos en el ejemplo
11.1 tomado en desviaciones respecto a la media. En primer lugar, para poder trabajar con la
expresión (11.3) necesitamos calcular el gradiente y la matriz hessiana de la función objetivo tal
que:
[ ]∑=
−==T
t
xt
teySRf1
21
2)()( ββββ
( )( )[ ]∑=
−−=∇T
t
xt
xx ttt eyeef1
11222 , 2)( βββ βββ
−−−=∇ ∑
=
T
t txx
ttxx
t
txx
tx
yeexyeex
yeexef
tttt
ttt
1 12
11
12
2
)2()2(
)2(2)(
2222
222
ββββ
βββ
βββββ
Por lo que la expresión para obtener las sucesivas iteraciones del algoritmo de Newton-Raphson
es:
( )
−
−−−+
=
∑∑
=
−
=+
t
t
t
tttt
tttx
t
T
tx
xT
t txx
ttxx
t
txx
tx
ii
eye
e
yeexyeex
yeexe2
2
2
2222
222 ˆ1
1ˆ
1
ˆ1
1ˆ
1ˆ2
1ˆ
1ˆ
ˆ1
ˆˆ2
2
1
12
1 ˆˆ
·)ˆ2(ˆ)ˆ2(
)ˆ2(ˆ
ˆ
ˆ
ˆ ββ
β
ββββ
ββββ
βββββ
ββ
ββ
9.4. EL ESTIMADOR DE MÁXIMA VEROSIMILITUD
Si el lector tiene algunos conocimientos de Estadística Teórica seguramente sabrá que la
estimación por Máxima Verosimilitud precisa del establecimiento de un supuesto acerca de la
distribución del término de error, a partir de la cual construiremos una función de verosimilitud
que deberemos maximizar.
En general, supondremos que el término de error del modelo, εt, sigue una distribución Normal
con media 0 y varianza, 2εσ ; en ese caso, la función de verosimilitud muestral será:
[ ] [ ]∑=
−−
=
−−
== ∏
T
t
tt XfYT
T
t
XfY
eeL 1
22
22
);(2
12
21
);(2
1
2
2
2
1
2
1),(
βσ
ε
βσ
ε
εεε
πσπσσβ
El logaritmo de la función evaluado en ( )2ˆ,ˆ εσβ es:
[ ] )ˆ(ˆ2
1ˆln
2-ln2
2)ˆ;(
ˆ2
1ˆln
2-ln2
2)ˆ,ˆ(ln
2
2
1
2
2
22 βσ
σπβσ
σπσβε
εε
εε SRTT
XfYTT
LT
tt −−=∑ −−−=
=
Como puede apreciarse, tal y como cabía esperar el parámetro 2ˆεσ no depende de ninguno de los
parámetros del vector β ; por tanto, para maximizar la función de verosimilitud bastará con
seleccionar aquel vector β que minimice la suma residual )ˆ(βSR . Las condiciones de
maximización de la función de verosimilitud serán por tanto:
[ ]∑ =∀=∂
∂−=
∂∂
−=∂
∂=
T
ti
ititt
i
i
i
i kif
XfYSRL
122
2
,...,2,1 0ˆ
)ˆ()ˆ;(
ˆ1
ˆ)ˆ(
·ˆ2
1ˆ
)ˆ,ˆ(ln
βββ
σββ
σβσβ
εε
ε
[ ]∑ =−+−=∂
∂=
T
ttt XfY
TL
1
2
422
2
0)ˆ;(ˆ2
1ˆ2ˆ
)ˆ,ˆ(ln βσσσ
σβεεε
ε
Las soluciones del sistema de ecuaciones anterior proporcionan las estimaciones de Máxima
Verosimilitud del vector β y el parámetro 2εσ bajo la hipótesis de Normalidad en el término de
error.
Como puede apreciarse, los resultados obtenidos coinciden el estimador de Mínimos Cuadrados
No Lineales; asimismo, de la segunda condición de optimalidad se deduce que la estimación de
2εσ es:
[ ]T
SR
T
XfYT
ttt )ˆ()ˆ;(
ˆ 1
2
2 ββσ ε =
∑ −= =
Expresión, como vemos, análoga a la obtenida para el caso lineal.
Finalmente, la expresión de la matriz de covarianzas del estimador de Máxima Verosimilitud
puede aproximarse, para muestras grandes, mediante la inversa de la matriz de información. Dicha
matriz viene dada por11:
∂∂
∂∂
=
4
'
22
20
01
),(
ε
εε
σ
ββσσβT
ff
I
k
k
Si invertimos dicha matriz y sustituimos los valores de los parámetros desconocidos por sus
correspondientes valores estimados tenemos que:
∂∂
∂∂
=
−
T
ff
Var
k
k
4
1'2
2
ˆ20
0ˆˆˆ
)ˆ,ˆ(
ε
εε
σ
ββσ
σβ
Siempre que
∂∂
∂∂
ββff
'
no sea una matriz singular.
11 El desarrollo de la demostración que conduce a esta expresión queda fuera de las pretensiones de este texto.
9.5. APROXIMACIÓN LINEAL DE TAYLOR
Consideremos el siguiente modelo de regresión no lineal siguiente:
itt XfY εβ += ),(
Haciendo lineal la función ),( βtXf , alrededor de una estimación inicial, β mediante un
desarrollo en serie de Taylor de primer orden tenemos que:
tt
tt
XfXfY εββ
βββ +−
∂∂
+≅ )ˆ(ˆ
)ˆ;()ˆ;(
'
Si simplificamos la notación obtenemos:
'
ˆ)ˆ;(
)ˆ(
∂∂
=β
ββ tXfz
Y por tanto:
tt zXfY εββββ +−+≅ )ˆ()ˆ()ˆ;( '
Operando queda que:
ttt zzXfY εβββββ +=+− )ˆ(ˆ)ˆ()ˆ;(
Obteniéndose el siguiente modelo lineal:
tt zY εββ +⋅≅ )ˆ(*
(11.4.)
Donde βββ ˆ)ˆ()ˆ;(* zXfYY ttt +−=
Para un valor determinado de β tanto *Y como )ˆ(βz son observables, y el modelo (11.4) posee
como estimador mínimo cuadrático a:
[ ] *1)ˆ()ˆ()'ˆ(
~tYzzz ββββ
−=
El desarrollo práctico sería el siguiente: debemos plantear una aproximación numérica inicial de
β ; a continuación generar las observaciones numéricas para las variables *Y, )ˆ(βz y proceder a
estimar el modelo (11.4) por MCO obteniendo nuevas estimaciones numéricas paraβ ( )β~ . Con
ellas, calculamos de nuevo las variables *Y, )ˆ(βz e iteramos el procedimiento hasta alcanzar
determinada convergencia.
Si desarrollamos la expresión de los estimadores obtenidos mediante MCO tenemos que:
[ ][ ] ( )
[ ] t
tt
t
zzz
zXfYzzz
Yzzz
εββββ
ββββββ
ββββ
ˆ)ˆ()ˆ()ˆ(ˆ
ˆ)ˆ()ˆ;()ˆ()ˆ()ˆ(
)ˆ()ˆ()ˆ(~
1'
1'
*1'
−
−
−
+=
+−=
==
(11.5.)
La expresión (11.5) proporciona de forma directa los estimadores MCO del modelo linealizado
mediante el desarrollo de Taylor, sin más que sustituir los valores indicados y teniendo en cuenta
que tε es el residuo obtenido al sustituir en el modelo original la estimación inicial, β .
La estimación del parámetro 2ˆεσ puede obtenerse de manera análoga al caso lineal tal que:
kT −= εεσ ε
~'~ˆ 2
Siendo )~,(~ βε XfY −=
Finalmente, si existe la inversa de [ ])ˆ()ˆ( ' ββ zz podemos derivar la distribución de probabilidad
del estimador β~
que será:
[ ]
−1'2 )ˆ()ˆ(, ββσβ ε zzN
Ejemplo 9.3
Si consideramos, ahora, la función:
tttttt uxfuxxy +=++= ),(22
1 θββ
Con )(βθ = , cuyo gradiente es:
( )'21 2
),(tt
t xxxf βθ
θ+=
∂∂
Entonces:
( )
ttttttt
tttttttt
xyxxxxy
xxxxyzxfyy
22
22
122
1
2122
1*
ˆˆ2ˆˆˆ
ˆˆ2ˆˆˆ)ˆ()ˆ,(
βββββ
ββββθθθ
+=++−−=
++−−=+−=,
tt xxz 211ˆ2)ˆ( βθ +=
Por lo que el modelo lineal a estimar resultará ser:
tt zy εθβ += )ˆ(1*
(11.6)
Vamos a aplicar dicho modelo a estimar una ecuación para los siguientes datos de la economía
Albright,R., Lerman,S. y Manski,C. (1977), “Development Of An Estimation Program For The
M. Probit Model”. Federal Highway Administration
Akaike, H. (1974), “A new look at the statistical model identification”, IEEE Transactions on
Automatic Control AC-19, pp. 716–723.
Amemiya, T. (1978), “On A Two-Step Estimation Of A Multivariate Logit Model”, Journal Of
Econometrics 8.
Anderson, R. L. (1942), “Distribution of the Serial Correlation Coefficient”, Annals of
Mathematical Statistics, 1942: 1-13.
Aznar, A. y Trívez, F. J. (1993), Métodos de Predicción en Economía II: Análisis de Series
Temporales, Ed. Ariel.
Balestra, P. y Nerlove, M. (1966), “Pooling Cross Section And Time Series Data In The
Estimation Of Coefficients In A Structural Equation”, Econometrica 34.
Bassmann, R. (1957). “A Generalized Classical Method Of Linear Estimation Of Coefficients In
A Structural Equation.” Econometrica 25, pp. 77-83
Box, G.E.P., Jenkins, G.M. y Reinsel, G.C. (1994), Time Series Analysis - Forecasting and
Control, 3rd Edition, Prentice Hall.
Burns, A.F. y Mitchell, W.C. (1947), Measuring Business Cycles, New York: Columbia
University Press For The NBER.
Chateld, Cris (2004). The Analysis of Time Series: An Introduction (6th edn.), 2004. CRC Press
Chow, G.C. (1983), Econometrics, McGraw-Hill, New York.
Christ (1960). “Simultaneus Equations Estimation: Any Veredict Yet?”. Econometrica 28, pp.
835-845.
Cochrane, D. y Orcutt, G. H. (1949a), “Application Of Least Squares Regression To Relationships
Containing Autocorrelated Error Terms”, Journal of American Statistical Association 44, pp. 32-
61.
Cochrane, D. y Orcutt, G. H. (1949b), “A Sampling Study Of The Merits Of Autorregressive And
Reduced Form Transformations In Regression Analysis” Journal of American Statistical
Association 44, pp. 356-372.
Dickey, D.A. y W.A. Fuller (1979), “Distribution of the Estimators for Autoregressive Time
Series with a Unit Root,” Journal of the American Statistical Association, 74, p. 427–431.
Durbin, J. y Koopman, S. J. (2001), Time Series Analysis by State Space Models (Oxford
Statistical Science Series, nº 24), Oxford University Press.
Durbin, J. y Watson, G. S. (1950), “Testing for Serial Correlation Least Squares Regressions”,
Biometrika, vol 37. pp. 409-428.
Engle, Robert F. (1974), Band Spectrum Regression,International Economic Review 15,1-11.
Frisch, R. (1933). Pitfalls In The Statistical Construction Of Demand and Supply Analysis, Hans
Buske Verlag. Leipzig.
Frisch, R. (1936). “Note On Term 'Econometrics' “, Econometrica 1, pp. 1-4.
Gallant, A. R.(1981) "On the Bias in Flexible Functional Forms and an Essentially Unbiased Form." J. Econometrics 15(1981):211-45. Gallant, A. R.(1984) "The Fourier Flexible Form." Amer. J. Agr. Econ. 66(1984):204-15
Goldfield, S. M. y Quandt, R. E. (1965), “Some test for Homocedasticy”, Journal of American
Statistical Association. Vol 37. pp 539-547.
Granger, C. W. J. (1969), “Investigating causal relations by econometric models and cross-
spectral methods”, Econometrica 37, p. 424-438.
Granger, C.W.J.(1981), “Some properties of time series data and their use in econometric model
specification”, Journal of Econometrics 16, pp. 121-130.
Granger, C.W.J., y Newbold, P. (1974), “Spurious regressions in econometrics”, Journal of
Econometrics 2, pp. 111-120
Greene, W. H. (2000), Análisis Econométrico, Ed. Prentice Hall
Gujarati, D. (1997), Basic Econometrics, McGraw-Hill
Gujarati, D. (2003), Econometría, Ed. McGraw-Hill
Haavelmo, T. (1943). “The Statistical Implications Of A System Of Simultaneous Equations.”
Econometrica 11, pp. 1-12.
Haavelmo, T. (1944). “The Probability Approach In Econometrics”, Suplemento de
Econometrica 12. pp. 1-118.
Hamilton, J. D. (1994), Time Series Analysis, Princeton University Press.
Hannan, E.J. (1963), Regression for Time Series, in Rosenblatt, M. (ed.), Time Series Analysis,
New York, John Wiley.
Harvey, A.C. (1978), Linear Regression in the Frequency Domain, International Economic
Review, 19, 507-512.
Hausman, J.A. (1974), “Estimation and Inference in Nonlinear Structural Models”, Annals of
Economic and Social Measurement, con Berndt E., Hall R.E. y Hall, B.H. October 1974.
Hausman, J.A. (1974): “Full Information Instrumental Variables Estimations of Simultaneas
Equations Systems”, Annals of Economic and Social Measurement, Vol 3. nº 4. pp. 641-652.
Hausman, J.A. (1978), “Specification tests in econometrics”, Econometrica, 46, pp. 1251-71.
Hildreth, C. (1960). “Simultaneus Equations Estimation: Any Veredict Yet?”. Econometrica 28,
pp. 846-854.
Hsiao, C. (1986), Analysis of Panel Data. Cambridge University Press.
Johnston, J. (1997), Econometric Methods. McGraw-Hill.
Johnston, J. y Dinardo, J. (2001), Métodos De Econometría, Ed. Vicens-Vives 3ª Ed.
Intriligator, M. D. (1978). Econometrics Models. Techniques And Applications. North-Holland.
New York.
Klein, L. R. (1960). “Single Equation Vs. Equation System Methods Of Estimation In
Econometrics.” Econometrica 28, pp. 866-871.
Klein, L. R. y Goldberger, A. (1955), An Econometric Model Of United States, 1929-1952. North-
Holland, Amsterdam.
Koopmans, T.C., Rubin, H. y Leipnik, R.B. (1950). “Measuring The Equation System Of
Dinamic Economics”, en Statistical Inference In Dinamic Economic Models, Cowles Commision
Monografico nº 10. John Wiley. Nueva York.
Kuh, L.M. (1959), “The Validity Of Cross-Sectionally Estimated Behavior Equations”
Econometrica 27.
Liu, T. (1960), “Underidentification, Structural Estimation, And Forecasting” Econometrica 28,
pp. 855-865.
Lucas, R.E. (1972), “Expectations And The Neutrality Of Money” Journal Of Economic Theory
4, pp. 103-124.
Lucas, R.E. (1973), “Some International Evidence On Output-Inflation Tradeoffs”, American
Economic Review 63, pp.326-334.
Lucas, R. E. (1976), “Econometric Policy Evaluation: A critique”, Journal of Monetary
Economics 1, nº 2, Supplementary Series: 19-46.
McFadden, D. (1974), “Conditional Logit Analysis Of Qualitative Choice Behaviour”, en
Frontiers In Econometrics, Ed. P. Zarembka, Academic Press. Nueva York.
McFadden, D. (1976), “Quantal Choice Analysis: A Survey”, Annals Of Economic And Social
Measurement.
Mitchell, W. C. (1928), Business Cycles: The Problem In Its Setting. National Bureau Of
Economic Research.
Mood, A. M. (1950), Introduction to the Theory of Statistics, McGraw-Hill.
Moore, H. L. (1914), Economic Cycles: Their Law And Causes. Macmillan Press. Nueva York.
Moore, H. L. (1917), Forecasting The Yield And The Price Of Cotton. Macmillan Press.
Muth, J.F. (1961), “Rational Expectations And The Theory Of Price Movements”, Econometrica
29, pp. 315-335.
Novales, A. (1993), Econometría, 2ª Edición, McGraw-Hill.
Pindyck, R. S. y Rubinfield, D. L. (1976), Econometric Models and Economic Forecast,
McGraw-Hill.
Pindyck, R. S. y Rubinfield, D. L. (1980), Modelos Econométricos, Ed. Labor.
Pulido, A. (1983), Modelos Econométricos, Ed. Pirámide
Rosenberg, B. (1973), “A Survey Of Stochastic Parameter Regression”, Annals Of Economic And
Social Measurement 2.
Samuelson, P. A., Koopmans, T. C. y Stone, J. (1954), “Report Of The Evaluative Committe For
Econometrica”, Econometrica 22, pp. 141-146.
Sargan, J. D. (1958), “The Estimation Of Economic Relationships Using Instrumental Variables”,
Econometrica 26, pp. 393-415.
Sargent, T. (1973), “Rational Expectations, The Real Rate Of Interest And The Natural Rate
Of Unemployment”, Brookings Papers On Economic Activity 2, pp. 429-472.
Sargent, T.J. (1984), “Vector autoregressions, expectations and advice”, American Economic
Review 74, pp.408-415
Sargent, T. y Wallace, N. (1975), “Rational Expectations And The Theory Of Economic Policy”,
Journal Of Monetary Economics 2, pp. 169-184.
Schultz, M. (1938), “The Theory And Measurement Of Demand”, Chicago University Of
Chicago Press.
Schwarz, G. (1978), “Estimating the dimension of a model”, Annals of Statistics 6, 461–464.
Sims, C. A. (1980), “Macroeconomics and Reality”, Econometrica, vol. 48, p. 1-48
Sims, C.A. (1982), “Policy Analysis With Economic Models”, Brookings Papers On Economic
Activity 1, pp. 107-164.
Stewart, M. y Wallis, K. (1984), Introducción a la Econometría, Alianza Editorial.
Swamy, P. A. y Menhta, J. S. (1977), “Estimation Of Linear Models With Time And Cross-
Sectionaly Varying Coefficients”, Journal Of The American Statistical Association 72.
Theil, H. (1954), “Estimation Of Parameters Of Econometrics Models”, Bulletin Of International
Statistics Institute 34, pp.122-128.
Tinbergen, J. (1930), “Bestimmung Und Deutung Von Angebotkurven”, Zeitschrift Für
Nationalökonomie 1.
Venables, W. N. y Ripley, B. D. (2002), Modern Applied Statistics with S. 4ª Ed., Springer.
White, H. (1980), “An Heteroskedastic-Consistent Regression with Independent Observation”,
Econometrica 48, pp. 817-838.
Working, E.J. (1927), “What Do Statistical Demand Curves Show?”, Quarterly Journal Of
Economics 41.
Wright, P.G. (1915), “Review Of Economic Cycles By Henry Moore”, Quarterly Journal Of
Economics 29.
Wright, P.G. (1928), “The Tariff On Animal And Vegetable Oils”, New York, The Mcmillan