2 PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2006/2007 Práctica 3 1. Planteamiento y Objetivos de la Práctica En la presente práctica se propone la modelización univariante por medio del enfoque de Box-Jenkins de tres series temporales con características distintas. En cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que considere más importantes en cada ejemplo y dejar los pasos omitidos para que los cubran los alumnos después por su cuenta Con la presente práctica se intenta que el alumno aprenda a construir modelos ARIMA univariantes para una serie temporal por medio del enfoque de Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas hasta elaborar el posible modelo generador de los datos, de forma sintética los pasos a realizar son los siguientes: • Especificación inicial • Estimación • Chequeo o validación • Utilización del modelo 1 En la etapa de especificación inicial se deberá determinar el orden de integración de la serie temporal, es decir cual es el número de diferencias que se requerirán y si una de ellas debe ser anual (estacional) para convertir en estacionaria a la variable objeto de análisis, Z t (d,s). Z t = (1-B) d (1-B s ) D 1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredictibilidad, etc-, para basar sobre él la extracción de señales como el componente estacional
35
Embed
PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. …€¦ · 4 adecuado y se procede a su estimación, apropiado, usualmente el de máxima verosimilitud pero en Eviews este método no
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
2
PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2006/2007 Práctica 3 1. Planteamiento y Objetivos de la Práctica
En la presente práctica se propone la modelización univariante por medio del
enfoque de Box-Jenkins de tres series temporales con características distintas. En
cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin
de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que
considere más importantes en cada ejemplo y dejar los pasos omitidos para que los
cubran los alumnos después por su cuenta
Con la presente práctica se intenta que el alumno aprenda a construir
modelos ARIMA univariantes para una serie temporal por medio del enfoque de
Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas
hasta elaborar el posible modelo generador de los datos, de forma sintética los
pasos a realizar son los siguientes:
• Especificación inicial
• Estimación
• Chequeo o validación
• Utilización del modelo 1
En la etapa de especificación inicial se deberá determinar el orden de
integración de la serie temporal, es decir cual es el número de diferencias que se
requerirán y si una de ellas debe ser anual (estacional) para convertir en
estacionaria a la variable objeto de análisis, Zt (d,s).
Zt = (1-B)d (1-Bs ) D
1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredictibilidad, etc-, para basar sobre él la extracción de señales como el componente estacional
3
Donde: d es el número de diferencias regulares y D las diferencias de tipo
estacional y habitualmente D = 0 ó 1 y se suele cumplir que: 0 ≤ d+D ≤ 2.
Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela
determinadas características relevantes de la misma, como sus correlogramas
simple y parcial y los tests de raíces unitarias.
Una vez decidido el orden d y D, es decir el número de raíces unitarias que
tiene la serie temporal, tanto de tipo regular como estacional, habrá que decidir el
orden del polinomio autorregresivo (p) y el de medias móviles (q) para lo cual
utilizamos como principales instrumentos el correlograma simple y el parcial de la
serie. Los criterios generales que deben servir de guía para determinar el orden p
del polinomio autorregresivo y el orden q del polinomio medias móviles se recogen
en las estructuras de los correlogramas simple (FAC) y parcial (FAP) y que para
los casos más sencillos se han visto en las clases teóricas. Un resumen de las
características de la estructura del correlograma simple y del parcial se recoge en
el esquema adjunto.
Características teóricas de la FAC y de la FAP de los procesos estacionarios Procesos FAC FAP
AR (p) Decrecimiento rápido hacia
cero sin llegar a anularse
P primeras autocorrelaciones
distintas de cero y el resto
ceros
MA (p) q primeras autocorrelaciones
significativas y el resto ceros
Decrecimiento rápido hacia
cero sin llegar a anularse
ARMA (p, q) Decrecimiento rápido hacia
cero sin llegar a anularse
Decrecimiento rápido hacia
cero sin llegar a anularse
Debe quedar claro que la identificación es siempre tentativa por lo que se
deben sugerir varios modelos como posibles procesos generadores de datos. Una
vez que se han sugerido uno o varios modelos se escoge el que parezca más
4
adecuado y se procede a su estimación, apropiado, usualmente el de máxima
verosimilitud pero en Eviews este método no está implementado. Posteriormente se
debe realizar el chequeo ó validación de esas estimaciones, es decir, decidir sobre
varios criterios la validez de dichas estimaciones.
En esta práctica se realiza la modelización de tres series temporales de
datos reales y características distintas. El primer caso se refiere a los gastos de
publicidad de una empresa con frecuencia anual, el segundo analiza el Índice de
Precios de Producción (PPI) de Estados Unidos con frecuencia trimestral y el último
modeliza una serie de frecuencia mensual y con estacionalidad, las viviendas de
nueva construcción en Estados Unidos.
2.Ejemplo1. Gastos en publicidad de una empresa
La serie que se modeliza es la de gastos en publicidad de una determinada
empresa. Su periodicidad es anual y el tamaño muestral abarca 54 observaciones
que comprenden el periodo 1947-2000; dada su frecuencia anual esta serie no
tendrá componente estacional. Los datos de esta variable se encuentran en el
Banco de Datos del curso de econometría II.
El primer paso que debemos dar para elaborar el modelo univariante de las series
es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e
importamos los datos, tal y como hemos hecho en las prácticas anteriores. La
variable en Worfile la denominamos Gpubli
Una vez cargados los datos debemos verificar si la serie temporal es
estacionaria y en caso de que no lo sea realizar las transformaciones pertinentes
hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie
Gpubli, gráfico que se muestra a continuación.
La instrucción en Eviews para obtener el gráfico de la serie es:
Quik/Graph /gpubli/Line Graph
5
0
400
800
1200
1600
2000
10 15 20 25 30 35 40 45 50 55 60
GPUBLI
Gastos en publicidad de una determinada empresa
Se observa que tiene una tendencia creciente muy acentuada,
aproximadamente hasta 1925 y de sentido contrario después, lo que es un claro
signo de que la serie no es estacionaria en media, además ese crecimiento
muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto
grado de estabilidad y no es del todo preciso tomar logaritmos.
En segundo lugar obtenemos los correlogramas
Instrucciones en Eviews para obtener los correlogramas de esta serie (Gpubli)
Quick/Series Statistics/Correlogram/ Gpubli También de forma alternativa en el objeto serie (ventas)
View/Correlogram
6
El correlograma simple (AC) confirma la sospecha anterior sobre la no
estacionariedad de la variable al mostrar un decrecimiento lento. Adicionalmente
llevamos a cabo el test de raíces unitarias de D-F
Instrucciones en Eviews para el test D-F:
Quick/Series Statistics/unit root/Gpubli Null Hypothesis: GPUBLI has a unit root Exogenous: Constant Lag Length: 4 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -2.391303 0.1494 Test critical values: 1% level -3.571310
5% level -2.922449
7
10% level -2.599224
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(GPUBLI) Method: Least Squares Date: 04/14/07 Time: 21:04 Sample (adjusted): 1912 1960 Included observations: 49 after adjustments
R-squared 0.349212 Mean dependent var 0.795918Adjusted R-squared 0.273539 S.D. dependent var 228.9130S.E. of regression 195.1087 Akaike info criterion 13.49927Sum squared resid 1636898. Schwarz criterion 13.73092Log likelihood -324.7321 F-statistic 4.614749Durbin-Watson stat 2.008555 Prob(F-statistic) 0.001854
El Valor del estadístico t (-2.391) de GPUBI(-1) es inferior a los valores críticos de
la distribución DF por lo que no se puede rechazar la hipótesis de la existencia de
una raíz unitaria, y por tanto, la serie no es estacionaria
Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria
se prueba con el ajuste de una tendencia lineal determinística a la serie Gpubli y si
es adecuado eliminar la tendencia de la serie original. Para ello, se ajusta una
tendencia determinística a la variable ventas del tipo:
Gpubli = c +β t + µt
Cuya estimación se presenta a continuación
Instrucciones en Eviews para la estimación de la tendencia determinista :
Quick /estimate equation
8
Y en la ventana de la ecuación que se abre escribir: Gpubli c @trend+1 El resultado de la estimación es: Dependent Variable: GPUBLI Method: Least Squares Date: 04/15/07 Time: 08:43 Sample: 1907 1960 Included observations: 54
Variable Coefficient Std. Error t-Statistic Prob.
C 896.8644 103.4431 8.670126 0.0000@TREND+1 1.369240 3.272521 0.418405 0.6774
R-squared 0.003355 Mean dependent var 934.5185Adjusted R-squared -0.015811 S.D. dependent var 371.8789S.E. of regression 374.8072 Akaike info criterion 14.72703Sum squared resid 7304985. Schwarz criterion 14.80070Log likelihood -395.6299 F-statistic 0.175063Durbin-Watson stat 0.348633 Prob(F-statistic) 0.677374
Analizando esos resultados podemos observar que la estimación de los
residuos presentan un estadístico Durbin- Watson próximo a cero, lo que es
indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz
unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido
blanco. El gráfico de los residuos la serie Gpubli, que se muestra a continuación,
también muestra esos problemas y nos indica que los residuos se han mantenido
por encima y/o por debajo de la media durante un periodo demasiado largo. Por lo
tanto, ese ajuste no es adecuado puesto que olvida determinadas propiedades
importantes de la serie
9
-800
-400
0
400
800
1200
10 15 20 25 30 35 40 45 50 55 60
GPUBLI Residuals
Dado que el procedimiento anterior no es el adecuado, la tendencia es de
tipo estocástica y, por tanto, utilizamos a continuación el procedimiento de la
diferenciación para convertir a la serie en estacionaria. Tomamos la primera
diferencia en la serie Gpubli para lo que generamos la serie de DGpubli =Gpubli-Gpubli (-1), es decir, transformamos la serie de acuerdo con la siguiente expresión:
Zt =(1-B)Gpubli
La representación gráfica de la serie transformada y sus correspondientes
correlogramas se muestran a continuación.
10
-800
-600
-400
-200
0
200
400
600
10 15 20 25 30 35 40 45 50 55 60
D(GPUBLI,1)
Primera diferencia de la serie Gpubli
11
Tanto el gráfico de la serie DGpubli como su correlograma indican que la
primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a
su nivel medio, aunque en el tramo central de la muestra las observaciones tienen
una intensa volatilidad, y el correlograma tiende a cero con cierta rapidez . No
obstante, se completa este análisis con el test DFA de raíces unitarias que se
muestra a continuación
Test de D-F Aumentado de DGpubli Null Hypothesis: D(GPUBLI) has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -7.301027 0.0000 Test critical values: 1% level -3.565430
5% level -2.919952 10% level -2.597905
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(GPUBLI,2) Method: Least Squares Date: 04/15/07 Time: 09:54 Sample (adjusted): 1910 1960 Included observations: 51 after adjustments
El análisis de la estructura del correlograma probablemente sugiera algún modelo
adicional pero de momento nos quedamos con los propuestos.
13
Estimación
Una vez especificados varios modelos alternativos como posibles generadores de
la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se
deben dar las siguientes instrucciones para estimar los modelos sugeridos.
Modelo 1.1: Quick/Estimate Equation/ LS d(Gpubli,1) c ar(1) ar(2)
Modelo 1.2: Quick/Estimate Equation/ LS d(Gpubli,1) c ar(1) ar(2) ar(3) ar(4) Los resultados de la estimación de estos modelos se presentan a continuación, sin
embargo algunos componentes del modelo 1.2 no eran significativos y finalmente
se han eliminado figurando en esa ecuación del modelo los componentes cuyos
parámetros son significativos, de hecho se han eliminado ar(1) y ar(3) Estimación Modelo1.1 Dependent Variable: D(GPUBLI) Method: Least Squares Date: 04/14/07 Time: 21:16 Sample (adjusted): 1910 1960 Included observations: 51 after adjustments Convergence achieved after 3 iterations
R-squared 0.165609 Mean dependent var 0.686275Adjusted R-squared 0.148580 S.D. dependent var 224.3115S.E. of regression 206.9776 Akaike info criterion 13.54152Sum squared resid 2099147. Schwarz criterion 13.61728Log likelihood -343.3089 Durbin-Watson stat 2.023100
R-squared 0.248989 Mean dependent var 0.795918Adjusted R-squared 0.233010 S.D. dependent var 228.9130S.E. of regression 200.4774 Akaike info criterion 13.47924Sum squared resid 1888986. Schwarz criterion 13.55646Log likelihood -328.2414 Durbin-Watson stat 1.788707
Inverted AR Roots .67
Una vez estimados los modelos especificados se debe validar dichas estimaciones,
es decir, se debe contrastar la adecuación del modelo a los datos, por medio de
una batería de tests estadísticos y econométricos vistos en clase y que se
encuentran en Eviews en el objeto ecuación .
Validación o chequeo
En la etapa de validación se presentan tres bloques de análisis: Un primero
referente a los resultados de la estimación, un segundo centrado en el análisis de
los residuos y, finalmente, un tercero dedicado a la comparación de modelos
alternativos.
• Análisis de la estimación.- Referente a la significatividad individual de los coeficientes por medio del
estadístico t de student pone de relieve que todos los coeficientes del modelo 1.2
son altamente significativos y mientras que ar(1) del modelo 1.1 no es significativo.
En cuanto a las condiciones de estacionariedad de los modelos estimados,
todas las raíces de los polinomios de retardos caen fuera de circulo de radio
15
unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que
Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro
del circulo de radio unidad.
De la observación de los resultados de la estimación se deduce que el modelo 1.2
presenta un error estandar ligeramente más bajo que el del modelo 1.1 y tanto el
estadístico de Akaike como el criterio de Schwarz son inferiores en el segundo
modelo .
En esta etapa también se suele analizar las correlaciones entre los coeficientes
estimados para verificar la posible existencia de multicolinealidad en el modelo. La
existencia de multicolinalidad indica una falta de precisión en las estimaciones
obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las
correlaciones entre los coeficientes se acude su matriz de correlaciones que
proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo
siguiente:
View/Correlation Matrix
La ejecución de esta instrucción muestra la matriz de coeficientes de la
R-squared 0.231434 Mean dependent var -1.71E-07Adjusted R-squared 0.222003 S.D. dependent var 0.012602S.E. of regression 0.011115 Akaike info criterion -6.143098Sum squared resid 0.020138 Schwarz criterion -6.086857Log likelihood 512.8771 F-statistic 24.54160Durbin-Watson stat 2.051191 Prob(F-statistic) 0.000000
Por lo tanto la serie LPPI tiene una raíz unitaria y la primera diferencia convierte a
dicha serie en estacionaria una vez eliminada su tendencia. La serie es del tipo
: Zt =(1-B)LPPI,, LPPI∼I(1)
Es decir, es integrable de orden 1 y tiene el siguiente significado:
DLPPI= LPPI- LPPI(-1) = log(PPI)-log(PPI(-1)), que es la tasa de variación intertrimestral de PPI o la tasa de inflación de los precios de producción o a la salida de fabrica.
Determinado el grado de diferenciación ó de raíces unitarias, pasamos a
especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas
de DLPPI se deduce que en la FAC existen 2 ó tres ó quizás 4 coeficientes que son
distintos de cero y después todos son cero, mientras que en la FAP solo existe un
coeficiente significativo, que no es cero, el primero, y después tienden rápidamente
a cero. Esto sugiere que la serie (DLPPI) puede ser generada por modelos que
puede tener una estructura MA hasta orden 3 y un AR(1). Así, los posibles modelos
serian: ARIMA (1,1,3), ARIMA(1;1,2) ó ARIMA(1,1,1).
25
Por otro lado, de la observación del gráfico de la serie DLPPI se deduce que
la media de la serie es distinta de cero por lo que debe incluirse el término constante
R-squared 0.427921 Mean dependent var 0.008398Adjusted R-squared 0.417392 S.D. dependent var 0.014135S.E. of regression 0.010789 Akaike info criterion -6.196898Sum squared resid 0.018974 Schwarz criterion -6.122216Log likelihood 521.4410 F-statistic 40.64187Durbin-Watson stat 1.963251 Prob(F-statistic) 0.000000
Inverted AR Roots .81 Inverted MA Roots .49-.49i .49+.49i .39 -.49+.49i
-.49+.49i
Validación
En cuanto a los coeficientes de los tres modelos son individualmente significativos,
según el contraste de la t de student.. Todos los modelos cumplen las condiciones
de estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios
autorregresivos como los de media móvil caen fuera del circulo de radio unidad. A
su vez, las matrices de correlaciones de los coeficientes de estos modelos no
muestran signos de multicolinealidad
Desde el punto de vista del error estandar de los modelos estimados el 2.3 es el
que presenta un valor menor (0,0108) seguido del 2.2 (0.0109). Desde el punto de
vista del criterio de Akaike, el modelo 2.3 presenta un valor inferior (-6.20) seguido
del modelo 2.2 (-6.17).
El análisis de los residuos de los tres modelos estimados a través de sus
correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se
presentan a continuación para el modelo 2.3, nos indica que todos ellos cumplen las
condiciones para ser considerados como ruido blanco, excepto el 2.1. No obstante,
el modelo 2.3 es el que cumple esas condiciones con más holgura.
Del análisis anterior de los residuos y de la evaluación de las estimaciones de los
coeficientes de los distintos modelos el modelo preferido es el 2.3 seguido del
modelo 2.2. El modelo 2.1 es desechable desde el punto de vista estadístico dado
que sus residuos no son ruido blanco
28
Correlograma de los residuos del modelo 2.3
Grafico de residuos del modelo 2.3
-.06
-.04
-.02
.00
.02
.04
-.04
-.02
.00
.02
.04
.06
.08
1965 1970 1975 1980 1985 1990 1995 2000
Residual Actual Fitted
El alumno debe analizar los residuos de los modelos 2.2 y 2.3 a través del correlograma y del gráfico de residuos
29
4. Ejemplo 3. Viviendas de nueva construcción en USA
La serie a modelizar es el número de viviendas de nueva construcción en
Estados Unidos expresada en miles, la frecuencia es mensual y el periodo muestral
comprende 1959:06 1992:04. El objetivo que se persigue con este ejercicio es que
el alumno aprenda a construir un modelo univariante de una serie de frecuencia
mensual que tiene una marcada tendencia y estacionalidad.
Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo
muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores,
se realiza la representación gráfica de la serie objeto de análisis. La serie se
denomina HS
Instrucciones: Quick/Graph/ HS/Line graph
40
80
120
160
200
240
1960 1965 1970 1975 1980 1985 1990
HS
Viviendas de nueva construcción en USA
Este gráfico no es muy indicativo sobre la estacionariedad o no de la serie en
30
Como hemos visto en los dos ejemplos anteriores el correlograma es un
instrumento útil para verificar la estacionariedad de la serie. A continuación se
presenta el correlograma.
Instrucciones: Una vez en el objeto serie HS, View/ Correlogram En el correlograma de la serie HS se observa que las autocorrelaciones disminuyen
primero, y posteriormente alcanzar un pico relativo en el retardo 12, y disminuyen de
forma acusada en los retardos mayores. Por su parte, las autocorrelaciones
parciales muestran una punta positiva en el retardo 1 y otra negativa en el retardo
13, lo cual apunta a una posible estacionariedad de la serie en niveles.
31
No obstante, realizamos el contraste de Dickey- Fuller aumentado que se adjunta a
continuación:
Instrucciones: Quick/series statistic/Unit Root/HS Contraste de raiz unitaria (DFA) de la serie HS Null Hypothesis: HS has a unit root Exogenous: Constant Lag Length: 4 (Automatic based on SIC, MAXLAG=4)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -4.969008 0.0000 Test critical values: 1% level -3.446692
5% level -2.868638 10% level -2.570617
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(HS) Method: Least Squares Date: 03/28/07 Time: 18:33 Simple (adjusted): 1959M06 1992M04 Included observations: 395 after adjustments