MODELO SARIMA DE PRONOSTICO DEL NUMERO DE HUELGAS PERU SETIEMBRE-DICIEMBRE 2012 Angel Apaza Arela
MODELO SARIMA
DE PRONOSTICO DEL NUMERO DE HUELGAS
PERU
SETIEMBRE-DICIEMBRE 2012
Angel Apaza Arela
Fuente INEI
DATOS ORIGINALES
Numero de huelgas Peru 2002-2012
Mes/año 2002 2003 2004 2005 2006 2007 2008 2009 2010 20112012
Enero 13 5 6 3 8 2 3 2 5 3 4
Febrero 1 7 6 3 7 5 9 5 11 8 5
Marzo 4 2 6 6 5 3 15 11 13 15 12
Abril 4 4 17 6 6 12 8 16 10 8 16
Mayo 10 5 8 10 5 6 3 14 5 8 15
Junio 3 3 2 9 7 12 6 5 9 5 8
Julio 2 3 7 6 2 4 6 13 3 1 2
Agosto 3 11 9 3 6 4 1 6 2 6 2
Setiembre 9 7 3 8 7 7 2 8 4 6
Octubre 8 4 5 4 6 5 3 4 7 7
Noviembre 3 6 7 3 6 9 3 7 8 12
Diciembre 4 11 9 4 2 4 4 8 6 6
Ficha Técnica
Número de Huelgas (Unidades)
Tema : Número de Huelgas Variable : Número de Huelgas Medida : Unidades Periodo Base : . Tipo de Medida : Número Frecuencia : Mensual Cobertura : Nacional Información disponible desde : 1987 Fuente : Ministerio de Trabajo y Promoción del Empleo - Dirección General de Promoción del Empleo
PROBLEMA¿Cual sera el Modelo Sarima de Pronostico del numero de huelgas en el Peru para los meses Setiembre-Diciembre del año 2012? OBJETIVO Determinar un modelo SARIMA de pronóstico del numero de huelgas del Perú para los meses Setiembre-Diciembre del año 2012
*ConceptoSARIMA (Seasonal Autorregresive Integrated Movile Average) que además de ajustar los componentes cíclico y estacional propios de una serie económica, se caracteriza por ser un modelo fácil de estimar e interpretar esto porque no requiere de otras variables ni de estructuras complejas de la econometría tradicional.
Modelos ARIMA con componente estacional.
Los modelos denominados SARIMA son modelos de regresión cuyos errores siguen un proceso ARIMA (autorregresivo integrado de medias móviles). Estos modelos han permitido incorporar dos enfoques muy utilizados en econometría: el análisis de regresión y la metodología de series de tiempo Box-Jenkins.
Metodología1. Exploración de la serie
2. Identificación del modelo
3. Estimación de los parámetros del modelo tentativo
4. Verificacion del modelo
5.Usar el modelo para prediccion y control
Exploracion de la serie
Fuente: INEI. Serie mensual 2002.01 a 2012.08
Se trata de modelizar la serie con un modelo ARIMA (SARIMA) univariante y predecir el numero de huelgas en un periodo adelante (setiembre-diciembre 2012).
2002-E
nero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
Enero
Mayo
Seti
em
bre
2011-E
nero
Mayo
Seti
em
bre
2012-
Enero
Mayo
0
2
4
6
8
10
12
14
16
18
Series1
Grafica de lines de toda la seriePara explorar los patrones o movimientos de la serie , tendencia ,estacionariedad En Microsoft Excel 2010.
Grafica de linea de la media y De la varianza de los datos Originales En Microsoft Excel 2010.
Grafica de la linea de la media y De la varianza datos transformadosCon LN En Microsoft Excel 2010.
Grafico de linea de la media y de la varianza
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
PromedioVarianza
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
0
5
10
15
20
25
30
35
PromedioVarianza
Grafica de linea por años
La serie tiene maximos para cada año en abril y mayo,por tanto la serieEs estacional
Para detectar si la series es o no es estacional en Microsoft Excel 2010
Ene
ro
Feb
rero
Mar
zo A
bril
May
o
Juni
o Ju
lio
Ago
sto
Set
iem
bre
Oct
ubre
Nov
iem
bre
Dici
embr
e0
5
10
15
20
25
20122011201020092008200720062005200420032002
Alguna de las cajas anuales tienen amplias y otras cortas longitudes , por tanto algunas tienen varianza grandes y
otras pequeñas varianzas anuales
Este gráfico muestra comparativamente las series original y en logaritmos. Esta última indica varianzas homogéneas.
2002-Enero Marzo Mayo Julio Setiembre0
0.5
1
1.5
2
2.5
3
ln -Serie
ln -Serie
2002-Enero Mayo Setiembre Enero Mayo0
2
4
6
8
10
12
14
16
18
Serie original
Serie original
2002-Enero Mayo Setiembre Enero Mayo0
5
10
15
20
25
ln -SerieSerie original
Las barras de las correlaciones de la ACF tienen un una forma sinucoidal ( con osilacion) , la serie tiene estacionalidad
Grafica del Correlograma
Prueba analitica de la estacionariedad
Null Hypothesis: HUELGAS1 has a unit root Exogenous: Constant Lag Length: 2 (Automatic based on SIC, MAXLAG=8)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -3.383177 0.0197Test critical values: 1% level -3.670170
5% level -2.963972 10% level -2.621007
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(HUELGAS1) Method: Least Squares Date: 07/01/09 Time: 01:28 Sample (adjusted): 2002M04 2004M09 Included observations: 30 after adjustments
Para probar si la series es estacionaria . El reporte de la prueba de Dckey –Fuller aumentada en EVIEWS 6 muestra el reporte siguiente
Como el p=0.0197 es menor que 0.05 no se acepta la hipotesis nula , por tantoSe confitma que la series es estacionaria.
Prueba analitica de la homogenidad de varianzas
La prueba de varianzas de levene resulta significativa por lo tanto hay Homogenidad de varianzas La prueba de medias resulta significativa por lo tanto las medias anuales De la serie son diferentes
Prueba analitica de la aleatoriedad de la serie huelgas
*Prueba de corridas: ln huelgas
*Prueba de corridas para ln huelgas
*Corridas por encima y por debajo de K = 1.68507
*El número observado de corridas = 56
*El número esperado de corridas = 64.4375
*70 observaciones por encima de K, 58 por debajo
*Valor P = 0.131
El valor de p es mayor a 5% por lo tanto la serie es aleatoria
Identificacion y estimacion del modelo
Parametro
Estimado
Error Estandar
t P-value
MA(1) -0.1988 0.0894244 -2.2231 0.028181
SMA(1) 0.874342
0.0330305 26.4708 0.000000
Mediante el STATGRAPHICS CENTURION 16, se obtuvo el mejor modelo , el cual es un SARIMA(0,0,1)(0,1,1) con constante AIC= -1.15321 , Los valores De los estimadores de los parametros se dan en la siguiente tabla:
Varianza estimada de Ruido Blanco=0.361167Desviacion estandar estimada de Ruido Blando=0.600972
Estimacion del modelo
1 1 12 12 1 12 13t t t t tz
12t t tZ Y Y Donde:
El modelo con los parámetros estimados es el siguiente:
1 12 130.361167 0.1988 0.874342 0.1988(0.874342)t t t t tz
Prueba de la independencia de los residuales
Estadística Chi-cuadrada modificada de Box-Pierce (Ljung-Box)
La prueba de Box-Pierce y Ljung-Box con Minitab 16
Desface 12 24 36 48
Chi-cuadrada 11.6 21.7 31.5 43.3
Gl 9 21 33 45
Valor P 0.237 0.417 0.544 0.546
Residual Autocorrelations for adjusted ln huelgasARIMA(0,0,1)x(0,1,1)12
0 5 10 15 20 25lag
-1
-0.6
-0.2
0.2
0.6
1
Aut
ocor
rela
tion
s
Prueba de la normalidad de residuales
Los residuales se distribuyen según una distribucion normal ya que el valos deP es 0.100 mayor a 0.05
Prueba de la aleatoriedad de los residuales mediante la prueba de la corrida
*Prueba de corridas: RESID1
*Prueba de corridas para RESID1
*Corridas por encima y por debajo de K = 0.0271602
*El número observado de corridas = 56
*El número esperado de corridas = 58.5690
*63 observaciones por encima de K, 53 por debajo
*Valor P = 0.629
El valor P es 0.629 es mayor que 0.05 o 5% por lo tanto los residuos son aleatorios
Time Sequence Plot for LnHuelgasARIMA(0,0,1)x(0,1,1)12
1/50 1/53 1/56 1/59 1/62 1/65
-0.1
0.9
1.9
2.9
3.9
Ln
Hu
elg
as
actualforecast95.0% limits
Grafico de linea por años incluyendo el pronostico
Ene
ro
Feb
rero
Mar
zo A
bril
May
o
Juni
o Ju
lio
Ago
sto
Set
iem
bre
Oct
ubre
Nov
iem
bre
Dici
embr
e0
5
10
15
20
25
30
2013pronostico
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
Lower 95.0% Upper 95.0%Period Forecast Limit Limit
2012-Setiembre 1.59704 0.40652 2.78757 Octubre 1.65886 0.445045 2.87268 Noviembre 1.86128 0.647461 3.0751 Diciembre 1.68676 0.472936 2.90058 2011-Enero 1.37402 0.160204 2.58784 Febrero 1.72284 0.509023 2.93666 Marzo 2.08561 0.871788 3.29943 Abril 2.25169 1.03787 3.46551 Mayo 2.05739 0.843575 3.27121 Junio 1.78535 0.571527 2.99917 Julio 1.16321 -0.0506087 2.37703 Agosto 1.2597 0.0458813 2.47352 Setiembre 1.68967 0.466662 2.91267 Octubre 1.65886 0.435499 2.88223 Noviembre 1.86128 0.637916 3.08465 Diciembre 1.68676 0.46339 2.91012
Cuadro de pronosticos de 2012-Setiembre a 2013-Diciembre en Ln
Cuadro de pronosticos de 2012-Setiembre a 2013-Diciembre Lower
95.0%Upper 95.0%
PeriodForecast Limit Limit
2012-Setiembre 5 2 16
Octubre 5 2 18 Noviembre 6 2 22 Diciembre 5 2 18
2011-Enero 4 1 13 Febrero 6 2 19
Marzo 8 2 27 Abril 10 3 32
Mayo 8 2 26 Junio 6 2 20 Julio 3 1 11
Agosto 4 1 12 Setiembre 5 2 18
Octubre 5 2 18 Noviembre 6 2 22 Diciembre 5 2 18
Si no hay una causa que afecteLa serie entonces para Setiembre del 2012Habra 5 huelgas en el Peru