1 Prueba de No Causalidad con Series de Tiempo Simbólicas Wiston Adrián Risso 1 Resumen En el presente trabajo se desarrolla un novedoso test de no causalidad en base al análisis de series de tiempo simbólicas. Se encuentra su distribución asintótica y se realizan pruebas de tamaño y poder comparándolo con el tradicional test de no causalidad de Granger. Se aprecia que el test introducido presenta un buen desempeño detectando diferentes procesos causales. En particular, se destaca a diferencia del de Granger, este sería capaz de detectar procesos no lineales con componentes exponenciales, el modelo NLAR y el mapa caótico de Lorenz. Por otra parte, debido a las diferencias detectando causalidad con datos empíricos que pueden ser debido a diferentes motivos, se sugiere la aplicación de ambas pruebas en forma complementaria. Palabras Clave: Causalidad, No Linealidad, Análisis Simbólico, Econometría 1. Introducción Detectar las causas y los efectos entre las variables ha sido un tópico importante no solamente en economía sino que también en los campos de la estadística, inteligencia artificial, filosofía, ciencias del conocimiento, la medicina y las ciencias sociales. 1 Instituto de Estadística (IESTA), Universidad de la República, Eduardo Acevedo 1139, 11200 Montevideo, Uruguay. Instituto de Economía (IECON), Universidad de la República, Joaquín Requena 1375, 11200 Montevideo, Uruguay. Email address: [email protected]El autor quisiera agradece el apoyo financiero del Sistema Nacional de Investigadores de la ANII y del IESTA para la realización del presente estudio.
30
Embed
Prueba de No Causalidad con Series de Tiemp o Simbólicas de... · 1 Prueba de No Causalidad con Series de Tiemp o Simbólicas . Wiston Adrián Risso. 1. Resumen . En el presente
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
Prueba de No Causalidad con Series de Tiempo Simbólicas
Wiston Adrián Risso1
Resumen
En el presente trabajo se desarrolla un novedoso test de no causalidad en base al análisis de series de
tiempo simbólicas. Se encuentra su distribución asintótica y se realizan pruebas de tamaño y poder
comparándolo con el tradicional test de no causalidad de Granger. Se aprecia que el test introducido
presenta un buen desempeño detectando diferentes procesos causales. En particular, se destaca a
diferencia del de Granger, este sería capaz de detectar procesos no lineales con componentes
exponenciales, el modelo NLAR y el mapa caótico de Lorenz. Por otra parte, debido a las diferencias
detectando causalidad con datos empíricos que pueden ser debido a diferentes motivos, se sugiere la
aplicación de ambas pruebas en forma complementaria.
Palabras Clave: Causalidad, No Linealidad, Análisis Simbólico, Econometría
1. Introducción
Detectar las causas y los efectos entre las variables ha sido un tópico importante no solamente
en economía sino que también en los campos de la estadística, inteligencia artificial, filosofía,
ciencias del conocimiento, la medicina y las ciencias sociales.
1 Instituto de Estadística (IESTA), Universidad de la República, Eduardo Acevedo 1139, 11200 Montevideo, Uruguay. Instituto de Economía (IECON), Universidad de la República, Joaquín Requena 1375, 11200 Montevideo, Uruguay. Email address: [email protected] El autor quisiera agradece el apoyo financiero del Sistema Nacional de Investigadores de la ANII y del IESTA para la realización del presente estudio.
T=5000 (X→ Y) 100,00 0,39 99,59 5,08 (X→ Y , Y→ X) 100,00 100,00 100,00 100,00 Nota: Se realizaron 10.000 simulaciones de Monte Carlo aplicando números pseudoaleatorios originados por una
N(0,1) generados por el programa MatLab R2010a. Los valores son los porcentajes de rechazo de la hipótesis nula. El
nivel de significación es 0.05.
Se puede apreciar que la no causalidad en el modelo AR(1) se detecta en forma correcta en
ambas pruebas y para todos los tamaños muestrales. Se destaca también en la Tabla 2 que el test
SNC sigue siendo más conservador rechazando la causalidad en ambas direcciones con
porcentajes menores a 5%.
Los modelos 1-VAR(1) y 2-VAR(2) difieren solamente en un parámetro que determina que en
el primer modelo haya causalidad bidireccional y en el segundo la causalidad vaya de X a Y.
Considerando un porcentaje de 60% como un umbral para la detección de causalidad, se puede
decir que ambas pruebas detectan la causalidad en el modelo 1-VAR(1) para muestras grandes a
partir de 500. El test de Granger detecta la causalidad ya en una muestra de 100.
En el caso del modelo 2-VAR(1) ambas pruebas detectan la causalidad de X sobre Y a partir de
un tamaño muestral de 500. Es de notar que en muestras pequeñas el test de Granger detecta
este proceso mejor que el SNC. Esto puede ser debido a que el test de Granger para su
construcción se basa en el modelo VAR.
El modelo no lineal que incluye una expresión exponencial implica causalidad de Y sobre X.
Nótese que el test SNC detecta la causalidad cuando el tamaño muestral es 500 o mayor. Sin
embargo, es de destacar que el test de Granger no detecta la causalidad en ningún caso.
El cuarto modelo es no lineal con un término en logaritmos generando causalidad de X a Y. En
este caso el test SNC detecta la causalidad con un tamaño muestral de 500 observaciones o
más. Sin embargo, el test de Granger necesita una muestra de 5000 para detectar causalidad.
En el caso del proceso ARCH con causalidad de Y sobre X, el test SNC es capaz de detectarlo
para una muestra de 1000 observaciones, mientras que el test de Granger lo detecta en muestras
de 500.
16
El proceso NLAR es uno de los más difíciles de detectar incluso en el caso que se quiere testear
su propia dependencia temporal como fue señalado en Risso (2014). En el presente caso, en
donde se establece una causalidad de X sobre Y, se destaca que el test SNC es el único capaz de
detectarlo y necesita de una muestra de T=5000.
El mapa de Henon es un proceso caótico presentando causalidad en ambas direcciones. Notese
que el test SNC detecta el proceso a partir de una muestra de T=100 pero el test de Granger
necesita una muestra de T=500.
El mapa discreto de Lorenz también es un proceso caótico y es detectado por el test SNC a
partir de una muestra de T=100. Sin embargo, nótese que el test de Granger nunca llega a
detectar este tipo de causalidad para los tamaños muestrales presentados.
El modelo Semi-cualitativo presenta una variable binaria dependiendo de cierta region en la que
se encuentre la otra variable. En este caso el test SNC detecta correctamente la causalidad a
partir de una muestra de T=100 pero el test de Granger necesita T=500.
La Figura 1 muestra el porcentaje de detección de causalidad sobre los diez modelos
dependiendo del tamaño muestral. Nótese que para muestra de 50, el test de Granger tiene un
mejor desempeño que el test SNC, detectando 20% de los proceso. Sin embargo, empezando
con T=100 el test SNC tienen un mejor desempeños hasta detectar todos los procesos cuando el
tamaño muestral es T=5000.
17
Figura 1. Porcentaje de correcta detección del test dependiendo del tamaño muestral
Nota: Elaborado en base a las simulaciones de Monte Carlo
En resumen, para muestra de tamaño T=5000 el test SNC es capaz de detectar la causalidad en
el 100% de los modelos presentados. Sin embargo, el test de Granger detecta solo el 70% de los
procesos aunque este parece presentar un mejor desempeño detectando causalidad en procesos
lineales. En procesos no lineales el mejor desempeño los presenta el test SNC. En particular se
destaca que el test de Granger no puede detectar el modelo no lineal con componente
exponencial, el modelo NLAR y el mapa caótico de Lorenz.
5. No Causalidad con Datos Empíricos
El objetivo de esta sección es comparar los resultados del test SNC presentado en este artículo y
el test de no causalidad de Granger cuando se tienen datos empíricos. En este caso existe la
dificultad de que cuando se trabaja con datos empíricos, en particular con series históricas
económicas, en general no se tiene la certeza sobre la existencia de causalidad en el proceso
generados de datos ya que la mayoría de las veces este es desconocido. Por otro lado, las
muestras que se observan suelen estar contaminadas por el ruido generado por ejemplo por la
forma en que se mide y que puede o generar causalidad cuando no la hay (causalidad espuria) o
no permitir la detección de causalidad cuando realmente existe.
18
En el presente trabajo se consideró el siguiente conjunto de 22 acciones y 2 índices del mercado
bursátil norteamericano, considerando frecuencias semanales y mensuales: AA, AXP, BA,
Nota: Se basa en los 24 retornos financieros de Estados Unidos seleccionados. * Rechazo de la hipótesis nula al nivel de significación de 0.10 correspondiente al valor estadístico 13,36. **
Rechazo de la hipótesis nula al nivel de significación de 0,05 correspondiente al valor estadístico 15,51. *** Rechazo de la hipótesis nula al nivel de significación de 0,01 correspondiente al
valor estadístico 20,09
21
Tabla 4. Test de No Causalidad de Granger aplicado a los 24 retornos financieros con datos de 501 meses → GSPC NASDAQ AA AXP BA CAT CVX DD DE DIS GE GT HPQ IBM JNJ KO MCD MMM MRK PFE PG WFC WMT XOM
Nota: Se basa en los 24 retornos financieros de Estados Unidos seleccionados. * Rechazo de la hipótesis nula al nivel de significación de 0.10 correspondiente al valor estadístico 13,36. **
Rechazo de la hipótesis nula al nivel de significación de 0,05 correspondiente al valor estadístico 15,51. *** Rechazo de la hipótesis nula al nivel de significación de 0,01 correspondiente al
valor estadístico 20,09
22
La Tabla 5 muestra los resultados del test SNC aplicado a los 24 retornos financieros con un
tamaño muestral de 2.178 datos semanales. En este caso el test detecta 51 causalidades. En
particular, se destaca que el índice S&P 500 causa 8 retornos financieros y la acción WFC es
causada por 9 acciones norteamericanas y el índice S&P 500.
La Tabla 6 muestra el test de no causalidad de Granger para el mismo conjunto de datos. Se
observa que el test sugiere 129 relaciones causales. En particular, MCD causa 13 acciones y a
los dos índices bursátiles. Por otro lado, CAT es causado por 12 acciones norteamericanas y los
dos índices.
Comparando los resultados de las Tablas 5 y 6 se puede señalar que hay algunas causalidades
sugeridas por el test SNC pero no detectadas por el test de Granger y viceversa. Por ejemplo,
XOM estaría causado por AA según el test SNC pero no hay causalidad cuando se considera el
test de Granger. Asimismo HPQ causaría JNJ según el test de Granger, pero no habría
causalidad según el test SNC.
Anteriormente se mencionó que cuando se trabaja con datos empíricos se corre el riesgo de
detector causalidades espurias. Si las series no son estacionarias puede surgir el problema de
causalidad espuria, sin embargo este no es el caso ya que los retornos de las acciones
norteamericanas son series estacionarias. Otro motivo por el cual puede presentarse la
causalidad espuria ha sido señalado por Nalatore et al. (2007). Ellos señalan que cuando los
datos están contaminados por ruido puede aparecer causalidad espuria entre dos variables o la
verdadera causalidad puede no ser detectada. En este sentido, el análisis de series de tiempo
simbólicas elimina el problema del ruido y por tanto se esperaría que este motivo no estuviera
presente en el test de no causalidad simbólico. Sin embargo, Nalatore et al. (2007) manifiestan
que el ruido puede impactar significativamente en el análisis de causalidad de Granger.
23
Tabla 5. Test de No Causalidad Simbólico aplicado a los 24 retornos financieros de 2.178 semanas → GSPC NASDAQ AA AXP BA CAT CVX DD DE DIS GE GT HPQ IBM JNJ KO MCD MMM MRK PFE PG WFC WMT XOM
Nota: Se basa en los 24 retornos financieros de Estados Unidos seleccionados. * Rechazo de la hipótesis nula al nivel de significación de 0.10 correspondiente al valor estadístico 13,36. **
Rechazo de la hipótesis nula al nivel de significación de 0,05 correspondiente al valor estadístico 15,51. *** Rechazo de la hipótesis nula al nivel de significación de 0,01 correspondiente al
valor estadístico 20,09
24
Tabla 6. Test de No Causalidad de Granger aplicado a los 24 retornos financieros con datos de 2.178 semanas → GSPC NASDAQ AA AXP BA CAT CVX DD DE DIS GE GT HPQ IBM JNJ KO MCD MMM MRK PFE PG WFC WMT XOM
Nota: Se basa en los 24 retornos financieros de Estados Unidos seleccionados. * Rechazo de la hipótesis nula al nivel de significación de 0.10 correspondiente al valor estadístico 13,36. **
Rechazo de la hipótesis nula al nivel de significación de 0,05 correspondiente al valor estadístico 15,51. *** Rechazo de la hipótesis nula al nivel de significación de 0,01 correspondiente al
valor estadístico 20,09
25
6. Conclusiones
La causalidad sigue siendo un tema de discusión a nivel filosófico, sin embargo su aplicación
práctica en los diferentes campos de la ciencia sigue vigente. En particular, se ha tomado una de
las características de la causalidad que en palabras de Granger sería aquella de mayor aplicación
práctica. En efecto, se tendería a pensar que de existir la causalidad se debería ver una
predeterminación temporal, en el sentido que la causa debería preceder en el tiempo al efecto.
Dentro de las pruebas de causalidad más aplicadas se encuentra el test de no causalidad de
Granger que puede encontrarse en los actuales paquetes econométricos y que es ampliamente
aplicado en investigaciones empíricas. Sin embargo, este test podría tener una serie de
problemas. En primer lugar, al ser un test pensado bajo el modelo lineal VAR presenta un muy
buen desempeño detectando este tipo de relaciones causales pero presenta inconvenientes a la
hora de detectar relaciones no lineales. En segundo lugar, a pesar de que se han realizado
avances tratando de generalizar el test de Granger a modelos no lineales, estas pruebas siguen
dependiendo de la forma de los modelos subyacentes corriendo el riesgo de no poder detectar
todas las formas de no lineal existentes. Finalmente, algunos autores señalan que cuando se
trabaja con series temporales observadas empíricamente, estas suelen estar contaminadas de
ruido el cual termina o generando causalidades espurias o no permitiendo detectar aquellas
relaciones causales verdaderas.
En el presente trabajo se planteó una primera aproximación a un test de no causalidad no
paramétrico que se basa en el análisis de series de tiempo simbólicas. La idea es la de
desarrollar un test que pueda ser complementario al de Granger, mostrando fortalezas en los
puntos en los que el de Granger es débil. De esta manera se trató de ver que el test propuesto
presente un buen desempeño en la detección de procesos no lineales, en especial aquellos
caóticos y se espera que el basarse en el análisis simbólico se supere el problema de relaciones
espurias debido a la contaminación de las series por el ruido.
26
En los experimentos realizados, se observó que el test propuesto tiene un buen desempeño
detectando procesos no lineales y caóticos como en el caso de un modelo no lineal con un
componente exponencial, el modelo NLAR y el mapa caótico de Lorenz. Estos modelos
parecerían no ser detectados por el test de Granger.
El ejercicio de aplicación de ambas pruebas a series empíricas del mercado financiero
norteamericano muestra que muchas veces una relación detectada por una de las pruebas no es
detectada por la otra. Si bien aquí no se profundiza en las verdaderas causas de estas diferencias,
se pueden mencionar algunas que podrían estar detrás. Por ejemplo, un mismo ruido podría
afectar a varias series provocando relaciones espurias o podrían existir relaciones de causalidad
no lineales que no fueran detectados por el test de Granger pero que sí son detectadas por el test
SNC. Por estos motivos, es sugerencia el de aplicar ambas pruebas en forma complementaria.
Como se presentó en Risso (2014), el análisis de series de tiempo simbólicas presenta un gran
potencial que debería ser desarrollado para generar herramientas útiles en el análisis
econométrico. Como trabajo a profundizar están el de mejorar esta prueba tratando de mejorar
su potencial y por otro lado, está el de encontrar nuevas aplicaciones prácticas al análisis
simbólico.
Referencias
Arnhold, J., Grassberger, P., Lehnertz, K., Elger, C., (1999), “A robust method for
detecting interdependences: Application to intracranially recorded EEG”, Physica D,
Vol. 134, pp. 419-430.
Baek, E., Brock, W., (1992), “A General Test for Non-linear Granger Causality:
Bivariate Model”, Working paper, Ames: Iowa State University and Madison:
University of Wisconsin.
27
Diks, C., Panchenko, V., (2005), “A Note on the Hiemstra-Jones test for Granger non-
causality”, Studies in Nonlinear Dynamics and Econometrics, Vol. 9 (2), Article 4.
Diks, C., Panchenko, V., (2006), “A new statistic and practical guidelines for
nonparametric Granger causality testing”, Journal of Economic Dynamics & Control,
Vol. 30, pp. 1647-1669.
Feldmann, U., Bhattacharya, J., (2004), “Predictability improvement as an
asymmetrical measure of interdependence in bivariate time series”, International
Journal of Bifurcation & Chaos, Vol. 14, pp. 505-514.