UNIVERSIDAD NACIONAL DE INGENIERÍA Facultad de Ingeniería Económica, Estadística y Ciencias Sociales MATLAB para el Análisis Económico y Financiero SESIÓN No. 6 REPLICA DE PAPER “Volatility Forecast Comparison using Imperfect Volatility Proxies” Andrew Patton (2011) 1 Miguel Ataurima Arellano [email protected]1 Journal of Econometrics 160 (2011) 246–256
12
Embed
Ataurima-Arellano M. (2014) Réplica de paper financiero con MATLAB.pdf
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingeniería Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroSESIÓN No. 6
REPLICA DE PAPER
“Volatility Forecast Comparison using Imperfect Volatility Proxies”Andrew Patton (2011)1
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingenieria Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroREPLICA DE PAPER
1. IntroducciónLos esfuerzos dedicados al modelamiento econométrico y el forecasting genera una fuerte demanda por los
métodos de comparación de predicción. El estudio de los métodos de evaluación y comparación tienen una largahistoria, desde Cowles (1933) hasta West (2005). Sin embargo, la mayoría de los métodos existentes se basanen variables objetivo que son observables.
Muchos problemas de forecasting económico involucra variables no observables:
Varianza condicional o varianza integrada
Probabilidades de default o probabilidades “crash”
Tasa “verdaderas” de crecimiento del PBI o de la inflación (opuesto a las tasas anunciadas).
La evaluación y comparación de predicción para variables latentes a menudo involucran el uso de un “proxy”,(esto es, algunas estimaciones imperfectas de la variable de interés). Por ejemplo:
Usando retornos cuadrados como proxy de la varianza condicional
Usando un indicador por defecto variable para aproximar las probabilidades de default condicional.
El uso de proxies en la evaluación de predicción y su comparación puede o no traer complicaciones.En este paper el autor trabajó sobre los resultados de Anderson y Bollerslev (1998), Meddahi (2001), y
Hansen y Lunde (2006) para mostrar dos principales resultados:
1. El autor analíticamente derivó los problemas causados por el ruido de las 9 mas comúnes funciones depérdida, revelando que algunas son peores que otras. (Usando retornos diarios al cuadrado, el rango y lavarianza realizada como proxies).
2. El autor propone una clase necesaria y suficiente de funciones de pérdida para usar con un proxy insesgadocondicionalmente, pero imperfecto. (Deriva el subconjunto homogéneo de esta clase de funciones, el cualalverga las funciones de pérdida MSE y QLIKE, y provee condiciones de momento para su uso en laspruebas de comparación de predicción).
1.1. Las funciones de pérdidas “robustas”Una propiedad, primeramente considerada en Hansen y Lunde (2006), que guiará el análisis del problema
de comparación de predicción es el siguiente:
� Definición 1: Una función de pérdida, L, es “robusta” si la clasificación de cualesquiera dos (posiblementeimperfectas) predicciones de volatilidad, h1t y h2t, mediante perdidas esperadas es el mismo que si la clasificaciónes hecha usando la varianza condicional verdadera, σ2
t , o cualquier proxy insesgado condicionalmente, σ̂2t . Esto
es, si E[σ̂2t |Ft−1
]= σ2
t , entonces:
E[L(σ2t , h1t
)]R E
[L(σ2t , h2t
)]⇒ E
[L(σ̂2t , h1t
)]R E
[L(σ̂2t , h2t
)]
1.2. Las funciones de pérdidas “económica”El escenario ideal en forecasting es cuando el completo problema de decisión del usuario de la predicción es
conocido por el productor de la predicción. En tales casos preferimos usar ls funciónes de pérdidas “económicas”relevantes - ver West, et al. (1993), Fleming, et al. (2001) o Engle, et al. (1993) como ejemplos.
En tales casos la predicción se converite solo en un input para la decisión, y la predicción de volatilidadóptima no será generalmente la verdadera varianza condicional. Desafortunadamente, la función de pérdidaseconómica del usuario de una predicción de volatilidad es usualmente desconocida, lo que nos lleva a funcionesde pérdida “estadística”.
Este paper provee una guía acerca de la elección de funciones de pérdidas estadística para el forecasting devolatilidad.
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingenieria Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroREPLICA DE PAPER
1.3. Notación
Retornos : rt|Ft−1 ∼ Ft(0, σ2
t
)Retornos Estandarizados : εt ≡ rt/σt ∼ Ft (0, 1)
Varianza : Vt−1 [rt] = Et−1[r2t
]= σ2
t
Proxy de la volatilidad : σ̂2t , tal que Et−1
[σ̂2t
]= σ2
t
Predicción de volatilidad ‘optima’ : h∗t = arg mı́n
ht
Et−1[L(σ̂2t , ht
)]1.4. Funciones de pérdida “robustas” en la literatura
Meddahi (2001) mostró que el R2 de la regresión Mincer-Zarnowitz
σ̂2t = β0 + β1hit + eit
arroja una clasificación robusta de predicciones de volatilidad.Hansen y Lunde (2006) mostraron que el R2 a partir de la regresión MZ en logaritmos no es robusta. Además,
Hansen y Lunde (2006) proporcionan una condición suficiente para que una función de pérdida sera robusta
∂3L(σ̂2t , h)
∂h∂ (σ̂2t )2 = 0
1.5. La Prueba de Diebold-Mariano (1995) - West (1996)Esta es la prueba mas ampliamente utilizada para la comparación de predicción. Sea
dt = L(σ̂2t , h1,t
)− L
(σ̂2t , h2,t
)por ejemplo dt =
(σ̂2t − h1,t
)2 −(σ̂2t − h2,t
)2.Si dos pronósticos arrojan la misma pérdida esperada, para alguna función de pérdida, entonces
H0 : E [dt] = 0vs. Ha : E [dt] 6= 0
Esta prueba puede ser conducida mediante una prueba t, con el error estándar apropiadamente ajustadopara la dependencia serial (Diebold-Mariano) y/o el error estimado en la predicción (West).
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingenieria Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroREPLICA DE PAPER
3. Difusión 2 factores, como en Chernov, Gallant, Ghysels y Tauchen (2003):
d logPt = 0,030dt+ νt
(−0,30dW1t − 0,30dW2t +
√1− 0,32 − 0,32dW3t
)ν2t = s− exp
{−1,2 + 0,04ν2
1t + 1,5ν22t}
dν21t = −0,00137ν2
1tdt+ dW1t
dν22t = −1,386ν2
2tdt+(1 + 0,25ν2
2t)dW2t
1.18. Generalización de los resultadosUsando una expansión de valor en media de segundo orden para L, la condición de primer orden es:
0 = Et−1
[∂L(σ̂2t , h
∗t
)∂h
]=∂L(σ2t , h
∗t
)∂h
+∂3L
(σ̈2t , h
∗t
)∂ (σ2
t )2∂h· 1
2Vt−1[σ̂2t
]1. Si ∂
3L(σ̈2t ,h
∗t )
∂(σ2t )2
∂h= 0 para todo
(σ2, h
), entonces h∗
t = σ2t . Esta es un resultado de Hansen y Lunde (2006).
2. Si ∂3L(σ̈2
t ,h∗t )
∂(σ2t )2
∂h> 0 para todo
(σ2, h
), entonces tenemos que ∂L
∂h < 0 implicando que h∗t < σ2
t . Por ejemplo:Las funciones de pérdida MSE-SD y MSE-log.
3. Si ∂3L(σ̈2
t ,h∗t )
∂(σ2t )2
∂h< 0 para todo
(σ2, h
), entonces tenemos que ∂L
∂h > 0 implicando que h∗t > σ2
t . Por ejemplo:La función de pérdida MSE-prop.
2. Una clase de funciones de pérdidas robustasLas funciones de pérdidas MSE y QLIKE arrojan la varianza condicional como la predicción óptima. Esto
conduce a la pregunta: ¿Existe alguna clase general de tales funciones de pérdida?La siguiente proposición sugiere una clase de funciones de pérdida, relacionadas a la familia lineal - expo-
nencial de densidades de Gourieroux, et al. (1984), y a Gourieroux, et al. (1987).
2.1. Supuestos:1. E
[σ̂2t |Ft−1
]= σ2
t .
2. σ̂2t |Ft−1 ∼ Ft ∈ F̃ , el conjunto de toas las funciones de distribución continuas absolutamente sobre R+.
3. L es doblemente diferenciable continuamente con respecto a h y σ̂2, y tiene un único mínimo en σ̂2 = h.
4. Existe algún h∗t ∈ int (H) tal que h∗
t = Et−1[σ̂2t
], donde H es un subconjunto compacto de R++.
5. L y Ft son tales que
a) Et−1[L(σ̂2t , h)]<∞ para algún h ∈ H;
b) Et−1
[∂L(σ̂2
t ,σ2t )
∂h
]<∞; y
c)∣∣∣∣Et−1
[∂2L(σ̂2
t ,σ2t )
∂h2
]∣∣∣∣ <∞ para todo t.
� Proposición 2: Manteniendo los supuestos del 1 al 5, la función de pérdida L es “robusta” si y solo si tomala siguiente forma:
L(σ̂2t , h)
= C̃ (h) +B(σ̂2)+ C (h)
(σ̂2 − h
)donde B y C son diferenciables continuamente dos veces, C es una función estrictamente decreciente sobre H,y C̃ es la anti-derivada de C.
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingenieria Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroREPLICA DE PAPER
� Proposición 3:
1. La función de pérdida “MSE” es la única función de pérdida robusta que depende únicamente del errorde predicción, σ̂2 − h.
2. La función de pérdida “QLIKE” es la unica función de pérdida robusta que depende únicamente del errorde predicción estandarizado, σ̂2/h.
2.2. Una familia paramétrica de funciones de pérdida para la comparación depredicciones de volatilidad
Ahora buscamos una familia paramétrica de funciones de pérdida dentro la amplia clase de funciones depérdida robustas, que contiene a las funciones de pérdida MSE y QLIKE.
Observe que las funciones de pérdida MSE y QLIKE tienen condiciones de primer orden que pueden serescritas como:
Et−1
[∂L(σ̂2t , σ
∗t
)∂h
]= 0 = h∗k−2
t
(Et−1
[σ̂2t
]− h∗
t
), k ∈ R
� Proposición 4:
1. La siguiente familia de funciones
L(σ̂2t , h; k
)=
1
(b+1)(b+2)(σ̂2b+4 − hb+2)− 1
b+1hb+1 (σ̂2 − h
), para b /∈ {−1,−2}
h− σ̂2 + σ̂2 log(σ̂2
h
), para b = −1
σ̂2
h − log(σ̂2
h
)− 1, para b = −2
satisface L (h, h; k) = 0 para todo h ∈ H, y son de la forma de la Proposición 2.
2. La familia de funciones de pérdida en la parte 1 corresponde a los subconjuntos completos de funcionesde pérdida robustas homogéneas. El grado de homogeneidad es igual a b+ 2.
L(ασ̂2, αh
)= αb+2L
(σ̂2, h
), ∀α > 0
2.3. Unidades de medida y clasificaciones de predicciónLa elección de unidades en diversos problemas económicos y financieros es arbitrario (precios en dólares
versus centavos, retornos en porcentaje versus decimales).
� Proposición 5:
1. La clasificación de cuaqluiera dos (posiblemente imperfectas) predicciones de volatilidad mediante pérdidasesperadas es invariante a un reescalamiento de los datos si la función de pérdidas es robusta y homogénea.
2. La clasificación de cuaqluiera dos (posiblemente imperfectas) predicciones de volatilidad mediante pérdidasesperadas no es invariante a un reescalamiento de los datos si la función de pérdidas es robusta pero nohomogénea.
3. Aplicación Empírica para la predicción de la volatilidad de losretornos de IBM
Datos diarios e intradiarios de IBM desde Enero de 1993 hasta Diciembre del 2003, 2772 observaciones.El autor considera dos modelos de volatilidad simples que son ampliamente utilizados
Las primeras 272 observaciones (aproximadamente 1 año) son usadas para la inicialización de la estimaciónRiskmetrics, las 2500 últimas observaciones son usadas para comparar las predicciones.
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingenieria Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroREPLICA DE PAPER
0 0.5 1 1.5 2 2.5 3 3.5 40
0.5
1
1.5
2
2.5
hhat (r2=2)
pérd
ida
Diversas funciones de pérdida robustas
b=1b=0.5b=0 (MSE)b=−0.5b=−1b=−2 (QLIKE)b=−5
Figura 1. Funciones de pérdida para diversas elecciones de b. En este ejemplo el verdadero valor es σ2 = 2, con la predicción devolatilidad en el rango entre 0 y 4, b = 0 y b = −2 corresponden a las funciones de pérdida MSE y QLIKE respectivamente.
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 20
0.5
1
1.5
2
2.5
Error de predicción (r2=2)
pérd
ida
Razón de pérdida desde errores de predicción negativos hasta errores de predicción positivos
b=1b=0.5b=0 (MSE)b=−0.5b=−1b=−2 (QLIKE)b=−5
Figura 2. La razón de pérdidas a partir de los errores de predicción negativos hasta los errores de predicción positivos, paradiversos valores de b. En este ejemplo, el verdadero valor es σ2 = 2, con la predicción de volatilidad en el rango entre 0 y 4, b = 0
y b = −2 corresponden a las funciones de pérdida MSE y QLIKE respectivamente.
Figura 3. Predicciones de varianza condicional para los retornos de IBM a partir de los modelos simples Rolling window - 60 díasy un RiskMetrics, Enero 1994 a Diciembre 2003.
En la siguiente tabla se presentan los estadísticos t de la prueba de Diebold y Mariano de precisión predictivapara una predicción Rolling Window a 60 días y una predicción RiskMetrics, para IBM sobre el periodo Enero1994 a Diciembre 2003. Un estadístico t mayor a 1.96 en valor absoluto indica un rechazo de la hipótesis nula deprecisión predictiva al 5% de nivel de significancia. Estos estadísticos son marcados con asterisco. El signo delestadístico t indica cual predicción performa mejor de entre las funciones de pérdida: un estadístico t positivoindica que la predicción Rolling window produce mas grandes perdidas promedio que la predicción RiskMetrics,mientras que un signo negativo indica lo contrario.
Estadístico t Proxy de volatilidadDiario 65 min. 15 min. 5 min.
UNIVERSIDAD NACIONAL DE INGENIERÍAFacultad de Ingenieria Económica, Estadística y Ciencias Sociales
MATLAB para el Análisis Económico y FinancieroREPLICA DE PAPER
Bajo pérdidas QLIKE, Riskmetrics supera significativamente a las predicciones Rolling window.
Bajo pérdidas MSE, Rolling window supera débilmente a las predicciones Riskmetrics.
4. ConclusionesSe ha mostrado algunos de los problemas a los que se arriban cuando un proxy imperfecto es empleado paracomparar predicciones de volatilidad, extendiendo el trabajo de Andersen y Bollerslev (1998), Meddahi(2001) y Hansen y Lunde (2006).
• Proxies de volatilidad de mayor precisión han sido mostrados para aliviar estos problemas, pero nolo eliminan por completo.
Se ha presentado una condición necesaria y suficiente en la forma usada de las funciones de pérdida para lacomparación de predicción de volatilidad, descartando algunas funciones de pérdida previamente usadas.
• Una nueva familia paramétrica de funciones de pérdida ha sido propuesta, la cual contiene a MSE yQLIKE, y trabaja con proxies de volatilidad ruidosos.
5. Anexo5.1. Código Fuente
El código fuente desarrollado por Andrew Patton (Duke University), es un conjunto de archivos M quehacen uso del Toolbox Econometrics desarrollado por James P.LeSage (University of Toledo). Los archivos Mque replican las figuras del paper están organizados de la siguiente manera:
Script (1):
• robust_example_code.m: código que centraliza las invocaciones a las funciones que permiten replicarlos resultados empíricos y realizar las gráficas usando una familia robusta de funciones de pérdidapara la comparación de predicciones de volatilidad
Funciones (5):
• dates2.m: convierte fecha en formato vectorial• garchsimulate.m: simula una serie de tiempo GARCH(p,q)• nines.m: retorna una matriz con todos los elementos en -999.99.• nwest.m: calcula una Regresión de Minimos Cuadrados consistente Newey-West ajustado por hete-
roscedasticidad serial.• robust_loss_1.m: modela la familia paramétrica de funciones de pérdidas propuestas en el paper
Datos (1):
• robust_ibm_data_apr06.txt: contiene la base de datos de la serie para IBM
5.2. Fuentes de DescargaTodos los códigos desarrollados por Andrew Patton para la réplica del paper se encuentran en el archivocomprimido Patton_robust_loss_apr06.zip que puede ser descargado desde