Econometría Financiera Enero Mayo de 2007 - mty.itesm.mx · © 2006 Osmar Zavaleta ECONOMETRIA FINANCIERA © 2006 Osmar Zavaleta ECONOMETRIA FINANCIERA © 2006 Osmar Zavaleta ECONOMETRIA

1

© 2006 Osmar Zavaleta ECONOMETRIA FINANCIERA

Econometría FinancieraEnero Mayo de 2007


Introducción

• ¿Qué es la econometría?• ¿Por qué es importante?• ¿Cómo impacta en la toma de decisiones

financieras?


Algunas aplicaciones

• Costo de Capital (CAPM, APT)• Tipo de cambio, tasas de interés, inflación• Relación entre el IPC e índices de mercados

financieros internacionales • Modelación del Spread en función volumen,

tamaño de la empresa, sector industrial• Estimar la probabilidad de que un empresa se

vuelva pública (en función de sus variables financieras)

2



• Interrelación entre variables económicas y financieras de México con las de otras economías (Inflación en México vs. Inflación en Estados Unidos, Tipos de Cambio, etc.)

• Estimar la probabilidad de que una empresa mexicana emita un ADR (en función de sus características financieras)

• Teoría de administración de portafolios (Rendimiento esperado de un portafolio como función de la desviación estándar de su rendimiento – riesgo -)

• Valor de una acción en función de variables del mercado real (participación de mercado, inversión en IyD, nivel de ventas, utilidades, anuncio de dividendos, etc.


Elementos Estadísticos Básicos


Panorama General

3


Panorama general

ANALISIS DE REGRESION

Diagrama de Dispersión

Satisfacción

Regresión:- Lineal Simple- Lineal Múltiple

Y= βo + β1 X1 + ...+ βk Xk+ ε

-Modelos Transversales o “Cross-Seccionales”-Modelos de Series de Tiempo


Análisis TransversalVentas Publicidad15.64 524.67 1022.19 7.815.65 411.8 2.212.53 314.47 3.318.48 6.221.88 6.817.35 5.921.55 7.110.54 1.824.17 9.212.45 2.6513.68 3.7615.7 4.422.74 8.319.76 615.65 4.321.33 6.2

Los siguientes datos representan las ventas anuales de 20 centros de distribución de una compañía embotelladora de refrescos de cola.


Análisis Transversal

10.0

15.0

20.0

25.0

0.0 3.3 6.7 10.0

Ventas vs. Publicidad

Publicidad

Ven

tas

4


Análisis de Series de TiempoP.Cierre Tiempo

20.5 115.4 216.9 313.4 48.8 5

22.1 614.3 719.6 812.7 97.8 10

23.3 1119.2 1220.8 1315.6 145.4 15

24.1 1612.6 17

17 1811.8 199.2 20

28.6 2116.8 2218.4 2315.9 249.9 25

Los siguientes datos representan el precio de cierre de una acción. El registro se hizo al final de cada una de las 25 semanas de análisis.


Diagramas de series de tiempo

5.0

11.3

17.5

23.8

30.0

0.9 2.4 3.9 5.4 6.9Time

Prec

iode

Cie

rre


Distribuciones de frecuencias

0.0

2.0

4.0

6.0

8.0

5.0 11.3 17.5 23.8 30.0Precio de Cierre

Frec

uenc

ia

5


Estimadores (Estadísticos)

• Medidas de Tendencia CentralMedia, Mediana y Moda

• Medidas de DispersiónVarianza y Desviación Estándar

• Medidas de PosiciónCuartiles y Percentiles





6


Variables Aleatorias y Distribuciones de Probabilidad

• Una variable aleatoria es una función de números reales que resulta de hacer transformaciones sobre algún espacio muestral, esto es, cuando posibles eventos del espacio muestral se transforman en números reales, se construye una variable aleatoria.

• Una distribución de probabilidad resulta cuando a cada valor de la variable se le asigna su probabilidad de ocurrencia correspondiente.


Ejercicio

• El SAT reembolsa de manera automática los excedentes retenidos a sus contribuyentes que son personas físicas. Se sabe que la devolución automática se hace efectiva sólo en el 60% de los casos. Si tres personas físicas (con saldo a favor) harán su declaración, encuentra la distribución de probabilidad del número de personas (de las tres) que recibirán el reembolso de manera automática. Encuentra la probabilidad de que al menos dos de ellas lo reciban.


Media y Varianza de una variable aleatoria

• La media de una v.a. está dada por:

• La varianza de una v.a. está dada por:

E X( ) = µ = x P X = x( )∀x∑ E X( ) = µ = x f x( )dx

∀x∫

E X − µ( )2 = σ2 = E X2( )− µ 2 = x2 P X = x( )∀x∑

E X2( )1 2 4 4 3 4 4

− µ2

E X − µ( )2 = σ2 = E X2( )− µ 2 = x2 f x( )dx∀x∫

E X 2( )1 2 4 3 4

− µ 2

7


Propiedades de E(X) y Var(X)

( )( ) ( )( ) ( ) ( ) ( )

( )( ) ( )2

0

E a a

E aX aE X

E aX bY cZ aE X bE Y cE Z

Var a

Var aX a Var X

=

=

+ + = + +

=

=

( ) ( ) ( ) ( )2 2 2Var aX bY cZ a Var X b Var Y c Var Z+ + = + + +

( ) ( ) ( )2 , 2 , 2 ,abCov X Y acCov X Z bcCov Y Z+ +


Propiedades de E(X) y Var(X)

( ) ( )( ) ( )

,,

Cov X YCorr X Y

Var X Var Y=

( ) ( )( ) ( ), Y Y X YCov X Y E X Y E XYµ µ µ µ= − − = −

Donde:

y en términos muestrales:

( )( ) ( )( )

( ) ( )

1ˆ ,1

ˆ ,ˆ ,

n

i ii

x y

x y n x yCov X Y

nCov X Y

Corr X Ys s

=

−=

−

=

∑


Ejercicio

• Resolver el ejercicio 2.4 del libro de texto. Encontrar además la media, varianza, desviación estándar y mediana de la variable aleatoria.

• Resolver el ejercicio 2.19 del libro de texto.• Comprobar además que

(donde a y b son constantes)

2( ) ( )Var a bX b Var X+ =

8


Ejercicio

( ) ( ) ( ) ( )2 2 2Var aX bY cZ a Var X b Var Y c Var Z+ + = + + +

( ) ( ) ( ) ( )2 2 2 ,Var aX bY a Var X b Var Y abCov X Y+ = + +

Comprueba que:

( ) ( ) ( )2 , 2 , 2 ,abCov X Y acCov X Z bcCov Y Z+ +

Agrega este ejercicio a la Tarea 1:

Comprobar que:


Distribución Normal

La distribución normal es muy importante en la estadística debido a que muchos eventos están regidos, probabilísticamente, por esta distribución. Por otro lado, gran parte de la teoría para hacer inferencias estadísticas se ha desarrollado bajo supuestos de normalidad sobre la población bajo estudio.



La distribución de probabilidad de una variable aleatoria normal, con media µ y desviación σestá dada por:

( )2

21

−

= σµ

σπ

x

exf12

9



La forma de la gráfica es la siguiente:

µx

f ( x )



µ x

Uso de la tabla para el cálculo de probabilidades asociadas a una variable aleatoria normal



Si X es una variable aleatoria con distribución de probabilidad normal con media µ y desviación estándar σ y Z es una variable aleatoria con distribución normal con media 0 y varianza 1 (distribución normal estándar) entonces:

( )P P Pa X b a ba X b Zµ µ µ µ µσ σ σ σ σ− − − − − ≤ ≤ = ≤ ≤ = ≤ ≤

10


Ejercicio

• Si Z es una variable aleatoria con distribución de probabilidad normal estándar, determina:

Pr (Z > 1)Pr (-1.5<Z<1.8)Pr (Z > -0.95)Encuentra el valor de Z* tal que Pr (Z>Z*)=0.1


Ejercicio

• Una sociedad de inversión tiene un portafolio de acciones cuyos rendimientos anuales siguieron una distribución normal con una media de 15.7% y una desviación estándar de 9.6%.

Encuentra la proporción de acciones que tuvieron rendimientos mayores al 15%.Encuentra la proporción de acciones que tuvieron rendimientos mayores al 20%.Calcula la proporción de acciones que tuvieron rendimientos negativos.


Ejercicio

• Un inversionista está considerando tres portafolios de acciones con diferentes rendimientos y riesgos. Se estima que los rendimientos anuales de cada opción se pueden modelar mediante tres distribuciones normales con rendimientos promedio y desviaciones estándar tal y como se muestran a continuación:

• Media Desviación estándar• Portafolio A 15% 9%• Portafolio B 13% 7%• Portafolio C 10% 5%• El inversionista desea invertir su capital en el portafolio que

tenga mayores probabilidades de obtener rendimientos por encima de la tasa de inflación esperada, la cual se estima en 4%. Con base en lo anterior, determina en qué portafolio debe invertir.

11


¿Cómo saber si los datos de una muestra siguen una distribución de probabilidad normal?


Distribución de probabilidad normal

Un criterio muy sencillo para determinar si una variable aleatoria tiene una distribución de probabilidad normal es el siguiente:

( ) ( ) ( ) ( )sxsxxsxsx 3 3 ++−−

( )sx 2− ( )sx 2+

68%95%99%


Prueba Jarque-Bera para verificar Normalidad

( )22 ˆ 3ˆ

6 24k

KSJB n − = +

( )

( )

( )( )

23

32

4

22

k

E XS

E X

E XK

E X

µ

µ

µ

µ

− = −

−=

−

donde:

12



( )( )

3

4 4

0

3

E X

E X

µ

µ σ

− =

− =

Para una variable aleatoria distribuida normalmente:

Por lo que, bajo el principio de normalidad:

03

kSK

=

=



( )( )

( )( )

( )( )

( )( )

23

32

4

22

1ˆ

1

1ˆ

1

i

k

i

i

i

X Xn

SX X

n

X Xn

KX X

n

− − = − −

−−

= − −

∑

∑

∑

∑

En función de la muestra:



( )22

22

ˆ 3ˆ sigue una distribución

6 24k

KSJB n χ − = +

Para muestras grandes:

¿Bajo que condiciones se debe rechazar que:

Ho: La variable bajo estudio sigue una distribución Normal?

13


Ejercicio P.Cierre Tiempo20.5 115.4 216.9 313.4 48.8 5

22.1 614.3 719.6 812.7 97.8 10

23.3 1119.2 1220.8 1315.6 145.4 15

24.1 1612.6 17

17 1811.8 199.2 20

28.6 2116.8 2218.4 2315.9 249.9 25

Los datos que se analizaron anteriormente, y que se presentan a continuación, ¿siguen una distribución de probabilidad normal?



0

2

4

6

8

5 10 15 20 25 30

Series: PCIERRESample 1 25Observations 25

Mean 16.00400Median 15.90000Maximum 28.60000Minimum 5.400000Std. Dev. 5.607768Skewness 0.146333Kurtosis 2.587121

Jarque-Bera 0.266795Probability 0.875117


Análisis de Regresión Lineal Simple

14


Análisis de Regresión

• En Estadística existen muchos problemas en los que deseamos modelar y entender el efecto que una o más variables tienen sobre alguna variable de interés

• Áreas como negocios, educación, economía, finanzas y calidad, entre otras, requieren respuesta a preguntas sobre relaciones entre variables.


Análisis de Regresión

• El objetivo del análisis de regresión es modelar, estadísticamente, la contribución o impacto que una o más variables explicatorias pudieran tener sobre alguna variable de interés.


Proceso de construcción de modelos de regresión

Observación de la realidadObservación de la realidad

Clasificación de las observacionesClasificación de las observaciones

Construcción del modelo más eficienteConstrucción del modelo más eficiente

Inferencia sobre la realidadInferencia sobre la realidad

15


Modelos de regresión

• Con un modelo de regresión buscamos inferir sobre el proceso que generó los datos y, por consecuencia, el modelo a seleccionar será una representación ideal del proceso.

• Los modelos de regresión nos permitirán cuantificar la relación que existe entre dos o más variables


La realidad bajo estudio(Modelos transversales)

Realidad

Ventas

CompetidorPrecio

PromocionesEstrategias paramejorar el servicio

Informaciónmuestral

Representaciónde la

realidad

∈+++++= KK XXXY ββββ K22110 KK XXXY ββββ ˆˆˆˆˆ22110 ++++= K


La realidad bajo estudio(Modelos de Series de Tiempo)

Realidad

Rendimiento

CETESDeuda

Valor de Mercado.

Utilidades

Informaciónmuestral

Representaciónde la

realidad

0 1 1 2 2t t K Kt tY X X Xβ β β β= + + + + +∈K0 1 1 2 2

ˆ ˆ ˆ ˆˆt t K KtY X X Xβ β β β= + + + +K

16



• Costo de Capital (CAPM, APT)• Tipo de cambio, tasas de interés, inflación• Relación entre el IPC e índices de mercados

internacionales • Modelación del Spread en función volumen,

tamaño de la empresa, sector industrial• Estimar la probabilidad de que un empresa se

vuelva pública (en función de sus variables financieras)



• Interrelación entre variables económicas y financieras de México con las de otras economías (Inflación en México vs. Inflación en Estados Unidos, Tipos de Cambio, etc.)

• Estimar la probabilidad de que una empresa mexicana emita un ADR (en función de sus características financieras)

• Teoría de administración de portafolios (Rendimiento esperado de un portafolio como función de la desviación estándar de su rendimiento – riesgo -)

• Valor de una acción en función de variables del mercado real (participación de mercado, inversión en IyD, nivel de ventas, utilidades, anuncio de dividendos, etc.


representa la aleatoriedad del mundo de los negocios. Porsimplicidad llamaremos a error aleatorio

Representaciones sencillas de la realidad

Ventas

Inversión en publicidad

Demanda

Precio

∈∈

17


Representaciones sencillas de la realidad

En los dos casos anteriores, en los que estamos relacionando a las ventas con una variable, hablamos de un modelo de regresión lineal simple:

∈++= XY 10 ββ


Características estadísticas del error aleatorio

Los errores aleatorios:a) Son no correlacionados entre sí(independientes bajo el supuesto de normalidad)b) Tienen media ceroc) Tienen varianza constanted) Están distribuidos normalmente• Es importante resaltar que (variables independientes) son controladas por el investigador.

KXXX K,, 21


Características del modelo

Debe ser claro entonces que el modelo está compuesto de:

lo cual tiene el siguiente significado:

∈+++++= KK XXXY ββββ K22110

Parte fija Parte aleatoria

18


Consideraciones estadísticas del modelo de regresión


Objetivo del análisis

La finalidad de esta metodología de análisis es construir el modelo, en función de información muestral, que mejor represente a la realidad bajo estudio.


Metodología de análisis

a) Identificar las variables que pudieran estar relacionadas con nuestra variable de interés

b) Proponer un modelo que capte la relación entre las variables

c) Estimar los parámetros del modelo propuesto en función de la información muestral disponible

d) Verificar la validez estadística del modelo construido y el cumplimiento de las propiedades de los errores

e) Verificar que no existan variables redundantes o no significativas en el modelo

19


Técnica de estimación

Se usará la técnica de estimación de mínimos cuadrados ordinarios, que consiste en estimar a los parámetros del modelo, bajo el criterio de minimizar la suma de los cuadrados de los residuales.


1 1

11 2

2 1

1

0 1

ˆ

ˆ

n n

i ini i

i ii

n

ini

ii

x yx y

n

xx

n

Y X

β

β β

= =

=

=

=

−

=

−

= −

∑ ∑∑

∑∑

Estimadores de mínimos cuadrados


Técnica de estimación

∈+++++= KK XXXY ββββ K22110

verdaderoModelo

Información muestralInformación muestral

kK XXXY ββββ ˆˆˆˆêstimado Modelo

22110 ++++= K

20


Ejercicio

• Para los datos que se muestran a continuación determina:

El modelo de MCOInterpreta el significado de los resultados obtenidos¿existe una aparente relación entre el comportamiento de las ventas de la industria a nivel mundial con las ventas de la empresa?


Ejercicio

Año Trimestre Ventas de HYLSA (en millones) Ventas de la industria (mdm)1998 1 83.8 31.8

2 85.6 32.53 87.8 33.24 86.1 32.4

1999 1 89.6 33.82 91 34.33 93.9 35.34 91.8 34.5

2000 1 96.4 36.42 96 36.33 98.2 37.14 97.2 36.6

2001 1 100.1 37.62 102.6 38.33 105.4 39.34 102.9 38.5

2002 1 110.1 41.12 111.1 41.43 113.4 43.14 111.9 42.2


Ejercicio

Dependent Variable: HYLSAMethod: Least SquaresDate: 08/17/05 Time: 21:58Sample: 1998:1 2002:4Included observations: 20

Variable Coefficient Std. Error t-Statistic Prob.

C -2.407886 1.460328 -1.648866 0.1165INDUSTRIA 2.722656 0.039539 68.86021 0

R-squared 0.996218 Mean dependent var 97.745Adjusted R-squared 0.996008 S.D. dependent var 9.275121S.E. of regression 0.58601 Akaike info criterion 1.863681Sum squared resid 6.181346 Schwarz criterion 1.963254Log likelihood -16.63681 F-statistic 4741.729Durbin-Watson stat 1.262794 Prob(F-statistic) 0

21


Análisis de los residuales

Recordemos que el error aleatorio, , forma parte del modelo verdadero y constituye la aleatoriedad e incertidumbre que rodea a los fenómenos que estudiamos.Vamos a tratar de aproximarnos a los errores aleatorios a través de los residuales

∈

( )∈( )yye ˆ−=



Para verificar el cumplimiento de las características estadísticas de los errores vamos a analizar el comportamiento de los residuales.



Para verificar la normalidad tenemos que construir la distribución de frecuencias de los residuales y realizar una prueba formal (JB)

Frecuencias

Residuales0

22


Análisis de los residualese

0y

Comportamientoadecuado



y

e

0Varianza no

constante

¿Qué pruebas formales podemos hacer para verificar que la media de los residuales es cero y que la varianza es constante?



y

e

0

No hay independencia

entre losresiduales

(modelo nolineal)

23



• Prueba Durbin Watson para verificar correlación de orden uno.

• Una prueba más general es la construcción de un correlograma ya que permite determinar correlaciones de órdenes mayores.


Diagnóstico del modelo

( ) ( ) ( )2 22

1 1 1

ˆ ˆn n n

i i i ii i i

Y y Y y Y Y= = =

− = − + −∑ ∑ ∑

SST SSR SSE

Mide la variabilidad total de las

observaciones

Mide la variabilidad contenida o

captada por el modelo de regresión

Mide la variabilidad que

no es captada por el modelo de

regresión



2

1

(coeficiente de determinación)

eT r

T T T

er

T T

r

T

SSSS SSSS SS SS

SSSSSS SSSSRSS

= +

= +

=

24



10 2 ≤≤ R El coeficiente de determinación es un indicador de la calidad del modelo construido, ya que mide el porcentaje de la variabilidad que es captada por el modelo de regresión.


Diagnóstico del modelo construido

Tenemos que determinar si el modelo construido es estadísticamente significativo. Lo anterior significa que debemos determinar si al menos una de las variables explicatorias (en el caso de un modelo de regresión múltiple) está relacionada con la variable principal. Para lograr lo anterior vamos a realizar una comparación estadística entre SSr y SSe a través del análisis de varianza.


Importancia de las variables dentro del modelo

Diremos que alguna de las variables independientes no es importante para explicar el comportamiento de Y, cuando su coeficiente en el modelo, ,sea estadísticamente cero.

( )β

25


Importancia de las variables dentro del modelo

Una vez que se ha determinado que una o más variables independientes no son estadísticamente importantes para explicar el comportamiento de Y, tenemos que construir un nuevo modelo, pero esta vez sólo con las variables, estadísticamente, importantes.


Inferencias sobre el modelo de regresión

• Antes que nada debemos determinar la distribución de probabilidad de los parámetros estimados:

( ) ( )2

1 1 1 1ˆ ˆ ˆ,

XX

N E VarSσβ β β β

= =

( ) ( )2

20 0 0 0

1ˆ ˆ ˆ,XX

XN E Varn S

β β β β σ

= = +



1 2, 2 1 1 2, 2ˆ ê e

n nXX XX

MS MSt tS Sα αβ β β− −

− < < +

1β

0β

Intervalo de confianza para

Intervalo de confianza para

2 2

0 2, 2 0 0 2, 21 1ˆ ˆ

n e n eXX XX

X Xt MS t MSn S n Sα αβ β β− −

− + < < + +

26



( ) ( ) ( )2 20 0

2, 2 2, 21 1ˆ ˆ

n e n eXX XX

X X X XY t MS E Y X Y t MS

n S n Sα α− −

− − − + < < + +

Intervalo de confianza para E(Y|X) es:

Intervalo de confianza para Y|X es:

( ) ( )2 20 0

2, 2 2, 21 1ˆ ˆ1 1n e n e

XX XX

X X X XY t MS Y Y t MS

n S n Sα α− −

− − − + + < < + + +


Ejercicio

• Realiza un diagnóstico detallado del modelo estimado anteriormente. ¿Se cumplen todos los supuestos estadísticos hechos sobre los errores aleatorios del modelo?

• Determina, con una confianza del 90%, el incremento en el nivel de ventas de la compañía si las ventas a nivel mundial de acero se incrementan en 1000 millones de USD.

• Si se ha pronosticado que las ventas de la industria para el primer trimestre de 2003 serán de 44 mil millones de dólares estima, con una confianza del 90%, el pronóstico de ventas para Hylsa y su nivel promedio de ventas.


Transformaciones a modelos lineales de regresión

¿Qué pasa si la relación entre Y y X no es lineal?

Y

X

••

••

•••

•

( ) ∈++= xnY l10 ββ

27



Y

X

∈++=

∈++=

xeYó

XY

10

210

ββ

ββ

••

••

•

•

••

••



Y

X

•

•

•

•

••

••

∈+

+=

xY 1

10 ββ•

•


Cálculo de Elasticidades

• La elasticidad es una medida que permite saber la variación de la variable de respuesta, en términos porcentuales, a medida que la variable explicatoria varía en una unidad porcentual.

• En otras palabras:

YYE XX

∂=

∂

28


Análisis de Regresión Lineal Múltiple


Modelo General

• El modelo general se escribe de la siguiente manera:

• Cada observación es entonces modelada de la siguiente manera:

Y = β0 + β1X 1 + β2X 2 +...+ βk X k +ε

Y1 = β0 + β1X 11 + β2X 12 +K+β k X 1k + ε1Y2 = β0 + β1X 21 + β2X 22+K+βk X 2k + ε2M

Yn = β0 + β1X n1 + β2X n 2+K+βk X nk + εn


Modelo Ajustado

• El modelo general se escribe de la siguiente manera:

• Cada observación es entonces modelada de la siguiente manera:

0 1 1 2 2 k ˆ ˆ ˆ ˆ + + +...+ +kY X X X eβ β β β=

1 0 1 11 2 12 k 1 1

2 0 1 21 2 22 k 2 2

n 0 1 1 2 2 k

ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ

ˆ ˆ ˆ ˆ

k

k

n n nk n

Y X X X e

Y X X X e

Y X X X e

β β β β

β β β β

β β β β

= + + + + +

= + + + + +

= + + + + +

K

K

M

K

29


Estimación

• Estimaremos los parámetros mediante la técnica de Mínimos Cuadrados Ordinarios (Minimizar la suma de los cuadrados de los residuales)

( )2

2i 0 1 1 2 2 k

1 1

n n

i i i i ki i

e Y X X Xβ β β β= =

= − − − − −∑ ∑ K


Forma Matricial

• El modelo general y ajustado, en forma matricial, se escriben como sigue:

Y1Y2M

Yn

=

1 X 11 X 12 K X 1k1 X 21 X 22 K X 2kM M M M M

1 X n1 X n 2 K X nk

β 0β1β2M

βk

+

ε1ε2M

εn

0

11 12 1 111

21 22 2 22

2

1 2n

k

ˆ1 ˆ1

ˆ

1 ˆ

k

k

n n nk n

X X X eYX X X eY

X X X eY

β

β

β

β

= +

K

K

M M M M M MMM

K


Estimación en Forma Matricial

• El modelo matricial reducido: ˆ eβ= +Y X% %%

( )

1

2 2 2 21 2 1 2

Tn n

n

ee

e e e e e e e e

e

= = + + +

K KM% %

ê β= −Y X%% %

( ) ( ) ( )( )ˆ ˆ ˆ ˆTT T T Te e β β β β= − − = − −Y X Y X Y X Y X

% % % %% % % % % %ˆ ˆ ˆ ˆT T T T T T Te e β β β β= − − +Y Y Y X X Y X X

% % % %% % % % % %

30



• Finalmente

• ya que

• Debe entonces ser claro que deseamos Min Q.

ˆ ˆ ˆ2T T T T TQ e e β β β= = − +Y Y Y X X X% % %% % % % %

ˆ ˆT T Tβ β=Y X X Y% %% %

( ) ( )ˆ ˆ ˆ2 2 2 0ˆ ˆTT T T T T TQ∂ ∂ β β β β

∂β ∂β= − + = − + =Y Y Y X X X Y X X X

% % %% %

( ) ˆ ˆ2 2 2 2 0TT T T Tβ β− + = − + =Y X X X X Y X X

% %



• Que al simplificar:• Debe ser claro entonces que nuestros

estimadores están dados por:

ˆT Tβ =X X X Y%%

( ) 1ˆ T Tβ−

= X X X Y%%


Representación Gráfica

X2

X1

Y

22110 XˆXˆˆ Y βββ ++=

31


Características estadísticas del error aleatorio

Los errores aleatorios:a) Son independientes entre síb) Tienen media ceroc) Tienen varianza constanted) Están distribuidos normalmente• Es importante resaltar que (variables independientes) son controladas por el investigador.

KXXX K,, 21



( ) ( ) ( )2 22

1 1 1

ˆ ˆn n n

i i i ii i i

Y y Y y Y Y= = =

− = − + −∑ ∑ ∑

SST SSR SSE

Mide la variabilidad total de las

observaciones

Mide la variabilidad contenida o

captada por el modelo de regresión

Mide la variabilidad que

no es captada por el modelo de

regresión


De forma matricial

2 2

1

n

T ii

SS Y nY=

= −∑

2ˆ TRSS nYβ= −TX Y

( )2 2 2 2

1 1

ˆ ˆ ˆn n

T T Te T R i i

i iSSR

SST

SS SS SS Y nY nY Yβ β β= =

= − = − − − = − = −∑ ∑T T T TX Y X Y Y Y X Y144244314243

32


Análisis de varianza

Fuente devariación

Modelo de regresión

Residual

Total

Suma decuadrados

SSR

SSe

SST

GL

K

n-K-1

n-1

Media de cuadrados

−−−−−−−−−−−

=

=

1knSS

MS

KSS

MS

ee

RR

F

−−−−−−

−−−−−−

=e

R

MSMSF0


Ejercicio

• Los siguientes datos representan el nivel de ventas de la cadena de tiendas departamentales SEARS en Estados Unidos, de 1982 al 2002.

• a) Estima el modelo de MCO• b) Con una confianza del 90%, ¿podemos

afirmar que el modelo es significativo?• c) Con una confianza del 90% ¿Podemos decir

que todas las variables son significativas?


EjercicioVentas Ingreso Porc.Desempleo330.7 7.8114286 4.4355.6 8.3228571 4.1360.1 8.7685714 4.3372.1 9.06 6.8403.6 9.6028571 5.5413.4 9.9828571 5.5426.8 10.368571 6.7457.8 10.968571 5.5509.3 11.508571 5.7571.6 12.485714 5.2635.7 13.491429 4.5676.9 14.582857 3.8729.6 15.557143 3.8817.8 16.802857 3.6884.4 18.011429 3.5925.1 19.597143 4.9

1000.6 21.222857 5.91120 22.894286 5.61250 25.802857 4.9

1310.1 28.102857 5.61364 30.762857 8.5

33


Pruebas de hipótesis

• Para probar hipótesis que involucran uno o dos parámetros, una forma sencilla de proceder es a través de la construcción del estadístico T.

• Para el caso de hipótesis que involucran más de dos parámetros, una forma de proceder es a través de la construcción del estadístico:

( )

( )

Re Re

0Re

Re

No. de Restriccionese stringido eSin stricción

eSin stricción

Sin stricción

SS SSF SS

n p

−

=

−


Ejercicio

• Para el ejercicio anterior, con una confianza del 90%, ¿podemos afirmar que un decremento de 2% en la tasa de desempleo, tiene el mismo impacto en las ventas de la compañía que el incremento en 1000 dólares del ingreso promedio anual?


Inferencias sobre la variable de respuesta

• Para hacer inferencias sobre ( ) y sobre Y x E Y x% %

( ) ( )1 1

/2, /2, ˆ ˆ1 1T T T T

n p n pY t MSe x x Y x Y t MSe x xα α

− −

− − − + < < + +

X X X X% % % % %

( ) ( ) ( )1 1

/ 2, / 2, ˆ ˆT T T T

n p n pY t MSe x x E Y x Y t MSe x xα α

− −

− − − < < +

X X X X% % % % %

34


Ejercicio

• Con una confianza del 90%, estima el nivel de ventas de la compañía y el nivel promedio, si el nivel de ingreso promedio es de 32,000 dólares y la tasa de desempleo es del 6.7%.


Medición de la contribución marginal de nuevas variables explicatorias en el modelo

• Bajo la hipótesis nula de que las nuevas variables no son significativas y partiendo de que todas las condiciones estadísticas establecidas para los errores se cumplen para los residuales, entonces la siguiente expresión tiene una distribución de probabilidad F:

( )

( )0

No. Regresores NuevosRNuevo ROriginal

eNuevo

Nuevo

SS SS

F SSn p

−

=

−


Ejercicio

• Para el ejercicio anterior, considera que inicialmente sólo se considero en el modelo el nivel de ingreso. Desde este punto de partida, determina, con una confianza del 90%, si agregar la variable desempleo genera un incremento significativo en la suma de cuadrados de la regresión.

35


Variables Categóricas/Cualitativas


Variables cualitativas

Sí es necesario incluir en el modelo de regresión variables cualitativas lo tenemos que hacer bajo la siguiente metodología:Si una variable cualitativa cualquiera tiene Q niveles, entonces debemos agregar en el modelo Q-1 variables de regresión.



VariableTrimestreVariableTrimestre

Niveles•T1•T2•T3•T4

Niveles•T1•T2•T3•T4

Forma de representarla en el modelo de regresión

D1 D2 D31 0 00 1 00 0 10 0 0

Forma de representarla en el modelo de regresión

D1 D2 D31 0 00 1 00 0 10 0 0

Por ejemplo si una variable explicatoria de las ventas es la estación del año:

36



• Suponiendo que Y representa el rendimiento de acumulado de una acción, trimestralmente, X1 representa el nivel acumulado de ventas de la compañía durante el trimestre y que X2 corresponde al desempeño promedio del mercado financiero de manera trimestral y que además se desea determinar si existe o no una variación significativa en el comportamiento de la variable dependiente en función del trimestre. En función de lo anterior determina la forma funcional del modelo que representa cada trimestre:



( ) ( ) ( )( ) ( ) ( )

0 1 1 2 2 3 1 4 2 5 3

6 1 1 7 2 1 8 3 1

9 1 2 10 2 2 11 3 2

Y X X D D DD X D X D X

D X D X D X

β β β β β ββ β β

β β β ε

= + + + + + +

+ + +

+ + +

La representación completa del modelo es:

A partir de la cual se puede determinar la estructura para cada trimestre.

Indica la forma en que determinarías si todas las estructuras son estadísticamente iguales.


Ejercicio

• Para el siguiente caso, encuentra los estimadores de MCO del modelo que tome en cuenta, además del comportamiento de las ventas de la industria del acero a nivel mundial, la variación que pudiera ocasionarse de un trimestre a otro.

• Con una confianza del 90%, ¿podemos afirmar que la estructura para cada trimestre es la misma?

37


Ejercicio

Año Trimestre Ventas de HYLSA (en millones) Ventas de la industria (mdm)1998 1 83.8 31.8

2 85.6 32.53 87.8 33.24 86.1 32.4

1999 1 89.6 33.82 91 34.33 93.9 35.34 91.8 34.5

2000 1 96.4 36.42 96 36.33 98.2 37.14 97.2 36.6

2001 1 100.1 37.62 102.6 38.33 105.4 39.34 102.9 38.5

2002 1 110.1 41.12 111.1 41.43 113.4 43.14 111.9 42.2


Violación de los supuestos estadísticos del modelo de Regresión Lineal

MulticolinealidadHeteroscedasticidad

Autocorrelación


Multicolinealidad

38


Multicolinealidad

• El problema de la Multicolinealidad se presenta cuando las variables independientes, en un modelo de regresión múltiple, están relacionadas. El problema evidente se da en el proceso de estimación. ¿Por qué?


Algunos problemas inducidos por la multicolinealidad

• Los estimadores de MCO tienen varianzas y covarianzas que generalmente son muy grandes; ¿por qué?

• Como consecuencia de lo anterior los intervalos de confianza tienden a ser muy amplios. ¿Qué implicaciones tendría esto?

• Los estimadores y sus errores estándar tienen a ser muy sensibles ante cambios en los datos


Detección de la Multicolinealidad

• Alto valor en el coeficiente de determinación pero sólo algunos estadísticos t son significativos

• Correlaciones altas (mayores a 0.8) en parejas de variables explicatorias

• Coeficiente parcial de determinación (obtenido de una regresión auxiliar) mayor que el coeficiente de determinación total (indicando que esa variable explicatoria es colineal a otras variables explicatorias)

• Factor de inflación de la varianza (VIF) mayor que 10 (esto pasaría si el coeficiente de determinación parcial es mayor que 0.9)

39


Detección de la Multicolinealidad

• Es importante tener en cuenta que:

2 iRCorresponde al coeficiente parcial de determinación al correr la regresión en la que

es la variable dependiente y el resto de las variables las independientes

iX

• Por otro lado, el Factor de Inflación de la Varianza (VIF) está dado por:

2

11i

i

VIFR

=−


Algunas formas de remediar el problema de la Multicolinealidad

• Combinación de datos cross seccionales con series de tiempo

• Combinación de variables • Transformación de variables. Trabajar con la

primera diferencia podría ayudar a eliminar el problema de la multicolinealidad. Un problema que podría inducirse es la violación de los supuestos estadísticos en la parte aleatoria del modelo (para series de tiempo).

• ¿El caso de sears, presenta un problema serio de multicolinealidad?


Algunas formas de remediar el problema de la Multicolinealidad

• Algunas veces, por error, se tiende a eliminar alguna o algunas de las variables relacionadas con otras. En estos casos se puede inducir, con una alta probabilidad, el problema de omisión de variables, lo que resultaría en realizar estimaciones sesgadas de los parámetros ¿Por qué?

• El problema de la omisión de variables puede ser detectado a través de la prueba de Ramsey: RESET (REgression Specification Error Test) Es importante mencionar que esta prueba también nos permite detectar formas funcionales incorrectas en el modelo propuesto.

40


Prueba RESET de Ramsey

• La idea central es:

• Realizar el ejercicio seleccionado.

0 1 1 2 2t t t tY X Xβ β β ε= + + +

0 1 1 2 2

2 30 1 1 2 2 1 2

ˆ ˆ ˆˆ

ˆ ˆt t t

t t t t t t

Y X X

Y X X Y Y

β β β

β β β α α ε

= + +

= + + + + +


Heteroscedasticidad


Heteroscedasticidad

• Sabemos que el problema de la heteroscedasticidad se presenta por no tener una variabilidad constante en la parte aleatoria del modelo de regresión y, como consecuencia, en la variable de respuesta. Algunas fuentes de la heteroscedasticidad pueden ser:

La presencia de características específicas que deben ser controladas; la ocurrencia de eventos; la presencia de puntos atípicos; modelos mal especificados (por omisión de variables o por error en la especificación de la forma funcional)

41


Heteroscedasticidad

• Las estimaciones de los parámetros de un modelo de regresión en el que las varianzas de los errores no son constantes son insesgadas pero no son de mínima varianza, lo que conduce a construir intervalos de confianza innecesariamente amplios.


Detección de la Heteroscedasticidad

( )ˆ ó y X

e

0

¿Qué pruebas formales podemos hacer para verificar que la varianza es constante?



Métodos FormalesPrueba de Park: Es una formalización del método gráfico y sugiere que la varianza es función de la variable explicatoria X, esto es:

Después de linealizar el modelo y estimar los parámetros, si α es estadísticamente significativa representaría evidencia a favor de que la heteroscedasticidad está presente en los datos. Parkpropone usar como proxi de la varianza.

20i i iX ασ α ν=

( )2ln ie

42



• Otras pruebas sugieren diferentes formas funcionales:

0

0

0

0

1

1

i i i

i i i

i ii

i ii

e X

e X

eX

eX

α α ν

α α ν

α α ν

α α ν

= + +

= + +

= + +

= + +



• La prueba de Goldfeld-Quandt equivale a comparar las varianzas de dos grupos de observaciones.

• Una de las pruebas más utilizadas es la prueba de White. Consideremos el modelo:

0 1 1 2 2i i i iY X Xβ β β ε= + + +



• White propone estimar los parámetros de la siguiente regresión auxiliar:

• Bajo la hipótesis nula de que no existe heteroscedasticidad se puede comprobar que

• Donde los GL equivalen al número de parámetros estimados en la regresión auxiliar (excluyendo el intercepto)

2 2 20 1 1 2 2 3 1 4 2 5 1 2i i i i i i i ie X X X X X Xα α α α α α ν= + + + + + +

2 2 tiene una distribución GLnR χ

43


Corrección de la heteroscedasticidad

• Cuando es conocida el método de Mínimos Cuadrados Ponderados es una solución adecuada. Este procedimiento conduce a estimaciones insesgadas de mínima varianza.

• Cuando es desconocida una forma de resolver el problema es asumir algunos patrones o estructuras entre la varianza y las variables explicatorias.

2iσ

2iσ



• Algunas estructuras:

( )

2 2 2

2 2

22 2

i i

i i

i i

X

X

E Y X

σ σ

σ σ

σ σ

=

=

=



• Con frecuencia algunas transformaciones logarítmicas reducen la heteroscedasticidad:

1

1

0

0

XY e

Y X

β

β

β ε

β ε

=

=

44


Autocorrelación


Autocorrelación

• El problema de la autocorrelación surge en modelos de series de tiempo en los que la estructura aleatoria muestra correlación en diferentes instantes del tiempo. Lo anterior implica que:

( ), 0 1, 2,t t kCorr kε ε − ≠ ∀ = K


Autocorrelación

• Algunas causas de la autocorrelación:Muchas variables económicas y financieras están sujetas a ciclos económicos, que explican tendencias hacia arriba o hacia abajo que, muchas veces, inducen autocorrelación (Series de Tiempo)Exclusión de variables. Forma funcional incorrectaEstimación de parámetros a partir de las primeras diferenciasInclusión, como variable (s) independiente (s), de observaciones rezagadas de la variable dependiente

45


Autocorrelación

• Las estimaciones de los parámetros a partir de del método de MCO siguen siendo insesgadas, al igual que en el caso de la heteroscedasticidad, pero no son de mínima varianza. Sin pérdida de generalidad, consideremos una estructura autorregresiva de orden 1 para tratar de representar la forma de la asociación o dependencia. En esta estructura cumple con todas las condiciones estadísticas impuestas en el modelo clásico de regresión.

1t t tε ρε ν−= +

tν


Detección de la Autocorrelación

• Métodos Gráficos:Residuales (Residuales Estandarizados) vs. TiempoResiduales vs. Variables ExplicatoriasResiduales vs. Rezagos de los Residuales



(ó )X t

e

0

No hay aleatoriedad

entre losresiduales

(modelo nolineal)

46



• Métodos Formales:Prueba de las Corridas: n es el número total de residuales; n1 es el número de residuales positivos; n2 es el número de residuales negativos; k corresponde al número de corridas. Es posible demostrar que:

( )

( ) ( )( ) ( )

1 2

1 2

1 2 1 2 1 22

1 2 1 2

2 1

2 21

n nE kn n

n n n n n nVar k

n n n n

= ++

− −=

+ + −



• Si la hipótesis de la aleatoriedad se cumple entonces k, el número de corridas observadas en un problema, debe estar contenida en el siguiente intervalo:

• Lo anterior significa que la hipótesis sobre la aleatoriedad no se rechaza con una confianza del 95% si el valor observado de k estácontenido en el intervalo anterior.

( ) 1.96 kE k σ±



• Prueba de Durbin-Watson: 122 1 t t

t

e ed

e−

≈ −

∑∑

Hipótesis Nula Decisión CondiciónNo autocorrelación positiva Rechazar 0<d<dLNo autocorrelación positiva Indecisión dL<=d<=dUNo autocorrelación negativa Rechazar 4-dL<d<4No autocorrelación negativa Indecisión 4-dU<=d<=4-dL

No autocorrelación (+ ó -) No rechazar dU<d<4-dU

47



• Prueba de Breusch-Godfrey: Esta prueba es más general que la de DW ya que permite determinar si hay correlaciones de orden mayor.

• Empíricamente: 1) Estimar el modelo de regresión usando MCO. 2) Estimar el modelo de contra todas las variables explicatorias y todos los residuales rezagados, dependiendo del orden de la estructura autorregresiva (p)

1 1 2 2 3 3t t t t p t p tε ρ ε ρ ε ρ ε ρ ε ν− − − −= + + + + +K

te



• BG demostraron que bajo el cumplimiento de la hipótesis nula:

2 2 tiene una distribución de probabilidad pnR χ

0 1 2 3: 0pH ρ ρ ρ ρ= = = = =L


Corrección de la Autocorrelación

• Cuando la estructura de la autocorrelación se conoce y se asume de orden 1, se debe transformar el modelo original de modo que se tome en cuenta la estructura asumida. Hecho lo anterior, se debe emplear el método de MCG para hacer la estimación de los parámetros.

• Cuando se desconoce: Uno de los métodos que con más frecuencia se utiliza para estimar es el método iterativo de Cochrane-Orcutt.

ρρ

48


Corrección de la Autocorrelación

• Una prueba alternativa, para estructuras autorregresivas de orden 1, es la de Cochrane-Orcutt, que consiste en estimar el modelousando MCO. Si asumimos una estructura AR(1):

la intención es estimar al coeficiente de correlación a través de y usar esta primera aproximación para estimar al modelo transformado en función de la estructura AR(1). Este proceso se lleva a cabo de manera iterativa hasta cumplir con algún criterio de terminación.

0 1t t tY Xβ β ε= + +

1t t tε ρε ν−= +1t t te eρ η−= +

Econometría Financiera Enero Mayo de 2007 - mty.itesm.mx · © 2006 Osmar Zavaleta ECONOMETRIA FINANCIERA © 2006 Osmar Zavaleta ECONOMETRIA FINANCIERA © 2006 Osmar Zavaleta ECONOMETRIA

Documents