This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
• Interrelación entre variables económicas y financieras de México con las de otras economías (Inflación en México vs. Inflación en Estados Unidos, Tipos de Cambio, etc.)
• Estimar la probabilidad de que una empresa mexicana emita un ADR (en función de sus características financieras)
• Teoría de administración de portafolios (Rendimiento esperado de un portafolio como función de la desviación estándar de su rendimiento – riesgo -)
• Valor de una acción en función de variables del mercado real (participación de mercado, inversión en IyD, nivel de ventas, utilidades, anuncio de dividendos, etc.
Variables Aleatorias y Distribuciones de Probabilidad
• Una variable aleatoria es una función de números reales que resulta de hacer transformaciones sobre algún espacio muestral, esto es, cuando posibles eventos del espacio muestral se transforman en números reales, se construye una variable aleatoria.
• Una distribución de probabilidad resulta cuando a cada valor de la variable se le asigna su probabilidad de ocurrencia correspondiente.
• El SAT reembolsa de manera automática los excedentes retenidos a sus contribuyentes que son personas físicas. Se sabe que la devolución automática se hace efectiva sólo en el 60% de los casos. Si tres personas físicas (con saldo a favor) harán su declaración, encuentra la distribución de probabilidad del número de personas (de las tres) que recibirán el reembolso de manera automática. Encuentra la probabilidad de que al menos dos de ellas lo reciban.
La distribución normal es muy importante en la estadística debido a que muchos eventos están regidos, probabilísticamente, por esta distribución. Por otro lado, gran parte de la teoría para hacer inferencias estadísticas se ha desarrollado bajo supuestos de normalidad sobre la población bajo estudio.
Si X es una variable aleatoria con distribución de probabilidad normal con media µ y desviación estándar σ y Z es una variable aleatoria con distribución normal con media 0 y varianza 1 (distribución normal estándar) entonces:
( )P P Pa X b a ba X b Zµ µ µ µ µσ σ σ σ σ− − − − − ≤ ≤ = ≤ ≤ = ≤ ≤
• Una sociedad de inversión tiene un portafolio de acciones cuyos rendimientos anuales siguieron una distribución normal con una media de 15.7% y una desviación estándar de 9.6%.
Encuentra la proporción de acciones que tuvieron rendimientos mayores al 15%.Encuentra la proporción de acciones que tuvieron rendimientos mayores al 20%.Calcula la proporción de acciones que tuvieron rendimientos negativos.
• Un inversionista está considerando tres portafolios de acciones con diferentes rendimientos y riesgos. Se estima que los rendimientos anuales de cada opción se pueden modelar mediante tres distribuciones normales con rendimientos promedio y desviaciones estándar tal y como se muestran a continuación:
• Media Desviación estándar• Portafolio A 15% 9%• Portafolio B 13% 7%• Portafolio C 10% 5%• El inversionista desea invertir su capital en el portafolio que
tenga mayores probabilidades de obtener rendimientos por encima de la tasa de inflación esperada, la cual se estima en 4%. Con base en lo anterior, determina en qué portafolio debe invertir.
• En Estadística existen muchos problemas en los que deseamos modelar y entender el efecto que una o más variables tienen sobre alguna variable de interés
• Áreas como negocios, educación, economía, finanzas y calidad, entre otras, requieren respuesta a preguntas sobre relaciones entre variables.
• El objetivo del análisis de regresión es modelar, estadísticamente, la contribución o impacto que una o más variables explicatorias pudieran tener sobre alguna variable de interés.
• Con un modelo de regresión buscamos inferir sobre el proceso que generó los datos y, por consecuencia, el modelo a seleccionar será una representación ideal del proceso.
• Los modelos de regresión nos permitirán cuantificar la relación que existe entre dos o más variables
• Interrelación entre variables económicas y financieras de México con las de otras economías (Inflación en México vs. Inflación en Estados Unidos, Tipos de Cambio, etc.)
• Estimar la probabilidad de que una empresa mexicana emita un ADR (en función de sus características financieras)
• Teoría de administración de portafolios (Rendimiento esperado de un portafolio como función de la desviación estándar de su rendimiento – riesgo -)
• Valor de una acción en función de variables del mercado real (participación de mercado, inversión en IyD, nivel de ventas, utilidades, anuncio de dividendos, etc.
Los errores aleatorios:a) Son no correlacionados entre sí(independientes bajo el supuesto de normalidad)b) Tienen media ceroc) Tienen varianza constanted) Están distribuidos normalmente• Es importante resaltar que (variables independientes) son controladas por el investigador.
La finalidad de esta metodología de análisis es construir el modelo, en función de información muestral, que mejor represente a la realidad bajo estudio.
Se usará la técnica de estimación de mínimos cuadrados ordinarios, que consiste en estimar a los parámetros del modelo, bajo el criterio de minimizar la suma de los cuadrados de los residuales.
• Para los datos que se muestran a continuación determina:
El modelo de MCOInterpreta el significado de los resultados obtenidos¿existe una aparente relación entre el comportamiento de las ventas de la industria a nivel mundial con las ventas de la empresa?
Recordemos que el error aleatorio, , forma parte del modelo verdadero y constituye la aleatoriedad e incertidumbre que rodea a los fenómenos que estudiamos.Vamos a tratar de aproximarnos a los errores aleatorios a través de los residuales
10 2 ≤≤ R El coeficiente de determinación es un indicador de la calidad del modelo construido, ya que mide el porcentaje de la variabilidad que es captada por el modelo de regresión.
Tenemos que determinar si el modelo construido es estadísticamente significativo. Lo anterior significa que debemos determinar si al menos una de las variables explicatorias (en el caso de un modelo de regresión múltiple) está relacionada con la variable principal. Para lograr lo anterior vamos a realizar una comparación estadística entre SSr y SSe a través del análisis de varianza.
Diremos que alguna de las variables independientes no es importante para explicar el comportamiento de Y, cuando su coeficiente en el modelo, ,sea estadísticamente cero.
Una vez que se ha determinado que una o más variables independientes no son estadísticamente importantes para explicar el comportamiento de Y, tenemos que construir un nuevo modelo, pero esta vez sólo con las variables, estadísticamente, importantes.
• Realiza un diagnóstico detallado del modelo estimado anteriormente. ¿Se cumplen todos los supuestos estadísticos hechos sobre los errores aleatorios del modelo?
• Determina, con una confianza del 90%, el incremento en el nivel de ventas de la compañía si las ventas a nivel mundial de acero se incrementan en 1000 millones de USD.
• Si se ha pronosticado que las ventas de la industria para el primer trimestre de 2003 serán de 44 mil millones de dólares estima, con una confianza del 90%, el pronóstico de ventas para Hylsa y su nivel promedio de ventas.
• La elasticidad es una medida que permite saber la variación de la variable de respuesta, en términos porcentuales, a medida que la variable explicatoria varía en una unidad porcentual.
Los errores aleatorios:a) Son independientes entre síb) Tienen media ceroc) Tienen varianza constanted) Están distribuidos normalmente• Es importante resaltar que (variables independientes) son controladas por el investigador.
• Para el ejercicio anterior, con una confianza del 90%, ¿podemos afirmar que un decremento de 2% en la tasa de desempleo, tiene el mismo impacto en las ventas de la compañía que el incremento en 1000 dólares del ingreso promedio anual?
• Con una confianza del 90%, estima el nivel de ventas de la compañía y el nivel promedio, si el nivel de ingreso promedio es de 32,000 dólares y la tasa de desempleo es del 6.7%.
Medición de la contribución marginal de nuevas variables explicatorias en el modelo
• Bajo la hipótesis nula de que las nuevas variables no son significativas y partiendo de que todas las condiciones estadísticas establecidas para los errores se cumplen para los residuales, entonces la siguiente expresión tiene una distribución de probabilidad F:
• Para el ejercicio anterior, considera que inicialmente sólo se considero en el modelo el nivel de ingreso. Desde este punto de partida, determina, con una confianza del 90%, si agregar la variable desempleo genera un incremento significativo en la suma de cuadrados de la regresión.
Sí es necesario incluir en el modelo de regresión variables cualitativas lo tenemos que hacer bajo la siguiente metodología:Si una variable cualitativa cualquiera tiene Q niveles, entonces debemos agregar en el modelo Q-1 variables de regresión.
• Suponiendo que Y representa el rendimiento de acumulado de una acción, trimestralmente, X1 representa el nivel acumulado de ventas de la compañía durante el trimestre y que X2 corresponde al desempeño promedio del mercado financiero de manera trimestral y que además se desea determinar si existe o no una variación significativa en el comportamiento de la variable dependiente en función del trimestre. En función de lo anterior determina la forma funcional del modelo que representa cada trimestre:
• Para el siguiente caso, encuentra los estimadores de MCO del modelo que tome en cuenta, además del comportamiento de las ventas de la industria del acero a nivel mundial, la variación que pudiera ocasionarse de un trimestre a otro.
• Con una confianza del 90%, ¿podemos afirmar que la estructura para cada trimestre es la misma?
• El problema de la Multicolinealidad se presenta cuando las variables independientes, en un modelo de regresión múltiple, están relacionadas. El problema evidente se da en el proceso de estimación. ¿Por qué?
• Alto valor en el coeficiente de determinación pero sólo algunos estadísticos t son significativos
• Correlaciones altas (mayores a 0.8) en parejas de variables explicatorias
• Coeficiente parcial de determinación (obtenido de una regresión auxiliar) mayor que el coeficiente de determinación total (indicando que esa variable explicatoria es colineal a otras variables explicatorias)
• Factor de inflación de la varianza (VIF) mayor que 10 (esto pasaría si el coeficiente de determinación parcial es mayor que 0.9)
Algunas formas de remediar el problema de la Multicolinealidad
• Combinación de datos cross seccionales con series de tiempo
• Combinación de variables • Transformación de variables. Trabajar con la
primera diferencia podría ayudar a eliminar el problema de la multicolinealidad. Un problema que podría inducirse es la violación de los supuestos estadísticos en la parte aleatoria del modelo (para series de tiempo).
• ¿El caso de sears, presenta un problema serio de multicolinealidad?
Algunas formas de remediar el problema de la Multicolinealidad
• Algunas veces, por error, se tiende a eliminar alguna o algunas de las variables relacionadas con otras. En estos casos se puede inducir, con una alta probabilidad, el problema de omisión de variables, lo que resultaría en realizar estimaciones sesgadas de los parámetros ¿Por qué?
• El problema de la omisión de variables puede ser detectado a través de la prueba de Ramsey: RESET (REgression Specification Error Test) Es importante mencionar que esta prueba también nos permite detectar formas funcionales incorrectas en el modelo propuesto.
• Sabemos que el problema de la heteroscedasticidad se presenta por no tener una variabilidad constante en la parte aleatoria del modelo de regresión y, como consecuencia, en la variable de respuesta. Algunas fuentes de la heteroscedasticidad pueden ser:
La presencia de características específicas que deben ser controladas; la ocurrencia de eventos; la presencia de puntos atípicos; modelos mal especificados (por omisión de variables o por error en la especificación de la forma funcional)
• Las estimaciones de los parámetros de un modelo de regresión en el que las varianzas de los errores no son constantes son insesgadas pero no son de mínima varianza, lo que conduce a construir intervalos de confianza innecesariamente amplios.
Métodos FormalesPrueba de Park: Es una formalización del método gráfico y sugiere que la varianza es función de la variable explicatoria X, esto es:
Después de linealizar el modelo y estimar los parámetros, si α es estadísticamente significativa representaría evidencia a favor de que la heteroscedasticidad está presente en los datos. Parkpropone usar como proxi de la varianza.
• Cuando es conocida el método de Mínimos Cuadrados Ponderados es una solución adecuada. Este procedimiento conduce a estimaciones insesgadas de mínima varianza.
• Cuando es desconocida una forma de resolver el problema es asumir algunos patrones o estructuras entre la varianza y las variables explicatorias.
• El problema de la autocorrelación surge en modelos de series de tiempo en los que la estructura aleatoria muestra correlación en diferentes instantes del tiempo. Lo anterior implica que:
• Algunas causas de la autocorrelación:Muchas variables económicas y financieras están sujetas a ciclos económicos, que explican tendencias hacia arriba o hacia abajo que, muchas veces, inducen autocorrelación (Series de Tiempo)Exclusión de variables. Forma funcional incorrectaEstimación de parámetros a partir de las primeras diferenciasInclusión, como variable (s) independiente (s), de observaciones rezagadas de la variable dependiente
• Las estimaciones de los parámetros a partir de del método de MCO siguen siendo insesgadas, al igual que en el caso de la heteroscedasticidad, pero no son de mínima varianza. Sin pérdida de generalidad, consideremos una estructura autorregresiva de orden 1 para tratar de representar la forma de la asociación o dependencia. En esta estructura cumple con todas las condiciones estadísticas impuestas en el modelo clásico de regresión.
• Métodos Formales:Prueba de las Corridas: n es el número total de residuales; n1 es el número de residuales positivos; n2 es el número de residuales negativos; k corresponde al número de corridas. Es posible demostrar que:
• Si la hipótesis de la aleatoriedad se cumple entonces k, el número de corridas observadas en un problema, debe estar contenida en el siguiente intervalo:
• Lo anterior significa que la hipótesis sobre la aleatoriedad no se rechaza con una confianza del 95% si el valor observado de k estácontenido en el intervalo anterior.
• Prueba de Breusch-Godfrey: Esta prueba es más general que la de DW ya que permite determinar si hay correlaciones de orden mayor.
• Empíricamente: 1) Estimar el modelo de regresión usando MCO. 2) Estimar el modelo de contra todas las variables explicatorias y todos los residuales rezagados, dependiendo del orden de la estructura autorregresiva (p)
1 1 2 2 3 3t t t t p t p tε ρ ε ρ ε ρ ε ρ ε ν− − − −= + + + + +K
• Cuando la estructura de la autocorrelación se conoce y se asume de orden 1, se debe transformar el modelo original de modo que se tome en cuenta la estructura asumida. Hecho lo anterior, se debe emplear el método de MCG para hacer la estimación de los parámetros.
• Cuando se desconoce: Uno de los métodos que con más frecuencia se utiliza para estimar es el método iterativo de Cochrane-Orcutt.
• Una prueba alternativa, para estructuras autorregresivas de orden 1, es la de Cochrane-Orcutt, que consiste en estimar el modelousando MCO. Si asumimos una estructura AR(1):
la intención es estimar al coeficiente de correlación a través de y usar esta primera aproximación para estimar al modelo transformado en función de la estructura AR(1). Este proceso se lleva a cabo de manera iterativa hasta cumplir con algún criterio de terminación.