Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal pag 3. Prohibida su reproducción ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0. ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones puntuales de los parámetros de la población. Utilizando las propiedades de las distribuciones muestrales, es posible construir un intervalo que contiene el valor exacto del parámetro, un cierto porcentaje del total de las veces que se realicen estas construcciones. Procediendo de esta forma, también se obtiene una medida probabilística del riesgo de decidir que el parámetro sí se encuentra en tal intervalo. En una estimación puntual, el parámetro de interés se estima por medio de un estadístico que reúne ciertas bondades (insesgamiento, eficiencia, consistencia).
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 3. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones
puntuales de los parámetros de la población.
Utilizando las propiedades de las distribuciones
muestrales, es posible construir un intervalo que
contiene el valor exacto del parámetro, un
cierto porcentaje del total de las veces que se
realicen estas construcciones. Procediendo de
esta forma, también se obtiene una medida
probabilística del riesgo de decidir que el
parámetro sí se encuentra en tal intervalo.
En una estimación puntual, el parámetro de interés se estima por medio de un estadístico que reúne ciertas bondades (insesgamiento, eficiencia, consistencia).
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 4. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Ejemplos 1. La media x de una muestra entrega una
estimación puntual de la media poblacional µ. 2. La proporción p de una muestra es una
estimación puntual de la proporción p. Un intervalo de confianza para un parámetro, establece un rango en el cual se encuentra el parámetro de interés. Los extremos (límites) del intervalo se obtienen seleccionando, en primer lugar, un nivel de confianza.
Nivel de Confianza El nivel de confianza es la probabilidad deseada para acertar en nuestras decisiones; usualmente, 90%, 95%, o 99%.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 5. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Lo usual es que el intervalo de confianza se construya en torno a una estimación puntual. Por ejemplo, si n es suficientemente grande
(n ≥ 30), los intervalos de confianza para µ toman la forma
RADIO±x
RADIO−x x RADIO+x
444444444 3444444444 21
El RADIO que se utiliza se calcular desde Excel, con la función
DECISION: En este intervalo se
encuentra µ.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 6. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
INTERVALO.CONFIANZA(alfa;desv_estandar;tamaño), según sea el nivel de confianza elegido y los datos maestrales obtenidos. “Alfa” corresponde a 1-nivel de confianza. Por ejemplo, para un 95% de confianza, alfa=5%. El valor para “desv_estandar” debe ser la desviación estándar de la muestra. “Tamaño” se refiere al tamaño de la muestra tomada, es decir n. Otra forma en que se puede calcular, si no se tiene Excel a mano, es calculando el intervalo:
nz
σ±x
Donde σ puede estimarse por su valor muestral, y z se encuentra en la siguiente tabla:
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 7. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Nivel de confianza Calificación z
0,90 1,645
0,95 1,96
0,98 2,33
0,99 2,575
Así, por ejemplo, para construir un intervalo
para la media µ, con un nivel de confianza del 90%, determinamos z .
De la tabla,
z = 1,645. El intervalo es
xσ1,645x ± .
1 2 4 4 4 3 4 4 4
La media µ se
encuentra en este intervalo.
Estimación puntual
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 8. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
PROCEDIMIENTO DE CALCULO DE UN IC PARA LA MEDIA USANDO EXCEL PARA:
• σ CONOCIDO O • σ DESCONOCIDO PERO n ≥ 30.
1.- Utilice una muestra aleatoria simple de tamaño n para determinar una estimación puntual de la media.
Sea x esta estimación puntual.
2.- Seleccione el nivel de confianza a utilizar.
3.- Calcule el nivel de significancia de la estimación: alfa=1-nivel de confianza.
4.- Calcule el radio del intervalo utilizando la función de Excel:
radio= INTERVALO.CONFIANZA(α;desv_estándar; n)
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 9. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
α=1-nivel de confianza
Desviación estándar es σ , la varianza conocida de la población, o s , su estimación muestral,
cualquiera de las dos. NO DIVIDIR s POR n .
5.- El Intervalo de confianza requerido es:
radiox ±
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 10. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Procedimiento de construcción de un intervalo de confianza para la media de una población sin Excel para:
• σ CONOCIDO O • σ DESCONOCIDO PERO n ≥ 30..
1. Utilice una muestra aleatoria simple de
tamaño n para determinar una estimación puntual de la media.
Sea x esta estimación puntual.
2. Seleccione el nivel de confianza a utilizar.
3. Determine el valor z que corresponde a este nivel de la tabla dada.
4. El intervalo se obtiene calculando
xσzx ± .
1 2 3
nσσ
x=
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 11. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Ejemplo En una muestra aleatoria de 30 viajes en bus entre la ciudad A y la ciudad B, se obtuvo un tiempo promedio de viaje de 105 minutos. La desviación estándar de la población se ha estimado en 8 minutos. Obtener un intervalo de confianza para el verdadero tiempo promedio de viaje. Utilice un nivel de confianza del 95%.
1. 105x =
2. Nivel de confianza = 95%
3. z = 1,96 (obtenido de tabla)
4. 46,130
8xσ == . En consecuencia, el
intervalo buscado es:
105 ± 1,96 * 1,46 = 105 ± 2,86.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 12. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Podemos asegurar, con un nivel de confianza del 95%, que un viaje promedio toma entre 102,14 y 107,86 minutos. Interpretación del Nivel de Confianza
La probabilidad correspondiente al nivel de confianza, debe entenderse referida a la construcción reiterada de intervalos de confianza.
Por ejemplo, si utilizamos un nivel de confianza de un 90%, la interpretación apropiada de esta probabilidad es que de 100 intervalos construidos, aproximadamente 90 de ellos contendrán a la media poblacional. (Una explicación teórica de esta interpretación se encuentra en el Apéndice 1.)
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 13. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
En el ejemplo siguiente, se ha extraído 100 muestras aleatorias simples de tamaño 30, de una población que consiste de los números enteros de 0 a 50, distribuidos uniformemente. A partir de cada una de estas muestras, se ha
calculado 100 estimaciones puntuales de µ
(recordar que µ = 25). Luego, utilizando estas estimaciones puntuales, se ha construido 100
intervalos de confianza para la media µ, con un nivel de confianza de un 90%.
Se esperaría que la media µ esté contenida en aproximadamente 90 de estos 100 intervalos.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 14. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
12 de las 100 estimaciones puntuales para la media µ
Porcentaje de intervalos que contienen a la media µ 0,91
1: µ está en el intervalo
0: µ no está en el intervalo
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 15. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Observaciones 1. Si σ no se conoce y el tamaño de la muestra
es 30 ó más, se puede estimar σ por medio de s1.
2. Si σ no se conoce y el tamaño n de la muestra es menor que 30, siempre que la distribución de la población pueda suponerse
normal, podemos hacer uso de la distribución t para encontrar un intervalo de confianza (estimado) para la media poblacional. La distribución t es una familia de distribuciones. Para decidir cuál de estas distribuciones es la adecuada, se debe especificar el número de grados de libertad (gl) que corresponde utilizar. Hay una distribución t para cada posible número de grados de libertad. En este caso, se debe tomar gl = n – 1.
1 En este caso, se habla de “intervalo de confianza estimado”.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 16. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
3. Si σ es conocida y la distribución de la población es normal, entonces lo apropiado es utilizar la distribución normal estandarizada, cualesquiera sea el tamaño n de la muestra. 4. Si el tamaño n de la muestra es menor que 30 y la distribución de la población no puede suponerse normal, otros métodos deberían usarse.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 17. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
PROCEDIMIENTO DE CÁLCULO DE UN IC PARA LA MEDIA USANDO EXCEL PARA:
• σ DESCONOCIDO y n < 30. 1.- Utilice una muestra aleatoria simple de tamaño n para determinar una estimación puntual de la media.
Sea x esta estimación puntual.
2.- Seleccione el nivel de confianza a utilizar.
3.- Calcule el nivel de significancia de la estimación:
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 18. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
g.l. son los grados de libertad, es decir el tamaño de la muestra menos 1. g.l. = n-1 .
4.- El intervalo de confianza estará dado por:
n
sx αt±
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 19. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Ejemplo Se sabe que el rendimiento promedio de los fondos de inversión (con capital mínimo de 100 millones) fue de 13,42% durante el año 1989. Un inversionista desea comparar esta cifra con el rendimiento promedio de similares fondos de inversión disponibles en la actualidad. Se selecciona una muestra de 25 fondos de inversión y se calcula la media y la desviación estándar de sus rendimientos. Los valores obtenidos fueron 9,43% y 2,79%, respectivamente. Debido al tamaño de la muestra, suponemos que la distribución de los rendimientos de los fondos de inversión considerados, es normal.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 20. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
1. x = 9,43 2. Nivel de confianza = 90%, alfa=10%. 3. Para gl = 24, se tiene, de excel, que t = 1,711
4. 0,55825
2,79
n
sσ̂
x=== .
En consecuencia, el intervalo buscado es:
9,43 ± 1,71 * 0,558 = 9,43 ± 0,95.
Es decir, de 8,48% a 10,38 % Podemos asegurar, con un nivel de confianza del 90%, que el rendimiento promedio de los fondos actuales es más bajo que el correspondiente al año 1989.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 21. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Estimaciones de intervalos de otros parámetros
poblacionales siguen el mismo patrón.
Procedimiento para estimar un intervalo de confianza para la proporción de una población.
1. Utilice una muestra aleatoria simple de tamaño n para encontrar una estimación puntual de la proporción.
Sea p esta estimación puntual.
2. Seleccione el nivel de confianza de la estimación.
3. Determine el RADIO (o el valor de z que corresponde a este nivel.)
4. El intervalo de confianza se obtiene calculando RADIO±p , calculando RADIO
en Excel con la función INTERVALO.CONFIANZA, con
)1(_ ppestdesv −=
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 22. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
5.Si no se cuenta con excel,
el intervalo de confianza se obtiene
calculando pσ̂zp ± .
1 2 3
Ejemplo Radio Castle prueba una muestra de 200 transistores y encuentra que 25 son defectuosos. Estime un intervalo de confianza para la proporción p de transistores defectuosos. (Utilice un nivel de confianza del 95%.)
1. p = 20025 = 0,125
2. Nivel de confianza = 95%, luego ALFA=5%.
n
)p-1p
pσ̂
(=
Como la proporción p es desconocida, el error estándar se calcula estimando p por medio de p .
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 23. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
3. z = 1,96 (obtenido de tabla)
4. pσ̂ = n
)p–(1p = 200
0,875*0,125 = 0,0234.
En consecuencia, el intervalo buscado es:
0,125 ± 1,96 * 0,0234 = 0,125 ± 0,0459
Es decir, de 0,0791 a 0,171. Para un nivel de confianza dado, si el tamaño
de la muestra aumenta, entonces el error
estándar disminuye y el intervalo de la
estimación necesariamente es más pequeño.
Así se puede determinar el tamaño de muestra
apropiado para que la diferencia entre el
estadístico y el parámetro no exceda de un
cierto número dado.
En un intervalo de confianza, se denomina error
tolerable máximo (o margen de error) a la máxima diferencia que podría producirse entre
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 24. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
el estadístico y el parámetro; dado un cierto nivel de confianza. E
6 7 4 4 4 4 8 4 4 4 4
x – zσ
x x
x +zσ
x
E = error tolerable máximo A continuación, calculemos el tamaño n de la muestra, dado un error tolerable máximo E. En el caso de un intervalo de confianza para la media, sabemos que
E = z σx
=
zσ
n,
Resolviendo para n, obtenemos:
n =
z2σ2
E2.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 25. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
En el caso de un intervalo de confianza para la proporción, se obtiene
n =
z2p1−−−−p
E2.
NOTA: En ambos casos, el valor de z es el correspondiente al nivel de confianza elegido. Ejemplo Don Stuart, cliente de la agencia de bienes raices Davis, desea saber el valor promedio por acre de terreno en el condado Bend. Don requiere que la estimación no difiera en más de $2.000 del valor correcto, con un nivel de confianza del 99%. Datos anteriores hacen pensar que la desviación estándar es de $8.000. ¿Qué tamaño de muestra debe utilizar Don? E = 2.000 z = 2,575
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 26. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
σ = 8.000
n =
2,5752 8.0002
2.0002= 106,1
El tamaño de la muestra para la estimación solicitada es 107. Observación Las fórmulas para el tamaño de muestra
requieren conocer σ y p, respectivamente. En el primer caso, una apreciación razonable del rango, permite obtener una estimación razonable
de σ:
Utilice como estimación de σ, la sexta parte del rango estimado para la variable.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 27. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
En el segundo caso:
Tome p = 0,5; lo que corresponde a elegir la peor de las situaciones.
Ejemplos 1. Calcule tamaño de muestra para estimar la compra promedio por individuo en un Mac Donald, si el nivel de confianza es de un 95%. 2. Se estima que la proporción de clientes que poseen la tarjeta de crédito de una cierta multitienda, no sobrepasa el cuarto de la población. ¿Qué tamaño de muestra se requiere si se desea estimar esta proporción con un error tolerable máximo igual a 0,03?
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 28. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Apéndice 1 La proporción de intervalos
xzσx ± que
contienen a µ es igual al nivel de confianza
utilizado; es decir, es igual a ADNE(–z↔z). Distribución muestral de las medias
-4 -3 -2 -1 0 1 2 3 4
0.0
0.1
0.2
0.3
0.4
X
Y
xxσzxµσz–x +<< si y sólo si
xxσzµxσz–µ +<<
44444 344444 21
x
zσ–µ
Distribución normal,
con media µ y desviación estándar
nx
σ =σ .
x
zσµ+ µ
x
zσx− x
zσx+ x
Nivel de Confianza
Esto ocurre con probabilidad igual al área achurada.
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 29. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Apéndice 2 Un supuesto de los modelos estadísticos
utilizados, es que el muestreo se realiza con
reemplazo. Por otro lado, estos modelos pueden
aplicarse sin modificaciones a poblaciones
grandes que se muestrean sin reemplazo, ya que
el tamaño de la población garantiza
prácticamente los mismos resultados.
Si la población es pequeña y el muestreo se realiza sin reemplazo, los modelos vistos necesitan ser ajustados.
Regla Si el tamaño n de la muestra es mayor que el 5% del tamaño N de la población (y el muestreo se realiza sin reemplazo) los errores estándares se corrigen multiplicando por el llamado
=
N–nN–1
. factor de corrección de población finita
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal
pag 30. Prohibida su reproducción
ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.
Ejemplo Supongamos que en el ejemplo de los fondos de inversión, la población consiste en 250 fondos de inversión disponibles; es decir, N = 250. Entonces, el factor de corrección de población finita es