Top Banner
Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal pag 3. Prohibida su reproducción ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0. ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones puntuales de los parámetros de la población. Utilizando las propiedades de las distribuciones muestrales, es posible construir un intervalo que contiene el valor exacto del parámetro, un cierto porcentaje del total de las veces que se realicen estas construcciones. Procediendo de esta forma, también se obtiene una medida probabilística del riesgo de decidir que el parámetro se encuentra en tal intervalo. En una estimación puntual, el parámetro de interés se estima por medio de un estadístico que reúne ciertas bondades (insesgamiento, eficiencia, consistencia).
28

Estimación de Intervalos de Confianza

Mar 04, 2023

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 3. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

ESTIMACION DE INTERVALOS DE CONFIANZA Una muestra permite realizar estimaciones

puntuales de los parámetros de la población.

Utilizando las propiedades de las distribuciones

muestrales, es posible construir un intervalo que

contiene el valor exacto del parámetro, un

cierto porcentaje del total de las veces que se

realicen estas construcciones. Procediendo de

esta forma, también se obtiene una medida

probabilística del riesgo de decidir que el

parámetro sí se encuentra en tal intervalo.

En una estimación puntual, el parámetro de interés se estima por medio de un estadístico que reúne ciertas bondades (insesgamiento, eficiencia, consistencia).

Page 2: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 4. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Ejemplos 1. La media x de una muestra entrega una

estimación puntual de la media poblacional µ. 2. La proporción p de una muestra es una

estimación puntual de la proporción p. Un intervalo de confianza para un parámetro, establece un rango en el cual se encuentra el parámetro de interés. Los extremos (límites) del intervalo se obtienen seleccionando, en primer lugar, un nivel de confianza.

Nivel de Confianza El nivel de confianza es la probabilidad deseada para acertar en nuestras decisiones; usualmente, 90%, 95%, o 99%.

Page 3: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 5. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Lo usual es que el intervalo de confianza se construya en torno a una estimación puntual. Por ejemplo, si n es suficientemente grande

(n ≥ 30), los intervalos de confianza para µ toman la forma

RADIO±x

RADIO−x x RADIO+x

444444444 3444444444 21

El RADIO que se utiliza se calcular desde Excel, con la función

DECISION: En este intervalo se

encuentra µ.

Page 4: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 6. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

INTERVALO.CONFIANZA(alfa;desv_estandar;tamaño), según sea el nivel de confianza elegido y los datos maestrales obtenidos. “Alfa” corresponde a 1-nivel de confianza. Por ejemplo, para un 95% de confianza, alfa=5%. El valor para “desv_estandar” debe ser la desviación estándar de la muestra. “Tamaño” se refiere al tamaño de la muestra tomada, es decir n. Otra forma en que se puede calcular, si no se tiene Excel a mano, es calculando el intervalo:

nz

σ±x

Donde σ puede estimarse por su valor muestral, y z se encuentra en la siguiente tabla:

Page 5: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 7. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Nivel de confianza Calificación z

0,90 1,645

0,95 1,96

0,98 2,33

0,99 2,575

Así, por ejemplo, para construir un intervalo

para la media µ, con un nivel de confianza del 90%, determinamos z .

De la tabla,

z = 1,645. El intervalo es

xσ1,645x ± .

1 2 4 4 4 3 4 4 4

La media µ se

encuentra en este intervalo.

Estimación puntual

Page 6: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 8. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

PROCEDIMIENTO DE CALCULO DE UN IC PARA LA MEDIA USANDO EXCEL PARA:

• σ CONOCIDO O • σ DESCONOCIDO PERO n ≥ 30.

1.- Utilice una muestra aleatoria simple de tamaño n para determinar una estimación puntual de la media.

Sea x esta estimación puntual.

2.- Seleccione el nivel de confianza a utilizar.

3.- Calcule el nivel de significancia de la estimación: alfa=1-nivel de confianza.

4.- Calcule el radio del intervalo utilizando la función de Excel:

radio= INTERVALO.CONFIANZA(α;desv_estándar; n)

Page 7: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 9. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

α=1-nivel de confianza

Desviación estándar es σ , la varianza conocida de la población, o s , su estimación muestral,

cualquiera de las dos. NO DIVIDIR s POR n .

5.- El Intervalo de confianza requerido es:

radiox ±

Page 8: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 10. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Procedimiento de construcción de un intervalo de confianza para la media de una población sin Excel para:

• σ CONOCIDO O • σ DESCONOCIDO PERO n ≥ 30..

1. Utilice una muestra aleatoria simple de

tamaño n para determinar una estimación puntual de la media.

Sea x esta estimación puntual.

2. Seleccione el nivel de confianza a utilizar.

3. Determine el valor z que corresponde a este nivel de la tabla dada.

4. El intervalo se obtiene calculando

xσzx ± .

1 2 3

nσσ

x=

Page 9: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 11. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Ejemplo En una muestra aleatoria de 30 viajes en bus entre la ciudad A y la ciudad B, se obtuvo un tiempo promedio de viaje de 105 minutos. La desviación estándar de la población se ha estimado en 8 minutos. Obtener un intervalo de confianza para el verdadero tiempo promedio de viaje. Utilice un nivel de confianza del 95%.

1. 105x =

2. Nivel de confianza = 95%

3. z = 1,96 (obtenido de tabla)

4. 46,130

8xσ == . En consecuencia, el

intervalo buscado es:

105 ± 1,96 * 1,46 = 105 ± 2,86.

Page 10: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 12. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Podemos asegurar, con un nivel de confianza del 95%, que un viaje promedio toma entre 102,14 y 107,86 minutos. Interpretación del Nivel de Confianza

La probabilidad correspondiente al nivel de confianza, debe entenderse referida a la construcción reiterada de intervalos de confianza.

Por ejemplo, si utilizamos un nivel de confianza de un 90%, la interpretación apropiada de esta probabilidad es que de 100 intervalos construidos, aproximadamente 90 de ellos contendrán a la media poblacional. (Una explicación teórica de esta interpretación se encuentra en el Apéndice 1.)

Page 11: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 13. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

En el ejemplo siguiente, se ha extraído 100 muestras aleatorias simples de tamaño 30, de una población que consiste de los números enteros de 0 a 50, distribuidos uniformemente. A partir de cada una de estas muestras, se ha

calculado 100 estimaciones puntuales de µ

(recordar que µ = 25). Luego, utilizando estas estimaciones puntuales, se ha construido 100

intervalos de confianza para la media µ, con un nivel de confianza de un 90%.

Se esperaría que la media µ esté contenida en aproximadamente 90 de estos 100 intervalos.

Page 12: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 14. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

12 de las 100 estimaciones puntuales para la media µ

Media 27,8 24,9 23,8 27,1 24,7 29,9 23,2 25,1 27,4 28,5 26,7 31,2

12 de los 100 intervalos de confianza para la media µ

inf. 23,4 20,5 19,4 22,7 20,3 25,5 18,8 20,7 23 24,1 22,3 26,8

sup. 32,2 29,3 28,2 31,5 29,1 34,3 27,6 29,5 31,8 32,9 31,1 35,6

µ 25 25 25 25 25 25 25 25 25 25 25 25

1 1 1 1 1 0 1 1 1 1 1 0

Los 100 intervalos de confianza para la media µ

Porcentaje de intervalos que contienen a la media µ 0,91

1: µ está en el intervalo

0: µ no está en el intervalo

Page 13: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 15. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Observaciones 1. Si σ no se conoce y el tamaño de la muestra

es 30 ó más, se puede estimar σ por medio de s1.

2. Si σ no se conoce y el tamaño n de la muestra es menor que 30, siempre que la distribución de la población pueda suponerse

normal, podemos hacer uso de la distribución t para encontrar un intervalo de confianza (estimado) para la media poblacional. La distribución t es una familia de distribuciones. Para decidir cuál de estas distribuciones es la adecuada, se debe especificar el número de grados de libertad (gl) que corresponde utilizar. Hay una distribución t para cada posible número de grados de libertad. En este caso, se debe tomar gl = n – 1.

1 En este caso, se habla de “intervalo de confianza estimado”.

Page 14: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 16. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

3. Si σ es conocida y la distribución de la población es normal, entonces lo apropiado es utilizar la distribución normal estandarizada, cualesquiera sea el tamaño n de la muestra. 4. Si el tamaño n de la muestra es menor que 30 y la distribución de la población no puede suponerse normal, otros métodos deberían usarse.

Page 15: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 17. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

PROCEDIMIENTO DE CÁLCULO DE UN IC PARA LA MEDIA USANDO EXCEL PARA:

• σ DESCONOCIDO y n < 30. 1.- Utilice una muestra aleatoria simple de tamaño n para determinar una estimación puntual de la media.

Sea x esta estimación puntual.

2.- Seleccione el nivel de confianza a utilizar.

3.- Calcule el nivel de significancia de la estimación:

α = 1 - nivel de confianza.

4.- Calcule tα Excel usando la función Excel DISTR.T.INV. tα = DISTR.T.INV(α;g.l).

Page 16: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 18. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

g.l. son los grados de libertad, es decir el tamaño de la muestra menos 1. g.l. = n-1 .

4.- El intervalo de confianza estará dado por:

n

sx αt±

Page 17: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 19. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Ejemplo Se sabe que el rendimiento promedio de los fondos de inversión (con capital mínimo de 100 millones) fue de 13,42% durante el año 1989. Un inversionista desea comparar esta cifra con el rendimiento promedio de similares fondos de inversión disponibles en la actualidad. Se selecciona una muestra de 25 fondos de inversión y se calcula la media y la desviación estándar de sus rendimientos. Los valores obtenidos fueron 9,43% y 2,79%, respectivamente. Debido al tamaño de la muestra, suponemos que la distribución de los rendimientos de los fondos de inversión considerados, es normal.

Page 18: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 20. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

1. x = 9,43 2. Nivel de confianza = 90%, alfa=10%. 3. Para gl = 24, se tiene, de excel, que t = 1,711

4. 0,55825

2,79

n

sσ̂

x=== .

En consecuencia, el intervalo buscado es:

9,43 ± 1,71 * 0,558 = 9,43 ± 0,95.

Es decir, de 8,48% a 10,38 % Podemos asegurar, con un nivel de confianza del 90%, que el rendimiento promedio de los fondos actuales es más bajo que el correspondiente al año 1989.

Page 19: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 21. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Estimaciones de intervalos de otros parámetros

poblacionales siguen el mismo patrón.

Procedimiento para estimar un intervalo de confianza para la proporción de una población.

1. Utilice una muestra aleatoria simple de tamaño n para encontrar una estimación puntual de la proporción.

Sea p esta estimación puntual.

2. Seleccione el nivel de confianza de la estimación.

3. Determine el RADIO (o el valor de z que corresponde a este nivel.)

4. El intervalo de confianza se obtiene calculando RADIO±p , calculando RADIO

en Excel con la función INTERVALO.CONFIANZA, con

)1(_ ppestdesv −=

Page 20: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 22. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

5.Si no se cuenta con excel,

el intervalo de confianza se obtiene

calculando pσ̂zp ± .

1 2 3

Ejemplo Radio Castle prueba una muestra de 200 transistores y encuentra que 25 son defectuosos. Estime un intervalo de confianza para la proporción p de transistores defectuosos. (Utilice un nivel de confianza del 95%.)

1. p = 20025 = 0,125

2. Nivel de confianza = 95%, luego ALFA=5%.

n

)p-1p

pσ̂

(=

Como la proporción p es desconocida, el error estándar se calcula estimando p por medio de p .

Page 21: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 23. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

3. z = 1,96 (obtenido de tabla)

4. pσ̂ = n

)p–(1p = 200

0,875*0,125 = 0,0234.

En consecuencia, el intervalo buscado es:

0,125 ± 1,96 * 0,0234 = 0,125 ± 0,0459

Es decir, de 0,0791 a 0,171. Para un nivel de confianza dado, si el tamaño

de la muestra aumenta, entonces el error

estándar disminuye y el intervalo de la

estimación necesariamente es más pequeño.

Así se puede determinar el tamaño de muestra

apropiado para que la diferencia entre el

estadístico y el parámetro no exceda de un

cierto número dado.

En un intervalo de confianza, se denomina error

tolerable máximo (o margen de error) a la máxima diferencia que podría producirse entre

Page 22: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 24. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

el estadístico y el parámetro; dado un cierto nivel de confianza. E

6 7 4 4 4 4 8 4 4 4 4

x – zσ

x x

x +zσ

x

E = error tolerable máximo A continuación, calculemos el tamaño n de la muestra, dado un error tolerable máximo E. En el caso de un intervalo de confianza para la media, sabemos que

E = z σx

=

n,

Resolviendo para n, obtenemos:

n =

z2σ2

E2.

Page 23: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 25. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

En el caso de un intervalo de confianza para la proporción, se obtiene

n =

z2p1−−−−p

E2.

NOTA: En ambos casos, el valor de z es el correspondiente al nivel de confianza elegido. Ejemplo Don Stuart, cliente de la agencia de bienes raices Davis, desea saber el valor promedio por acre de terreno en el condado Bend. Don requiere que la estimación no difiera en más de $2.000 del valor correcto, con un nivel de confianza del 99%. Datos anteriores hacen pensar que la desviación estándar es de $8.000. ¿Qué tamaño de muestra debe utilizar Don? E = 2.000 z = 2,575

Page 24: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 26. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

σ = 8.000

n =

2,5752 8.0002

2.0002= 106,1

El tamaño de la muestra para la estimación solicitada es 107. Observación Las fórmulas para el tamaño de muestra

requieren conocer σ y p, respectivamente. En el primer caso, una apreciación razonable del rango, permite obtener una estimación razonable

de σ:

Utilice como estimación de σ, la sexta parte del rango estimado para la variable.

Page 25: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 27. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

En el segundo caso:

Tome p = 0,5; lo que corresponde a elegir la peor de las situaciones.

Ejemplos 1. Calcule tamaño de muestra para estimar la compra promedio por individuo en un Mac Donald, si el nivel de confianza es de un 95%. 2. Se estima que la proporción de clientes que poseen la tarjeta de crédito de una cierta multitienda, no sobrepasa el cuarto de la población. ¿Qué tamaño de muestra se requiere si se desea estimar esta proporción con un error tolerable máximo igual a 0,03?

Page 26: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 28. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Apéndice 1 La proporción de intervalos

xzσx ± que

contienen a µ es igual al nivel de confianza

utilizado; es decir, es igual a ADNE(–z↔z). Distribución muestral de las medias

-4 -3 -2 -1 0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

X

Y

xxσzxµσz–x +<< si y sólo si

xxσzµxσz–µ +<<

44444 344444 21

x

zσ–µ

Distribución normal,

con media µ y desviación estándar

nx

σ =σ .

x

zσµ+ µ

x

zσx− x

zσx+ x

Nivel de Confianza

Esto ocurre con probabilidad igual al área achurada.

Page 27: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 29. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Apéndice 2 Un supuesto de los modelos estadísticos

utilizados, es que el muestreo se realiza con

reemplazo. Por otro lado, estos modelos pueden

aplicarse sin modificaciones a poblaciones

grandes que se muestrean sin reemplazo, ya que

el tamaño de la población garantiza

prácticamente los mismos resultados.

Si la población es pequeña y el muestreo se realiza sin reemplazo, los modelos vistos necesitan ser ajustados.

Regla Si el tamaño n de la muestra es mayor que el 5% del tamaño N de la población (y el muestreo se realiza sin reemplazo) los errores estándares se corrigen multiplicando por el llamado

=

N–nN–1

. factor de corrección de población finita

Page 28: Estimación de Intervalos de Confianza

Estimación de Intervalos de Confianza (2007) H. Hevia, M. E. Valenzuela y P. Carvajal

pag 30. Prohibida su reproducción

ADNE: area bajo normal estándar, donde la curva normal estándar es aquella que tiene desviación estandar 1 y media 0.

Ejemplo Supongamos que en el ejemplo de los fondos de inversión, la población consiste en 250 fondos de inversión disponibles; es decir, N = 250. Entonces, el factor de corrección de población finita es

f. c. p. f. = 95,0150252250

1NnN =

−−=

−−

En consecuencia, el intervalo buscado es:

9,43 ± 1,71 * 0,558 * 0,95 = 9,43 ± 0,91.

Es decir, de 8,52% a 10,34 %