1 ESTIMACIÓN TEMA 5: Estimación puntual I. Propiedades de los estimadores TEMA 6: Estimación puntual II. Métodos de estimación puntual TEMA 7: Estimación por intervalos CONTRASTES DE HIPÓTESIS TEMA 8: Contrastes paramétricos TEMA 9: Contrastes no paramétricos MODELOS DE REGRESIÓN TEMA 10: Introducción a la Econometría
26
Embed
ESTIMACIÓN - Albergue de alojamientos de la UVa · 2 TEMA 7: ESTIMACIÓN POR INTERVALOS 7.1. Concepto de intervalo de confianza 7.2. Métodos de construcción de intervalos ⇒ 7.2.1.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
ESTIMACIÓN
TEMA 5: Estimación puntual I. Propiedades de los estimadores
TEMA 6: Estimación puntual II. Métodos de estimación puntual
TEMA 7: Estimación por intervalos
CONTRASTES DE HIPÓTESIS
TEMA 8: Contrastes paramétricos
TEMA 9: Contrastes no paramétricos
MODELOS DE REGRESIÓN
TEMA 10: Introducción a la Econometría
2
TEMA 7: ESTIMACIÓN POR INTERVALOS
7.1. Concepto de intervalo de confianza
7.2. Métodos de construcción de intervalos ⇒ 7.2.1. Método del pivote 7.2.2. Intervalos aproximados para E(X)
7.3. I.C. en una población normal ⇒ 7.3.1. I.C. para µ con varianza conocida 7.3.2. I.C. para µ con varianza desconocida 7.3.3. I.C. para la varianza
7.4. I.C. en dos poblaciones normales
MUESTRAS INDEPENDIENTES: 7.4.1. I.C. para µ1-µ2 (σ1,σ2 conocidas) 7.4.2. I.C. para µ1-µ2 (σ1=σ2 desconocidas) 7.4.3. I.C. para µ1-µ2 (σ1≠σ2 desconocidas) 7.4.4. I.C. para cociente de varianzas
y luego despejar θ ⇒ p( 1ϑ̂ (X1,...,Xn;a) ≤ θ ≤ 2ϑ̂ (X1,...,Xn;b) )= 1-α
¿Cómo elegir a y b? Para que el intervalo sea de longitud mínima
Si distribución de T simétrica, dejando α/2 a ambos lados
10
1-α α/2α/2
Ejemplo: (X1,...,Xn) m.a.s. de una N(µ,σ), con σ conocido ⇒ PIVOTE:
n/Xσ
µ− → N(0,1)
-zα/2 0 zα/2
1-α = p(-zα/2≤ n/Xσ
µ− ≤zα/2)=p(X -zα/2 nσ ≤µ≤X +zα/2 n
σ )
⇒ Intervalo de Confianza 100(1-α)%: X± zα/2 nσ ⇒ Simétrico, longitud =2 zα/2 n
σ
L depende de: (1) α ⇒ (1-α)↑ ⇒ zα/2↑ ⇒ más longitud ⇒ menos precisión
(2) n : si n aumenta ⇒ disminuye L ⇒mayor precisión
(3) σ : si σ aumenta ⇒ aumenta L
11
1-α
7.2.2. Intervalos aproximados para la media
Sea (X1,...,Xn) m.a.s. de X con E(Xi)=µ y Var(Xi)=σ2
Teorema central del límite: ⇒ )1,0(N~n/
Xn ∞→σ
µ−
1-α ≅ p(-zα/2≤ n/Xσ
µ−≤zα/2)=p(X -zα/2 n
σ≤µ≤X +zα/2 n
σ )
-zα/2 0 zα/2
I.C. aproximado para E(X) = [X - zα/2 nσ , X + zα/2 n
σ ]
Mejor cuanto mayor n y más simétrica la distribución de X
NOTA: si σ desconocida ⇒ sustituir por σ̂ consistente ⇒otra fuente de “error”
I.C. aproximado = [X - zα/2 nσ̂ , X + zα/2 n
σ̂ ] ¡ más impreciso que el anterior!
12
7.3. INT. CONFIANZA EN UNA POBLACIÓN NORMAL
(X1,...,Xn) m.a.s. de una distribución N(µ,σ)
7.3.1. Intervalo de confianza para µ con σ conocida
PIVOTE (I.b): n/
Xσ
µ− → N(0,1)
[X - zα/2 nσ
, X + zα/2 nσ
] = (X ± zα/2 nσ )
Simétrico respecto a X con margen de error E=zα/2 nσ
Determinación del tamaño de la muestra ⇒ n = 2E
2α/2z 2σ
13
1-α α/2α/2
7.3.2. Intervalo de confianza para µ con σ desconocida
PIVOTE (I.c): n/
X
cSµ− → tn-1, con Sc = ∑
=−
−n 2
i1i
)( XX1n1
-tα/2 0 tα/2
1-α = p(-t α/2≤ n/XcS
µ−≤t α/2)=p(X -t α/2 n
cS≤µ≤X +t α/2 n
cS ) ⇒ X ± tα/2 ncS
Simétrico respecto a X con margen de error E= tα/2 ncS
Determinación del tamaño de la muestra n = 2
2α/2
E2cSt
14
Ejemplo: Peña (2001, p. 326)
El director de una empresa ha anunciado que el
año pasado los salarios crecieron un promedio del
3.5%. Un grupo de trabajadoras toma una muestra
de los incrementos salariales que han recibido 11
mujeres obteniendo los siguientes datos:
3%,3%,5%,1%,1%,2%,1%,1%,5%,2%,2%.
Intervalo de confianza para el aumento salarial
medio de las mujeres de esta empresa.
Datos: n=11; X =2,36; Sc = ∑ −=−
n2
i1i
)( XX1n
1 =1,5
(1-α)x100=90% ⇒ t α/2 = t10,0.95 =1,812
µ ∈ [2,36 ± 1,1211
1,5 ] = [2,36 ± 0.51] ⇒ [1.85; 2.87]
No incluye el valor 3,5% entre los “más” probables
(1-α)x100=95% ⇒ t α/2 = t10,0.975 =2,228
µ ∈ [2,36 ± 2,22811
1,5 ] = [2,36 ± 1.01] ⇒ [1.35; 3.37]
No incluye el valor 3,5% entre los “más” probables
15
1-α α/2α/2
7.3.4. Intervalo de confianza para la varianza σ2
PIVOTE (I.d): 2XS2
nσ → 2
1-nχ , con 2XS =
n
XXn
2i
1i)(∑ −
=
a b
p(a ≤ 2XS2
nσ ≤ b)= p( 2
XSbn ≤ σ2 ≤ 2
XSan
)= 1-α
16
1-α α/2α/2
7.4. INT. CONFIANZA DOS POBLACIONES NORMALES
MUESTRAS INDEPENDIENTES
X11,...,X1n1 m.a.s. de una X1 ~N(µ1,σ1) independientes X21,...,X2n2 m.a.s. de una X2 ~N(µ2,σ2) 7.4.1. Intervalo de confianza para µ1-µ2 (σ1,σ2 conocidas)
-zα/2 0 zα/2
)z
nn
)()XX(z(p122
2
22
1
21
2121αα ≤
σ+
σµ−µ−−
≤−=α− ⇒ (µ1-µ2)∈ ⎥⎦
⎤⎢⎣
⎡ σ+
σ±− α
2
22
1
2121
nnz)X 2X(
PIVOTE (II.a): )1,0(N
nn
)()XX(
2
22
1
21
2121 →σ
+σ
µ−µ−−
17
7.4.2. Intervalo de confianza para µ1-µ2 (σ1=σ2)
PIVOTE (II.b): 2nnt
nn2nn
SnSn)()XX(
21
21
222
211
2121
2111XX
−+→
+−+
+
µ−µ−−
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−++
±−∈µ−µ +α21 nn
112nn
SnSnt)XX()(
21
2X2
2X1
2/212121
7.4.3. Intervalo de confianza para µ1-µ2 (σ1≠σ2)
PIVOTE (II.c): υ→
+
µ−µ−−t
n
S
n
S)()XX(
2
22C
1
21C
2121 ~ N(0,1) si n1,n2 grandes
(µ1-µ2)∈ ⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
+±− α21221 n
Sn
St)XX(
2C
2C 21
18
RESUMEN: Intervalo de confianza para µ1-µ2 (MUESTRAS INDEPENDIENTES)
7.4.1. Con σ1,σ2 conocidas)
(µ1 - µ2) ∈⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡ σ+
σ±− α
2
22
1
21
nnz)XX 2/21(
7.4.2. Con σ1=σ2 desconocidas
⎥⎥⎦
⎤
⎢⎢⎣
⎡
−++
±−∈µ−µ +α21 nn
112nn
SnSnt)XX()(
21
2X2
2X1
2/212121
7.4.3. Con σ1≠σ2 desconocidas
(µ1 - µ2) ∈ ⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
+±− α21221 n
Sn
St)XX(
2C
2C 21
19
Ejemplo: (Newbold, 1998, pp. 263-264)
Para una muestra de 96 fumadores, el nº medio
de horas mensuales de absentismo laboral fue
de 2,15 con una desviación típica de 2,09 horas
al mes. En una muestra independiente de 206 no
fumadores resultó una media de 1,69 horas con
una desviación típica de 1,91 horas al mes.
I.C. al 99% para la diferencia de medias
Datos:
Fumadores: 1X =2.15, n1=96, S1=2.09, Sc1=2.101
No fumadores: 2X =1.69, n2=206, S2=1.91, Sc2=1.915
n1,n2 grandes ⇒ tυ~ N(0,1) ⇒ tα/2≅z0.005=2.575
VARIANZAS DISTINTAS:
⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
+±−20696
2,5751,69)(2,1522 1,9152,101 ⇒ [-0.19, 1.11]
VARIANZAS IGUALES:
⎥⎦
⎤⎢⎣
⎡−+
+±− + 20696
11220696
206x1.9196x2.092,5751.69)(2.1522
⇒ [-0.27, 0.99] ⇒ El valor µ1-µ2=0 ∈ intervalos
20
1-αα/2α/2
7.4.4. Intervalo de confianza para 22
21 σσ /
PIVOTE (II.d):
1n,1nFS
S212
1
22
22C
21C
−−→σ
σ
a b
⎟⎟⎠
⎞⎜⎜⎝
⎛≤
σσ
≤=⎟⎟⎠
⎞⎜⎜⎝
⎛≤
σσ
≤=α− 2C
2C
22
21
2C
2C
21
22
2C
2C
2
1
2
1
2
1
SS
a1
SS
b1pb
SS
ap1
21
DATOS PAREADOS
(X1,Y1)...(Xn,Yn) m.a.s. de Normal bidimensional ⎟⎠⎞⎜
⎝⎛
ii
YX →N2 ⎟
⎠
⎞⎜⎝
⎛⎟⎠⎞
⎜⎝⎛
σσρσσρσσ
⎟⎠⎞⎜
⎝⎛µµ
2221
2121
2
1
donde E(Xi)=µ1, E(Yi)=µ2, Var(Xi)= 21σ , Var(Yi)= 2
2σ
7.3.2.5. Intervalo de confianza para µ1-µ2
Diferencias ⇒ Di=Xi-Yi → N(µD,σD), con µD=µ1-µ2
Una sóla muestra D1,D2,...,Dn de una N(µD,σD)
⇒ Intervalo de Confianza para µD ⇒ PIVOTE (I.c): n/
D
D
D
Sµ− → tn-1
1-α = p(-t α/2≤n/
D
D
D
Sµ− ≤t α/2)=p(D∈D±t α/2 n
DS ), donde n
n
i1iD
D∑
= = y SD = 1n
n2
i1i
)DD(
−
∑ −=
22
Ejemplo: (Casas, 1996, pp. 248-249) Datos del consumo de gasolina por 1000 km de una muestra aleatoria de 9 cohes con dos carburantes X e Y. Suponiendo normalidad para los consumos, hallar intervalo de confianza al 99% para la diferencia de medias.
Coche Xi Yi Di= Xi-Yi 1 2 3 4 5 6 7 8 9
132 139 126 114 122 132 142 119 126
124 141 118 116 114 132 145 123 121
8 -2 8 -2 8 0 -3 -4 5
∑==
n
i1iDD
n1 =2; SD = ∑ −
=−
n2
i1i
)DD(1n
1 =5.17
(1-α)x100=99% ⇒ t n-1, α/2 = t8,0.005 =3.355
[2 - 3.355x9
5,17 , 2 + 3.355x9
5,17 ]=[-3.781, 7.781]
Al 95% ⇒ t α/2 = t8,0.075 =2.306
[2 – 2.306x9
5,17 , 2 + 2.306x9
5,17 ]=[-1.974, 5.974]
23
7.4. INTERVALOS DE CONFIANZA PARA PROPORCIONES 7.4.1. Intervalo de confianza (aproximado) para la proporción p
Sea X1,..., Xn m.a.s de una Bernoulli b(p) ⇒ Xi=⎩⎨⎧
−→→
pp1)fracaso(Aocurresi0
)éxito(Aocurresi1
p̂ =_X =
n
Xn
1i i∑= = proporción “muestral” de éxitos
Teorema Central límite: )1,0(N)1(
ˆn ~∞→−
−
npp
pp
Difícil despejar p: ⇒ Sustituimos por estimador p̂ =_X consistente
)1,0(~)ˆ1(ˆ
ˆN
npp
ppn ∞→−
−
1-α=⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜
⎝
⎛
≤−−
≤ α/2zα/2z-
npp
ppp)ˆ1(ˆ
ˆ = ⎟⎠
⎞⎜⎝
⎛ −+≤≤
−n
ppppn
pppp )ˆ1(ˆˆ)ˆ1(ˆˆ α/2α/2 zz- ⇒ n
ppp )ˆ1(ˆˆ −± α/2z
24
Determinación del tamaño de la muestra Determinar el tamaño muestral n para tener una precisión determinada
nppp )ˆ1(ˆˆ −
± α/2z
Es un intervalo de la forma p̂ ±E ⇒ centrado en p̂ y simétrico con un margen de error ±E:
E = npp )ˆ1(ˆ −
α/2z ⇒ n= 2
2α/2
Ez )X1(X −
El máximo de X (1-X ) es 1/4 que corresponde a p̂=1- p̂=0.5 (hipótesis más desfavorable de máxima indeterminación p=q=0.5)
⇒ n= 2
2α/2
Ez4
25
Ejemplo:
En un determinado país se celebrarán próximamente elecciones
generales y sólo se presentarán dos candidaturas A y B. Un mes antes
de las elecciones se ha realizado una encuesta de intención de voto a
100 individuos y se han obtenido los siguientes resultados: el 42%
prefiere al candidato A, el 50% prefiere a B y el 8% no contesta.
(a) Hallar un I.C: para la proporción de individuos que votarán A (95%).
(b) Si se hubieran hecho 4000 entrevistas y los % de resultados
hubieran sido los mismos, ¿cuál habría sido el I.C.?
(c) ¿Cuál debería ser el tamaño muestral necesario para poder estimar
con una precisión de ±1% y una fiabilidad del 95%?
26
7.4.2. Intervalo de confianza para la diferencia de proporciones
(X1,...,Xn1) m.a.s de b(p1)
(X1,...,Xn2) m.a.s de b(p2)
Teorema Central límite: 1p̂ ))1(,(N1
111~n n
ppp −∞→ ; 2p̂ ))1(,(N
2
222~n n
ppp −∞→
Independientes ⇓
21 ˆˆ pp − ))1()1(,(N~ 22
1
1121n 2n
ppn
ppp-p −+
−∞→
Difícil despejar p1-p2: ⇒ Sustituimos p1, p2 por estimadores consistentes