-
InfernciaEstatstica
Estimao IntervalarMdia e Proporo
Estimao Pontual x Estimao Intervalar
Exemplo Inicial:
Um estudo pretende estimar o valor de , a rendamdia familiar dos
alunos da UFMG.
Em uma amostra de 40 alunos da universidade, encontrou-se uma
renda familiar mdia 1600 reais (estimativa pontual), com
desvio-padro s=323 reais.
x =
J sabemos que os valores de variam de amostra paraamostra e se
distribuem em torno do valor de .
x
-
Estimao Pontual x Estimao Intervalar
Assim, divulgar somente um nico valor como estimativade (estimao
pontual) deixa de lado toda a incerteza envolvida no processo de
estimao de um parmetro.
Estimativa Intervalar = Estimativa pontual Erro de estimao
Para nos lembrar da incerteza envolvida no resultadoamostral,
vamos associar um erro de estimao estimativa pontual:
Estimao Pontual x Estimao Intervalar
Exemplo Inicial:
A estimativa pontual para a renda familiar mdia do aluno da UFMG
1600 reais.
O erro de estimao foi calculado em 100 reais.
Assim, a estimativa intervalar para a renda familiar mdia do
aluno da UFMG de
[1600 100] = [1500 ; 1700] reais.
-
Nvel de Confiana de umaEstimativa Intervalar
Toda estimativa intervalar tem associada a ela um nvel de
confiana, geralmente expresso em porcentagem.
Ex: nvel de confiana de 95%
Ento, falamos em Intervalo de Confiana.
Ex: o intervalo de 95% de confiana para a renda familiar mdia do
aluno da UFMG vai de R$1500,00 a R$1700,00.
Como calcular um Intervalo de Confiana ?
Intervalo de Confiana = Estimativa pontual Erro de estimao
O erro de estimao ocorre porque uma varivel aleatria.
X
Assim, para calcular o erro de estimao, vamos precisar da
distribuio de probabilidades de .X
-
Relembrando: Teorema Central do Limite
Seja uma amostra aleatria , de uma varivel aleatria com mdia e
desvio padro .
1 2, ,..., nx x x
X
(0,1)/ ~
nXZ Nn
=
Intervalo de 95% de confiana para a mdia populacional ()Queremos
encontrar um intervalo (L1, L2) tal que com probabilidade 95% a
mdia da populao esteja dentro dele, isto
[[[[ ]]]] 95,02L1LP ====
-
+
n1,96X,
n1,96-X O intervalo
chamado de intervalo de 95% de confiana para a mdia
populacional.
Exemplo: O peso mdio ao nascer de crianas nascidas de mes de
certo grupo etrio tem mdia desconhecida e desvio padro conhecido
igual a 0,5kg. Uma amostra de 30 crianas desta populao foi
observada encontrando-se uma mdia amostral igual a 2,5 kg.
Obtenha um intervalo de 95% de confiana para o peso mdio ao
nascer dos filhos das mulheres deste grupo etrio.
X peso ao nascer peso mdio ao nascer = 0,5 Kg desvio padro do
peso ao nascer
2,5x 30, n :amostra da Dados ========
]68,2;32,2[305,01,965,2;
305,01,96-2,5 =
+
O intervalo de 95% de confiana para dado por
Interpretao: Com 95% de confiana o peso mdio ao nascer das
crianas nascidas de mes do grupo etrio de interesse estentre 2,32
kg e 2,68 kg.
-
Porque usamos o termo confiana ao invs de probabilidade?
95,0n
1,96Xn
1,96-XP =
+
-
Como podemos entender o termo confiana?
Suponha que muitas amostras de mesmo tamanho n sejam retiradas
da populao de interesse e que a partir de cada uma delas seja
obtido um intervalo de 95% de confiana para o parmetro de
Interesse. Qual a porcentagem esperada de intervalos que incluiro o
valor do parmetro?
No grfico seguinte so apresentados 200 intervalos de 95% de
confiana obtidos a partir de amostras de tamanho 50 de uma populao
Normal com mdia =100 e desvio padro = 10.
Observe que alguns intervalos (com centro fora delimitado pelas
retas inferior e superior) no incluem a media populacional
=100.
Esperaramos de 95% dos intervalos construdos o contivessem.
0 50 100 150 200
9496
9810
010
210
410
6
amostra
Inte
rval
o de
co
nfin
aa
-
Outra maneira de interpretar o intervalo de confiana
erro de margemou estimao de erro chamado -X
n1,96-X
n1,96X
n1,96-X
1) . Toda a
variao de Z resulta da variao da mdia amostral. Quando
substitumos por S, outra quantidade amostral, introduzimos uma nova
fonte de variao.
4) Quanto menor for o tamanho da amostra, maior deve ser a
variao introduzida em T como resultado da variao de S. Quando n
cresce, S aproximar-se de .
5) Temos ento uma distribuio diferente para tamanho de
amostra.
Resultado Importante:
Se X1, X2, . . . Xn uma amostra aleatria de uma
populao Normal com mdia e desvio padro , a varivel tem
distribuio t de Student com
(n-1) graus de liberdade./
XTs n
=
Mas, qual a distribuio de T?
Obs: O termo graus de liberdade para identificar a distribuio,
pois para cada tamanho de amostra temos uma distribuio
diferente.
-
Distribuio t-Student
Normal (0;1)
t-Student com 3 graus de liberdade
Distribuio t-Student
William Gosset(Student)
A distribuio t-Student foi propostapor W. Gosset, que usava o
pseudnimo de Student, paratrabalhar com pequenas amostras.
A distribuio t-Student tem o formatoparecido com a da distribuio
Normal Padro e tambm centrada no valor zero.
A distribuio t-Student depende de um nico parmetro, chamado grau
de liberdade (g.l.)
-
g.l.=1g.l.=2g.l.=3g.l.=4g.l.=5g.l.=6g.l.=7g.l.=8g.l.=9g.l.=10g.l.=15g.l.=20g.l.=25g.l.=30
A distribuio t-Student aproxima-se da Normal Padro medida que os
graus de liberdade crescem.
Como calcular probabilidades com a distribuio t-Student ?
Ao contrrio da tabela Normal, a tabela t-Student
fornecepercentis.
A distribuio t-Student simtrica em torno do valor 0. Assim,
somente os percentis positivos so tabelados.
. .;g lt . .;(1 ) . .;g l g lt t =
-
Tabela tDistribuio T de Student )( tTP >=
Graus de liberdade .25 .20 .15 .10 .05 .025 .02 .01 .005
1 1.000 1.376 1.963 3.078 6.314 12.71 15.89 31.82 63.66 2 .816
1.061 1.386 1.886 2.920 4.303 4.849 6.965 9.925 3 .765 .978 1.250
1.638 2.353 3.182 3.482 4.541 5.841 4 .741 .941 1.190 1.533 2.132
2.776 2.999 3.747 4.604 5 .727 .920 1.156 1.476 2.015 2.571 2.757
3.365 4.032 6 .718 .906 1.134 1.440 1.943 2.447 2.612 3.143 3.707 7
.711 .896 1.119 1.415 1.895 2.365 2.517 2.998 3.499 8 .706 .889
1.108 1.397 1.860 2.306 2.449 2.896 3.355 9 .703 .883 1.100 1.383
1.833 2.262 2.398 2.821 3.250 10 .700 .879 1.093 1.372 1.812 2.228
2.359 2.764 3.169 11 .697 .876 1.088 1.363 1.796 2.201 2.328 2.718
3.106 12 .695 .873 1.083 1.356 1.782 2.179 2.303 2.681 3.055 13
.694 .870 1.079 1.350 1.771 2.160 2.282 2.650 3.012 14 .692 .868
1.076 1.345 1.761 2.145 2.264 2.624 2.977 15 .691 .866 1.074 1.341
1.753 2.131 2.249 2.602 2.947 16 .690 .865 1.071 1.337 1.746 2.120
2.235 2.583 2.921 17 .689 .863 1.069 1.333 1.740 2.110 2.224 2.567
2.898
Distribuio T de Student )( tTP >=
Graus de liberdade .25 .20 .15 .10 .05 .025 .02 .01 .005
18 .688 .862 1.067 1.330 1.734 2.101 2.214 2.552 2.878 19 .688
.861 1.066 1.328 1.729 2.093 2.205 2.539 2.861 20 .687 .860 1.064
1.325 1.725 2.086 2.197 2.528 2.845 21 .663. .859 1.063 1.323 1.721
2.080 2.189 2.518 2.831 22 .686 .858 1.061 1.321 1.717 2.074 2.183
2.508 2.819 23 .685 .858 1.060 1.319 1.714 2.069 2.177 2.500 2.807
24 .685 .857 1.059 1.318 1.711 2.064 2.172 2.492 2.797 25 .684 .856
1.058 1.316 1.708 2.060 2.167 2.485 2.787 26 .684 .856 1.058 1.315
1.706 2.056 2.162 2.479 2.779 27 .684 .855 1.057 1.314 1.703 2.052
2.15 2.473 2.771 28 .683 .855 1.056 1.313 1.701 2.048 2.154 2.467
2.763 29 .683 .854 1.055 1.311 1.699 2.045 2.150 2.462 2.756 30
.683 .854 1.055 1.310 1.697 2.042 2.147 2.457 2.750 40 .681 .851
1.050 1.303 1.684 2.021 2.123 2.423 2.704 50 .679 .849 1.047 1.295
1.676 2.009 2.109 2.403 2.678 60 .679 .848 1.045 1.296 1.671 2.000
2.099 2.390 2.660 80 .678 .846 1.043 1.292 1.664 1.990 2.088 2.374
2.639
100 .677 .845 1.042 1.290 1.660 1.984 2.081 2.364 2.626 inf.
.674 .841 1.036 1.282 1.64 1.960 2.054 2.326 2.576
-
Para compreender melhor .Encontre os seguintes percentis da
distribuio t-Student
19;0.05t =
10;0.025t =
7;0.005t =
19;0.95t =
019t
1.729
0.05
019t
-1.729
0.95
Agora,que j conhecemos a distribuio vamos utiliz-la na obteno de
intervalos de confiana para a mdia populacional
-
Intervalo de 100(1-)% de Confiana para
( 1); / 2100(1 )%
.n
sIC x tn
=
o percentil de ordem 1 - /2 dadistribuio t-Student com (n-1)
graus de liberdade, isto que deixa uma rea de /2 acima dele
/ 2;( 1)nt
/ 2;( 1)nt
/2
( 1)nt
Erro de estimao
estimativapontual de
Exemplo: estimao da idade mdia ao falar
Em um experimento com uma amostra de n=20 crianas, a idade mdia
ao falar foi de = 10 meses com desvio-padro de s =1.5 meses.
x
[ ]( 1; /2) (19; /2)
100(1 )%
100(1 )%
. 10nsIC x t tn
= =
= ]( 1; /2) (19; /2) .
1.5. 10
2010 .0.335
IC x t t
= =
[ ](19; / 2)100(1 )% 10 0.335IC t =
-
Em um experimento com uma amostra de n=20 crianas, a idade mdia
ao falar foi de = 10 meses com desvio-padro de s =1,5 meses.
x
Intervalo de 90% de confiana: 100(1-)%=90%1- = 0.90 = 0.10 /2 =
0.05 t(19;0,05) = 1.729
[ ] [[ ]
90% 10 1.729 0.335 10 0,6 10 0.6;10 0.69.4;10.6
ICIC
= = = +=
[ ] [ ]10 1.729 0.335 10 0,6 10 0.6;10 0.6= = = +[[ ]90% 9.4 ;
10.6IC =
Exemplo: estimao da idade mdia ao falar
[ ](19; / 2)100(1 )% 10 0.335IC t =
A idade mdia ao falar para esta populao de crianas est entre 9.4
e 10.6 meses, com 90% de confiana.
Interpretando o intervalo de confiana
-
Quando a amostra pode ser consideradagrande (n > 30) . os
percentis da distribuio t-Student podem ser substitudos pelos
percentis calculados na TabelaNormal-Padro (tabela Z).
Percentis da Distribuio Normal Padro
Intervalo de 100(1-)% de Confiana para quando n > 30
/ 2100(1 )%
.
sIC x zn
=
Erro de estimao
estimativapontual de
estimativa davariabilidade de
x
Fator para reduoda confiana
/ 2z
/2 o percentil da distribuio Normal-padro que deixa uma rea de
/2 acima dele
/ 2z
-
Intervalo de Confiana para a Proporo
/ 2100(1 )% (1 )
.pp pIC p z
n
=
Vlido somente quando n > 30 (amostras grandes)
Proporoamostral
Exemplo: estimao da proporo de pessoas curadas com um novo
tratamento
Deseja-se saber a eficcia de um novo tratamento contra micose em
adultos. Ou seja, deseja-se estimar:
P = proporo de pessoas que seriam curadas com o novo
tratamento
Uma amostra de 50 pessoas doentes foi tratada segundo o novo
tratamento e 45 deles foram curadas.
Estimativa Pontual: a proporo amostral 45 / 50 0.90p = =
-
Estimativa Intervalar
100(1 )%/2
(1 ) .p
p pIC p zn
=
[ ]/2
/2
0.9(0.1)0.950
.
0.9 0.04
z
z
=
=
Exemplo: estimao da proporo de pessoas curadas com um novo
tratamento
Intervalo de 90% de confiana: 100(1-)%=90%1- = 0.90 = 0.10 /2 =
0.05 z/2 = z0,05 =1.64
[ ] [ ] [ ][ ]
90%
90%
0.9 1.64 0.04 0.9 0.07 0.9 0.07;0.9 0.070.83 ; 0.97
p
p
ICIC
= == +=
Assim, com base nesta amostra, estimamos que a proporo de cura
com o novo tratamento est entre 83% e 97%, com 90% de confiana.
Exemplo: estimao da proporo de pessoas curadas com um novo
tratamento
-
Como aumentar a preciso da estimativa do parmetro de
interesse,isto , como reduzir o erro amostral?
Aumentando o tamanho da amostra
Clculo do tamanho de amostra para estimao da mdia
populacional
Qual o menor tamanho de amostra necessrio para estimarmos com
100(1-)% de confiana a mdia populacional com erro de estimao de no
mximo E?
/ 2erro de estimao = .zn
O valor de n pode ser extrado da expresso para o erro de
estimao
/2
2 = .
erro de estimaon z
Para o caso da mdia populacional , temos
-
Exemplo: idade mdia ao falar
Qual o tamanho mnimo de amostra para se estimar a idade mdia ao
falar, em um intervalo de 95% de confiana, com um erro de estimao
mximo de 1 ms? Suponha que o desvio-padro seja de = 2 meses.
(0.05/2)22.0
=
1.0n z
22.0 = 1.96 15.37
1.0n
=
Ou seja, devem ser amostradas, no mnimo, 16 crianas.
Alternativa
/ 2
2 = .
erron z
Se no tivermos como saber nem aproximar o valor de , podemos
trabalhar com o valor da razo .
erro
Exemplo anterior: Qual o tamanho mnimo de amostra para se
estimar a idade mdia ao falar, em um intervalo de 95% de confiana,
de modo que o erro de estimao seja, no mximo, 80% do desvio-padro
populacional? Ou seja,
erro 0.80 0.80 erro 1.25erro
-
Clculo de tamanho de amostra para o caso da estimao de uma
proporo
/2(1 )
erro de estimao . p pzn
=
Como fazer ???
O erro de estimao depende do prprioparmetro a ser estimado
(!!!)
Vamos usar uma propriedade interessanteda expresso (1 )p p
Propriedade de (1 )p p
0.0 0.2 0.4 0.6 0.8 1.0
0.0
0.1
0.2
0.3
0.4
0.5
p
(1 )p p
O valor de
mximoquandop=0.50.
(1 )p p
-
Clculo de tamanho de amostra para o caso da estimao de uma
proporo
/2(1 )
erro de estimao . p pzn
=
O clculo de n feito considerando p=0.50.
/22
(1 )erro
zn p p
=
/22
20.5erro
zn
=
Exemplo: estimao da proporo de pessoascuradas com um novo
tratamento
Qual o tamanho mnimo de amostra para se estimar a proporo de
cura com novo tratamento, em um intervalo de 95% de confiana, com
um erro de estimao mximo de 0.10?
/22
20.5erro
zn
=
221.96 0.5 96.04
0.10n
= =
Ou seja, devem ser amostradas, no mnimo, 97 pessoas.Se o erro
mximo fosse de 0.05, seriam necessrias, no mnimo, 385 pessoas.
-
Ateno !!As expresses aqui apresentadas s so vlidaspara estudos
em que:
1 - Todos os indivduos da populao tero a mesma probabilidade de
serem selecionados para a amostra.
2 A populao pode ser considerada muito grandeem relao amostra
(populaes infinitas).
Para casos mais complexos, devemos utilizartcnicas de Amostragem
mais avanadas (Bussab e Bolfarine, 2005) .
Para compreender melhor .
Exerccios de 9.1 a 9.5 da Seo 9