ESTATÍSTICA O Professor: Manuel do Carmo 88 DISTRIBUIÇÕES POR AMOSTRAGEM 1. Introdução Neste ponto encerra-se o percurso dedutivo “população → amostra”. Partindo do conhecimento da população, caracterizar-se-ão as distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a forma como tais estatísticas variam de amostra para amostra. Para que tal seja possível, é necessário que as amostras sejam seleccionadas de acordo com processos probabilísticos (isto é, processos que tornem possível o cálculo da probabilidade de cada
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
ESTATÍSTICA
O Professor: Manuel do Carmo 88
DISTRIBUIÇÕES POR AMOSTRAGEM
1. Introdução
Neste ponto encerra-se o percurso dedutivo “população → amostra”.
Partindo do conhecimento da população, caracterizar-se-ão as
distribuições de certas estatísticas amostrais, ou seja, analisar-se-á a
forma como tais estatísticas variam de amostra para amostra. Para
que tal seja possível, é necessário que as amostras sejam
seleccionadas de acordo com processos probabilísticos (isto é,
processos que tornem possível o cálculo da probabilidade de cada
ESTATÍSTICA
O Professor: Manuel do Carmo 89
elemento da população ser incluído em cada amostra). Nesta
disciplina considerar-se-á apenas o processo de amostragem
aleatória, como o mais importante dos processos probabilísticos. Note-
se que se utilizam frequentemente outros processos de amostragem,
designadamente os processos de amostragem estratificada e por
conglomerados.
DEF. 1 – Amostragem Aleatória Quando as n variáveis aleatórias observadas, componentes do vector
(X1, X2,...., Xn) são independentes e identicamente distribuídas –
simbolicamente iid – diz-se que se trata de amostragem casual ou
aleatória.
ESTATÍSTICA
O Professor: Manuel do Carmo 90
Ao pedir que as variáveis sejam identicamente distribuídas pretende-
se que os Xi, i=1, 2,..., n, sejam “cópias” da variável aleatória X que
representa o atributo da população em estudo. Ao pedir independência
está a pensar-se que, se a função de distribuição de X é F(x), a função
de distribuição conjunta das n variáveis Xi que compõem a amostra
aleatória se determina facilmente, pelo produto
F(x1,x2,….,xn) = F(x1)F(x2).....F(xn) (1)
Que se designa por distribuição da amostra. Esta distribuição traduz a
estrutura da população de amostras de dimensão n (do espaço -
amostra) obtidas da população representada pela variável aleatória X.
ESTATÍSTICA
O Professor: Manuel do Carmo 91
Na maior parte das situações estamos em situação de inferência
estatística paramétrica.
Neste caso, a forma de F é, ou supõe-se, conhecida, seja F(x|θ), e
desconhece-se apenas o “verdadeiro” valor do parâmetro (escalar ou
vector), isto é, o valor particular que indexa a função de distribuição
que descreve “apropriadamente” as condições em que se observam
as variáveis ou, como também se diz, o processo gerador de dados.
A especificação consiste, neste caso, em admitir que F(x|θ) pertence a
uma família de expressão analítica conhecida,
ℱθ={F(x|θ): θ ∈ Θ}, (2)
ESTATÍSTICA
O Professor: Manuel do Carmo 92
em que o parâmetro, escalar ou vector, assume valores em dado
conjunto Θ designado por espaço-parâmetro. O conjunto ℱθ é a família
das funções de distribuiçao F para todos os valores possíveis de θ ∈
Θ, e constitui o modelo probabilístico a considerar na inferência
estatística paramétrica.
DEF. 2 – Estatística Uma estatística é uma variável, ou vector aleatório, T(X1, X2,...., Xn),
função da amostra aleatória X1, X2,...., Xn, que não envolve qualquer
parâmetro desconhecido.
ESTATÍSTICA
O Professor: Manuel do Carmo 93
Se X1, X2,...., Xn é amostra casual de população normal N(μ, σ2) com
parâmetros μ e σ2 desconhecidos, são exemplos de estatísticas
unidimensionais:
iiX∑ , 1
iiX X
n= ∑ , 2
iiX∑ , 21
iiX
n ∑
não são estatísticas as funções:
1 ( )iX μσ
−∑ , 1ii
Xσ ∑ , 2
21
iiX
σ ∑
porque dependem de parâmetros desconhecidos.
ESTATÍSTICA
O Professor: Manuel do Carmo 94
2. Primeiros resultados sobre a média e a variância amostrais
Vamos neste ponto determinar o valor esperado e a variância das
estatísticas, 1
iiX X
n= ∑ e 2 21 ( )iS X X
n= −∑ , que são como se sabe, a
média amostral e a variância amostral, respectivamente.
Os teoremas que se seguem são de estrema importância, para
distinguir entre parâmetros da população e parâmetros da distribuição
por amostragem, bem como estabelecer relações entre eles.
ESTATÍSTICA
O Professor: Manuel do Carmo 95
Teorema: 1 Se (X1, X2,...., Xn) é amostra casual de população para a qual existem
média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se
( )E X μ= , Var
2
( )Xnσ
= (3)
Teorema: 2 Se (X1, X2,...., Xn) é amostra casual de população para a qual existem
média μ = E(Xi) e variância σ2 = Var(Xi) (i=1, 2,.....,n), tem-se
2 21( ) nE Sn
σ−= , (4)
ESTATÍSTICA
O Professor: Manuel do Carmo 96
Para o caso de se tratar de amostras de pequena dimensão (n<30), é
usual propor outra estatística para estimar σ2, a designada variância
corrigida,
2 21´ ( )1 iS X X
n= −
− ∑ , que verifica E(S´2) = σ2, e que não subavalia,
em média, a variância da população.
De modo a “justificar” alguns dos resultados a utilizar posteriormente,
vamos de seguida enunciar um teorema, encarado por muitos como
fundamental para a inferência estatística amostral.
ESTATÍSTICA
O Professor: Manuel do Carmo 97
Teorema: 3 – Teorema do limite central Dada a sucessão de variáveis aleatórias iid, X1, X2,...., Xn,...., com
média μ e variância σ2, então, quando n→+∞, a função de distribuição
da variável aleatória, 1
nii
n
X nZ
n
μ
σ=
−= ∑ (5)
tende para uma função de distribuição N(0, 1), ou seja, a distribuição
assimptótica de Zn é N(0, 1). Simbolicamente, Zn a~ N(0, 1).
A conclusão do teorema, pode exprimir-se na forma alternativa
1lim ( ) lim ( )n
iinn n
X nP Z x P x x
n
μ
σ=
→+∞ →+∞
⎛ ⎞−⎜ ⎟≤ = ≤ = Φ⎜ ⎟⎝ ⎠
∑ ,
ESTATÍSTICA
O Professor: Manuel do Carmo 98
ou, ainda,
1( ) ( )n
iin
X nP Z x P x x
n
μ
σ=
⎛ ⎞−⎜ ⎟≤ = ≤ ≈ Φ⎜ ⎟⎝ ⎠
∑ (n grande).
Exemplo 1
Analisando o mercado de certo produto, uma empresa conclui que a
procura diária (em centenas de quilogramas) a satisfazer é uma
variável aleatória X com média 40 e variância 25. Sendo a produção
anual planeada de 11 500, pretende calcular-se a probabilidade de
haver procura anual excedentária, considerando que um ano tem 289
dias úteis.
ESTATÍSTICA
O Professor: Manuel do Carmo 99
Representando por Xi, i=1, 2, 289, a variável aleatória que exprime a
procura no i-ésimo dia, tem-se E(Xi) = 40 e Var(Xi) = 25; pretende
calcular-se ( )289
111 500ii
P X=
>∑ , como não se conhece a distribuição
das variáveis aleatórias Xi, o cálculo é efectuado através do teorema
A distribuição binomial aparece, desta forma, acometida em
distribuição por amostragem.
Quando a dimensão da amostra é razoavelmente grande, podemos
escrever
~ (0,1)(1 )
aY n Nn
θθ θ−−
(12)
ou
~ (0,1)(1 )
aX N
n
θθ θ
−−
(13)
As aproximações consideradas poderão ser melhoradas se utilizarmos
as correcções de continuidade consideradas anteriormente.
ESTATÍSTICA
O Professor: Manuel do Carmo 111
Com efeito, se substituirmos a por a-0.5 e b por b+0.5, obtemos a
sequência
P(a ≤ X ≤ b) ≈ Φ 0.5
(1 )b n
nθ
θ θ
⎛ ⎞+ −⎜ ⎟⎜ ⎟−⎝ ⎠
- Φ 0.5
(1 )a n
nθ
θ θ
⎛ ⎞− −⎜ ⎟⎜ ⎟−⎝ ⎠
, 0 < a < b ≤ n (14)
ou de forma equivalente
a bP Xn n
⎛ ⎞≤ ≤⎜ ⎟⎝ ⎠
≈ Φ
12(1 )
bn n
n
θ
θ θ
⎛ ⎞+ −⎜ ⎟
⎜ ⎟−⎜ ⎟
⎜ ⎟⎝ ⎠
- Φ
12(1 )
an n
n
θ
θ θ
⎛ ⎞− −⎜ ⎟
⎜ ⎟−⎜ ⎟
⎜ ⎟⎝ ⎠
, 0 < an
< bn
≤ 1 (15)
Assim, quando a dimensão da amostra o permite, os problemas
binomiais são “transportados” para a esfera de aplicação da
ESTATÍSTICA
O Professor: Manuel do Carmo 112
distribuição normal e tornam mais acessíveis os cálculos. Por vezes,
torna-se aconselhável recorrer à lei dos acontecimentos raros,
utilizando a distribuição de Poisson para lidar com problemas de
Bernoulli.
Exemplo 3
Admita-se que uma instituição bancária classifica os seus clientes
possuidores de cartão de crédito em “maus” e “bons” riscos, conforme
tenham ou não faltado a um pagamento nos últimos 2 anos. Suponha-
se que a proporção de “maus” riscos (classificados com X=1) é de
0.05 para as agências da zona de Lisboa.
ESTATÍSTICA
O Professor: Manuel do Carmo 113
Qual a probabilidade de se obter pelo menos 10% de “maus” riscos
numa amostra de:
a) 10 clientes;
b) 50 clientes;
c) 400 clientes?
Para responder a qualquer uma das alíneas, devemos calcular
( 0.1)P X ≥ , sabendo-se que Xi ∼ B(1, 0.05) para i=1,2,...,n.
a) Neste caso, pequena amostra, utiliza-se a distribuição Binomial,
( 0.1)P X ≥ = 10
1( 10 0.1)ii
P X=
≥ ×∑ = 10
1( 1)ii
P X=
≥∑ =1- 10
1( 0)ii
P X=
=∑ =1-
0.5987=0.4013,
recorrendo à Tabela da Binomial.
ESTATÍSTICA
O Professor: Manuel do Carmo 114
b) Nesta situação, o recurso à distribuição Binomial, é muito
“laborioso”, no entanto nθ=50×0.05=2.5<5. Como θ é pequeno pode
utilizar-se a lei dos acontecimentos raros, ou seja, a aproximação à
Poisson2 de parâmetro igual a nθ.
Assim, ( 0.1)P X ≥
= ( ) ( ) ( )50 50 50
1 1 150 0.1 5 1 4i i ii i i
P X P X P X= = =
≥ × = ≥ = − ≤∑ ∑ ∑
≈ 1 – (0.0821+0.2052+0.2565+0.2138+0.1336)=0.1088, utilizando a
tabela da distribuição de Poisson, com parâmetro 2.5.
c) Como se trata de uma grande amostra, utilizamos (14), isto é, 2 A regra prática para utilizar esta “lei” deve basear-se no pressuposto de que se tem um acontecimento raro e um número “elevado” de observações. Assim, não é aconselhável fazer a
ESTATÍSTICA
O Professor: Manuel do Carmo 115
( 0.1)P X ≥ = 0.05 0.1 0.05
0.05(1 0.05) 0.05(1 0.05)400 400
XP
⎛ ⎞⎜ ⎟− −⎜ ⎟≥
− −⎜ ⎟⎜ ⎟⎝ ⎠
≈1-Φ 0.1 0.05
0.05(1 0.05)400
⎛ ⎞⎜ ⎟−⎜ ⎟
−⎜ ⎟⎜ ⎟⎝ ⎠
≈ 1 - Φ(4.59) ≈ 0, se não se proceder à correcção de continuidade,
ou então
aproximação quando 0.1<θ<0.9 (quando θ≥0.9, é evidente que o acontecimento em causa não é “raro”; é o, sim, o seu complementar) ou quando n≤20.
ESTATÍSTICA
O Professor: Manuel do Carmo 116
( 0.1)P X ≥ =
10.1 0.050.05 8000.05(1 0.05) 0.05(1 0.05)
400 400
XP
⎛ ⎞− −⎜ ⎟−⎜ ⎟≥
− −⎜ ⎟⎜ ⎟⎝ ⎠
≈1-Φ
10.1 0.05800
0.05(1 0.05)400
⎛ ⎞− −⎜ ⎟
⎜ ⎟−⎜ ⎟
⎜ ⎟⎝ ⎠
≈ 1 - Φ(4.47) ≈ 0, o que é teoricamente mais correcto.
ESTATÍSTICA
O Professor: Manuel do Carmo 117
5. Amostragem de população de Bernoulli. Caso de duas
proporções.
Considerem-se agora duas populações de Bernoulli, com parâmetros
θ1 e θ2. A ideia de comparar as duas proporções verdadeiras, θ1 e θ2,
surge em muitas situações praticas (por exemplo, proporção de curas
nos doentes tratados com o medicamento A e nos doentes tratados
com o medicamento B; proporção de peças defeituosas quando se
emprega o processo A e quando se emprega o processo B).
Então, nos estudos de amostragem, a diferença entre proporções
verdadeiras, θ1 - θ2, nunca pode ser conhecida exactamente; no
ESTATÍSTICA
O Professor: Manuel do Carmo 118
entanto, podem estabelecer-se inferências através da estatística
1 2X X− (a diferença entre proporções observadas) calculadas,
respectivamente, a partir de amostra casual da primeira população,
(X11, X12,...., X1m) ⇒ 11 1
m ii
XXm=
= ∑ ,
e de amostra casual da segunda população,
(X21, X22,...., X2n) ⇒ 22 1
n jj
XX
n== ∑ ,
amostras que se supõem escolhidas independentemente uma da
outra.
ESTATÍSTICA
O Professor: Manuel do Carmo 119
Como não se conhece a distribuição exacta, só pode estudar-se a
distribuição assimptótica de 1 2X X− , válida quando as dimensões das
amostras são razoavelmente grandes. Tem-se, então
1 11 1
(1 )~ ,a
X Nm
θ θθ −⎛ ⎞⎜ ⎟⎝ ⎠
, e 2 22 2
(1 )~ ,a
X Nn
θ θθ −⎛ ⎞⎜ ⎟⎝ ⎠
(16)
Consequentemente, e utilizando a propriedade (corolário anterior) que
estabelece que a diferença de duas variáveis aleatórias independentes
com distribuição normal (aproximadamente normal) tem distribuição
ESTATÍSTICA
O Professor: Manuel do Carmo 120
normal (aproximadamente normal), tem-se, depois de estandardizar, o