Top Banner
Distribuição amostral da média; Teorema do Limite Central; estimação por ponto e intervalo de confiança Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais
51

Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Oct 21, 2019

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Distribuição amostral da média;

Teorema do Limite Central; estimação

por ponto e intervalo de confiança

Prof. Marcos Pó Métodos Quantitativos para Ciências Sociais

Page 2: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Exercício para entrega em 25/02 – grupos até 3 pessoas

Uma máquina automática de encher latas de sopa é ajustada para que o peso líquido do produto tenha uma média de 450g e desvio padrão de 15g, seguindo uma distribuição normal. Qual é a probabilidade de encontrarmos uma lata com peso líquido menor que 425g?

2 Prof. Marcos Vinicius Pó 32 Campbell's Soup Cans 1962 - Andy Warhol

Page 3: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,
Page 4: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Distribuição amostral

• É altamente improvável que duas amostras de mesmo tamanho e da mesma população possuam estatísticas iguais.

• Amostragens são probabilísticas, portanto, estatísticas baseadas nas amostragens também serão.

• Se as características da amostragem são conhecidas podemos estimar a probabilidade de cada resultado.

• Podemos também estimar a probabilidade de que uma estatística amostral esteja próxima do parâmetro populacional.

4

Page 5: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

5

Amostras variadas, ainda que da

mesma população, geram estatísticas

diferentes.

Page 6: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

• As amostras são aleatórias (randômicas), ou seja, todos os elementos da população possuem a mesma probabilidade de serem sorteados.

6

Pressuposto básico da amostragem

Page 7: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

• Seja X uma variável aleatória com média μ e variância σ2, se fizermos seguidas Amostras Aleatórias Simples (AAS) com tamanho n, verificaremos que as suas médias seguem uma distribuição normal com os seguintes parâmetros.

• Ou seja, quanto maior a amostra, menor o desvio padrão da distribuição amostral das médias.

1. O valor esperado (esperança) da média das médias amostrais será a média da população.

2. A variância das médias amostrais será definida por:

7

Distribuição amostral da média

= X)E(

n =

n =

XX

2

2

Page 8: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Teorema do Limite Central (TLC)

Quando o tamanho da amostra (n) aumenta, independente da distribuição da população, a distribuição amostral da média da amostra (x) converge para uma distribuição normal.

8

Histogramas de distribuição da

média para amostras de algumas populações

Page 9: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Por que o TLC é importante para nós?

• Se nosso estimador for a média não é necessário conhecer a distribuição da população, pois a distribuição probabilística das médias amostrais tenderá à uma normal.

• A média das distribuições amostrais será igual à da população (μ) e a sua variância será dada por σ2/n.

• Com base nisso conseguimos fazer inferências a respeito da amostra e definir estimativas e critérios de aceitação.

9

Page 10: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Exemplo: uso da curva normal e do TLC

Um aluno empolgado por MQCS de ressaca decide fazer um levantamento dos valores* em posse dos frequentadores do saudoso Culto. Ele verificou que eles seguiam uma distribuição normal, com média R$100 e desvio-padrão de R$20.

a. Qual a P(90<X<110)?

b. Se X for a média de uma amostra de 16 elementos tirados dessa população, calcule P(90<X<110)?

10

* Valores incluem grana, saldo de bilhete único, créditos do RU, bilhete do trem, etc.

Page 11: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Estimação de parâmetros

• Problemas: ► Estimar parâmetros de uma população a partir de amostras.

► Testar hipótese sobre os parâmetros.

• Estimador: estatística usada para aferir parâmetro da população. ► Genericamente: T estimador de

• Há vários estimadores possíveis. ► Ex. para média populacional :

• Erro entre a estimativa e o alvo: ► erro absoluto: |T-|

► erro quadrático: (T-)²

x

x

x

x

x

x

erro

x

11

Page 12: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Características de um bom estimador

• Precisão: (proximidade sistemática das observações entre si)

• Acurácia: (proximidade do valor alvo)

• Ausência de viés (desvio sistemático das observações em relação ao alvo)

(a) (b) (c)

12

Page 13: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Estimador de ponto

• Fornece um único número como estimativa.

• A preocupação é minimizar o erro para que nossa estimativa seja o mais próxima possível do parâmetro da população.

• Pelo TLC sabemos que nossos erros tem uma distribuição normal.

2 2

2

ˆ ˆˆE

13

Page 14: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

14

Pequena questão: como saber se as estimativas das

nossas amostras estão perto do alvo considerando

que não sabemos os parâmetros da população?

Prof. Marcos Vinicius Pó

Page 15: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Estimação de intervalos

• Quando determinamos uma estimativa T de uma amostra, não temos nenhuma indicação de sua proximidade em relação ao parâmetro θ da população.

• A estimação pontual, a estimação por intervalo nos permite julgar a magnitude do erro que estamos cometendo. Sua determinação é baseada na distribuição amostral do estimador pontual.

• No nosso caso, na distribuição amostral das médias ou das proporções.

15

Page 16: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Intervalo de confiança (IC)

• IC = Probabilidade de que um intervalo estimado de valores contenha o parâmetro populacional que queremos determinar.

• Medido com coeficiente (ou nível) de confiança (γ), cujos valores mais comuns são 95% e 99%.

16

Fo

nte

: Bu

ssab

; Mo

rett

in, 2

00

2:

30

4

Page 17: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

17 Prof. Marcos Vinicius Pó

https://g1.globo.com/politica/eleicoes/2018/noticia/2018/09/14/pesquisa-datafolha-bolsonaro-26-ciro-13-haddad-13-alckmin-9-marina-8.ghtml

Page 18: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Ilustrativamente

18

Fon

te:

Bu

ssab

; Mo

rett

in, 2

002:

305

95,096,196,1 = X X xxP

Page 19: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Metaforicamente

19

96,1x

96,1x

96,1x

96,1x

• Aumentamos o “calibre” das estimativas e conhecemos a chance de ter acertado o alvo.

• Mas não teremos certeza absoluta da estimativa que fizemos ter acertado!

Page 20: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Exemplos

• Calcule o intervalo de confiança para a média de altura de uma população normal em cada uma das amostras abaixo:

20

x n σ γ

170 cm 25 15 cm 95%

170 cm 25 15 cm 99%

170 cm 225 15 cm 99%

Page 21: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,
Page 22: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Distribuição amostral de uma proporção

• Consideramos X uma variável aleatória onde:

1, se portador da característica

0, se não for portador da característica

• Proporção é a freqüência de ocorrência da característica, podendo ser descrita como uma porcentagem.

► Ex.: doador de órgãos, profissão, preferência futebolística, intenção de voto em tal pessoa...

• É uma variável categórica binomial.

22

X

Page 23: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Proporção

• Proporção populacional é a frequência relativa com que se observa uma categoria na população.

X = total de vezes que a categoria ocorre na população

N = tamanho da população

• Proporção amostral é a frequência relativa com que a categoria se observa em uma amostra.

x = total de vezes que a categoria ocorre na amostra

n = tamanho da amostra

23

N

Xp

n

xp ˆ

Page 24: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Distribuição amostral de uma proporção

• Podemos aproximar a distribuição binomial para uma normal, onde a média e a variância são definidos como:

μ= E(X) = p

σ2 = Var(X) = p(1-p)

• A distribuição amostral da proporção é:

• O IC da proporção é similar ao de variáveis contínuas.

n

pppNp

)1(;~ˆ

24

n

pppp

n

ppp zz

)1(ˆ

)1(ˆ

Page 25: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Exemplo: binomial como normal

• Uma pesquisa de boca-de-urna com 400 eleitores aleatoriamente selecionados mostra que um candidato tem 51% das preferências dos votos válidos. Com base nisso, calcule:

► Um intervalo de confiança de 95% para a votação desse candidato.

► A probabilidade de que o candidato não vença a eleição, ficando com menos de 50% dos votos.

25

Page 26: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Intervalo de confiança: limites

nZxIC

x

;

n

ppZpIC

p

)1(ˆ

26

Valores absolutos

Proporções

Desvio-padrão da distribuição

amostral

Índice Z do coeficiente de

confiança γ

Page 27: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

E se a variância da população não for conhecida?

• Para proporções: considerando que σ = p(1-p), se não soubermos o valor de p, há duas alternativas:

► Buscar uma estimativa de p (outros estudos, pesquisa piloto...).

► Usar uma estimativa conservadora com a máxima variância, considerando p = 0,5 (50%), portanto p(1-p) = 0,25 (valor máximo).

► Amostras pequenas: usar a distribuição t de Student para os limites de γ.

• Para medidas absolutas:

► Teremos que usar o s da amostra para determinar o intervalo de confiança. Podemos ter duas situações:

o Amostras grandes: pode-se considerar que ela aproxima-se da normal.

o Amostras pequenas: usar a distribuição t de Student para os limites de γ.

27

Page 28: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

O que é uma amostra pequena?

• Costuma-se tomar arbitrariamente algo entre 30 e 60 como referência para definir se uma amostra é grande ou pequena.

• O mais adequado é analisar o problema e a variância amostral antes de decidir.

► Com variâncias grandes é necessária uma amostra maior para termos mais confiança na estimativa.

► Já para populações mais uniformes (variância pequena), podemos ter mais confiança na estimativa com amostras pequenas.

28 Prof. Marcos Vinicius Pó

Page 29: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Distribuição t de Student

• Desenvolvida por Willian S. Gosset em 1908, que publicou sob o pseudônimo Student.

• Ele desenvolveu essa distribuição enquanto trabalhava nas cervejarias Guinness ao verificar que pequenas amostras não se comportavam como previsto pela distribuição normal.

29

Page 30: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Distribuição t de Student

A distribuição t é semelhante à normal, mas com caudas mais largas. O parâmetro que a define são os graus de liberdade (ν).

gl = ν = n-1.

Fon

te:

htt

p:/

/en

.wik

iped

ia.o

rg/w

iki/

File

:Stu

den

t_t_

pd

f.sv

g

30

Page 31: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

31

Page 32: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Exemplo: distribuição t

O número de horas de sono de uma amostra de 25 estudantes universitários* tem uma distribuição normal e é de 7 horas, com desvio-padrão de 2 horas.

(a). Determine um intervalo de confiança de 95% para o número médio de horas de sono dos estudantes.

(b). Calcule novamente o IC considerando que a amostra fosse de apenas 4 estudantes.

* Se fossem da UFABC não teriam tempo para essas coisas.

32 Prof. Marcos Vinicius Pó

Page 33: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Atividade para entrega em 07/03: grupos até 3 pessoas

No teste-piloto de um novo procedimento de compilação de apelações contra multas de trânsito foi feita uma amostra aleatória com 20 funcionários. A taxa média de compilação dessa amostra foi de 80 multas/hora, com desvio-padrão de 10 multas/hora e distribuição normal.

(a) Forneça o intervalo de confiança de 95% e 99% para a média de compilação desse novo procedimento.

(b) Considerando que o procedimento antigo possui uma média de 74 multas/hora e que trocá-lo implica em custos altos (treinamento, equipamento, ...), você aconselharia a substituição levando em conta os dois ICs calculados? Justifique sua resposta.

33 Prof. Marcos Vinicius Pó

Page 34: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Amostras, amostragem e tamanho

da amostra

Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Page 35: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Conceitos básicos

• Amostra: subconjunto de uma população, por meio do qual se estimam as propriedades e características dessa população.

• Amostra representativa: toda amostra que permite fazer inferências sobre a população.

• Amostragem: processo ou ato de construir uma amostra.

• Característica de interesse: propriedade dos elementos da população que se pretende conhecer.

• Plano amostral: protocolo que descreve os procedimentos da amostragem.

• População: conjunto de elementos cujos parâmetros se investigam por meio de amostras.

• População amostrada: população da qual foi retirada a amostra.

• Unidade elementar: entidade portadora das informações que se pretende coletar.

• Unidade de resposta: aquele que fornece as informações.

• Subpopulação: estrato da população que partilha alguma característica comum.

35 Fo

nte

: Bo

lfar

ine;

Bu

ssab

, 20

05

Page 36: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Tópicos básicos para um levantamento amostral

1. Identificação dos objetivos e populações ► Definir os objetivos gerais e

específicos.

► Especificar os parâmetros de interesse.

► Definir a população e as subpopulações de interesse (estratos).

2. Planejamento da coleta das informações ► Escolher o tipo de investigação

e o modo de coleta.

► Operacionalizar os conceitos e elaborar o instrumento de mensuração/coleta dos dados.

3. Planejamento e seleção da amostra

► Definir o plano amostral.

► Fixar o tamanho da amostra.

► Escolher os melhores estimadores e determinar seus erros amostrais.

4. Coleta dos dados

► Elaborar os procedimentos e treinar os pesquisadores.

► Controlar a qualidade no campo.

36

Fon

te: B

olf

arin

e; B

uss

ab, 2

00

5

Page 37: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Operacionalizando um levantamento amostral

• Uma boa amostragem permite a generalização de resultados dentro de limites aceitáveis de dúvidas e minimiza os custos de execução da pesquisa.

• Etapas: ► Constructo das variáveis

o Formulação de questões, definições de métricas e sua operacionalização.

► Definição dos objetivos do levantamento o Deve-se procurar focar em um conjunto pequeno de questões

chaves. Cuidado com o “já que estamos pesquisando, por não perguntamos também...”.

► Levantamento da informação o Garantir que os respondentes entendam o que está sendo

perguntado.

o Garantir que os aplicadores de questionários tenham coerência nos questionamentos e captação da informação.

37

Page 38: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Possíveis problemas na amostragem

• Inadequação.

► A amostra não reflete adequadamente a população alvo da pesquisa.

► Estão sendo feitas comparações inadequadas.

• Viés: todos os indivíduos da população tem chances iguais de participar ou alguns podem ser mais privilegiados? Como isso afeta os resultados?

• Estratificação inadequada: os grupos pesquisados na amostra correspondem à sua proporção na população? Há grupos superestimados ou subestimados?

38

Page 39: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Tipos de amostragem

• Aleatória Simples (AAS)

► Com reposição

► Sem reposição

• Estratificada

• Por cotas

• Conglomerado

• Sistemática

• Por julgamento

• Por conveniência

• Oportunística

Essas amostragens podem ser combinadas em diferentes estágios do processo amostral, de acordo com os interesses e possibilidades do pesquisador.

39

Page 40: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Avalie criticamente os seguintes planos amostrais:

a. Para investigar a proporção dos estudantes favoráveis à mudança de início das aulas das 8h para as 7h30min, decidiu-se entrevistar os 50 primeiros que chegassem em determinado dia.

b.Mesmo procedimento, mas para verificar a altura média dos estudantes.

c. Com o objetivo de estimar o orçamento de esportes enviam-se questionários para prefeituras aleatoriamente selecionadas. A amostra é formada pelas que respondem.

d.Para verificar se um brinde aumenta as vendas, oferta-se o produto com o brinde em quatro lojas na zona norte e sem em quatro lojas da zona sul de uma cidade. No final do período comparam-se as vendas nas duas regiões.

40

Page 41: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

• Objetivos

► Melhoria da precisão das estimativas.

► Produzir estimativas para a população e para as subpopulações.

► Questões administrativas.

• Por que ela é interessante?

► Uma população muito heterogênea necessita de amostras grandes para maior precisão. Dividindo a população em estratos pode-se obter subpopulações mais homogêneas.

► Além disso, passa s ser possível comparar os parâmetros de diferentes subpopulações.

Montagem de uma amostra estratificada:

► Divisão da população em estratos (subpopulações) bem definidas, segundo alguma variável auxiliar.

► De cada estrato retira-se uma amostra de acordo com regras específicas.

► Monta-se para toda a população um estimador combinando os estimadores de cada estrato.

41

Amostragem estratificada

Page 42: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Vantagens e limites da amostragem estratificada

• Vantagem: pode-se obter estimativas com maior precisão com o mesmo tamanho amostral.

A amostragem estratificada elimina a segunda fonte de variação

• Alguns métodos de alocação de amostras pelos estratos:

► Proporcional: amostra é distribuída proporcionalmente aos estratos.

► Uniforme: atribui-se o mesmo tamanho de amostra para cada estrato.

► Ótima de Neyman: o n de cada estrato é definido de acordo com a sua variância visando minimizar o erro e a amostra.

42

Variância

total da

população

Variância

nos

estratos

Variância

entre os

estratos

Page 43: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Amostragem por cotas

• Envolve uma escolha não aleatória de participantes com o objetivo garantir a representatividade de determinadas categorias de interesse e/ou de ponderar os parâmetros da amostra total.

• As cotas são categorias selecionadas na amostragem para garantir que suas proporções sejam iguais às da população.

► É necessário ter informações prévias sobre as proporções de cada categoria e avaliar.

► Exemplos: faixa etária, faixa de renda, escolaridade, gênero, etc.

• É muito utilizada em pesquisas de opinião.

43

Page 44: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Amostra: retomando o exercício do Culto

Um aluno empolgado por MQCS de ressaca decide fazer um levantamento dos valores* em posse dos frequentadores do saudoso Culto. Ele verificou que eles seguiam uma distribuição normal, com média R$100 e desvio-padrão de R$20.

a. Qual a P(90<X<110)?

b. Se X for a média de uma amostra de 16 elementos tirados dessa população, calcule P(90<X<110)?

c. Que tamanho deveria ter a amostra para que P(90<X<110) = 0,95?

44

* Valores incluem grana, saldo de bilhete único, créditos do RU, bilhete do trem, etc.

Page 45: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Determinando o tamanho da amostra

• O tamanho de uma amostra está relacionado com os erros e a confiabilidade de nossas estimações. Suponha que estejamos tentando a estimar a média μ de uma população usando a média x de uma amostra de tamanho n.

• Sabemos que:

• Com base na distribuição amostral de x podemos estimar a probabilidade de cometer erros de determinadas magnitudes na estimação de μ, como, por exemplo, 5% (IC=95%). Ou seja:

Onde:

e = Erro amostral máximo que podemos suportar

γ = Coeficiente de confiança desejado, ou seja, intervalo no qual estaríamos confiantes de que o valor real do parâmetro está incluído.

nNX - e =

2

,0~

45

eXP

Page 46: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Calculando o tamanho de uma amostra

Erro amostral da média:

O erro é determinado por:

Deduzimos que o tamanho de uma amostra pode ser dado pela seguinte expressão:

e

ze

zn

2

2

22

x - e =

nze =

46

Onde:

Zγ = Índice de confiança (95%, 99%...)

σ=desvio-padrão da população

e = erro amostral máximo

Page 47: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Amostra para proporção

No caso de proporção, onde a variância é p(1-p), temos:

Se não conhecermos p podemos usar um valor conservador, ou seja, o caso que proporciona o máximo erro amostral. Isso ocorre quando a variância assume seu valor máximo, ou seja, quando:

Erro amostral máximo: p = 50% (σ2 = 0,25 )

e

ppz n

2

21

47

Page 48: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Tamanho da amostra para populações finitas

Quando a população for pequena (finita) e a amostragem for sem reposição é necessário ajustar o cálculo da amostra.

48

N z

en=

1

1

22

2

Fon

te: B

olf

arin

e; B

uss

ab, 2

00

5

N: tamanho da população

Page 49: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Como estimar o desvio-padrão?

• Para determinar o tamanho da amostra é necessária informação prévia do valor de σ. Mas como saber isso?

► Usar estudos anteriores ou relacionados ao tema.

► Pesquisa piloto para determinar um desvio-padrão (s) de referência.

► Chute educado: estimar um intervalo que englobe cerca de 95% das observações da população, o que corresponde, aproximadamente, à 4 desvios-padrão.

49

Page 50: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Exemplos: tamanho de amostra

1. Para uma pesquisa visando estimar proporções de uma população, qual seria o tamanho das amostras para, com confiança de 95%, termos um erro máximo de 3% e de 1%?

2. Uma secretaria de obras deseja saber a duração média de lixeiras para serem colocadas em praças, com confiança de 95%. O gênio da variância indicou que o desvio padrão é 150 dias. a. Quantas amostras são necessárias para um erro máximo de 30 dias?

b. Foram testadas 50 amostras. Qual o erro máximo nesse caso, mantendo-se o índice de confiança?

3. A coordenação de um curso planeja uma pesquisa para saber, com 95% de confiança e erro menor que 3%, a proporção de alunos que se utilizam de seus programas de apoio ao estudante. a. Sabendo-se que o curso tem 300 estudantes, qual deve ser o tamanho

da amostra?

b. Se a população fosse de 10 mil alunos, qual deveria ser tamanho da amostra?

50

Page 51: Distribuição amostral da média; Teorema do Limite Central ... · Teorema do Limite Central (TLC) Quando o tamanho da amostra (n) aumenta, independente da distribuição da população,

Referências úteis

• Bolfarine, Heleno; Bussab, Wilton O. Elementos de amostragem. São Paulo: Blücher, 2005

• BUSSAB, Wilton de Oliveira; MORETTIN, Pedro A. Estatística Básica. 6ª edição. Editora Saraiva, 2010;

• Neder, Henrique Dantas. Amostragem em pesquisas socioeconômicas. Editora Alínea, 2008.

51