This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 11/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Mestrado Integrado em Engenharia Civil
Disciplina: TRANSPORTESProf. Responsável: José Manuel Viegas
Sessão Prática 4: Amostragem
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 22/20/20
Intervalo de confiança para a diferença entre valores esperados Amostra de pequena dimensão, População Normal
Duas populações A e B com valores esperados A e B e variâncias A2 e B
2. Admita-se que a partir destas populações se obtiveram amostras independentes de dimensão nAe nB, com base nas quais se calcularam os estimadores dos valores esperados, , e das variâncias SA
2 e SB2.
A variável T segue uma distribuição t-student com GL = nA + nB - 2
Intervalo de confiança:
B
2B
A
2A
GL,2BA
B
2B
A
2A
GL,2BA
nS
nStXX;
nS
nStXX
BA XeX
AX
B
2B
A
2A
BABA
nS
nS
µµXXT
)/,( 2AAA nSN )/,( 2
BBB nSN BX
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 88/20/20
As grandezas calculadas a partir de amostras são apenas estimativas. Há que ter sempre presente as respectivas margens de erro.
Margem de erro absoluto () ou Semi-largura do intervalo de confiança (SLIC)
Para população infinita:
Com correcção de população finita:
onde,t/2 – abcissa correspondente ao grau de confiança (1-) na lei t-studentx – estimativa do desvio padrão da populaçãon – dimensão da amostraN – dimensão da população
nt x
2
NnN
nt x
2
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 99/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Amostragem aleatória simplesAmostragem aleatória simplesDimensionamento (II)
Erro relativo () – esta formulação permite uma interpretação independente da variância da variável a estimar.
A dimensão da amostra (n) necessária para um erro absoluto pretendido (considerando um população infinita):
2x
2tn
NnN
n1t
2x
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1010/20/20
Frequentemente não há uma ideia clara sobre o erro relativo pretendido por não ser evidente quanto vale/custa a ignorância associada a esse erro. A decisão deve ser tomada considerando o custo da falta de informação (C1) e o custo de aquisição de informação (C2).
A dimensão óptima da amostra é conseguida através do valor mínimo do custo total (CT).
A dimensão da amostra cresce com o custo do erro e desvio padrão da variável base e decresce com o custo de aquisição de informação (inquéritos, contagens).
32
2
x2
1
2x
21 c2
tcn0
dndCTCTMinnc
ntcCT
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1111/20/20
Pretende-se estimar o número de veículos rodoviários pesados que entram diariamente em Lisboa entre as 7 e as 10h, num conjunto de 6 eixos principais. Esse conjunto de eixos tem uma capacidade horária global por sentido de cerca de 30000 veículos por hora. Admite-se que a percentagem de veículos pesados no tráfego nesses eixos e período horário seja entre 4 e 6%, e que a estimativa do desvio padrão é 250.
a) Qual o número de dias de observação necessário para estimar o valor pretendido com um erro não superior a 200 veículos/dia?
b) Um técnico ligado ao sector afirma que os tráfegos pesados às segundas-feiras são marcadamente diferentes dos ocorridos nos outros dias úteis, pelo que deveriam ser estimados separadamente. Admita que tinham sido feitas observações em todos os dias úteis de 2 semanas, com os seguintes resultados:
Indicador 2ªf Outros dias úteis
Nobs 2 8
Média 4640 4360
Desvio padrão 290 235
Pode afirmar-se que as médias do número de veículos pesados são, no geral, iguais às segundas-feiras e nos outros dias úteis?
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1212/20/20
No intervalo das 7-10h mín. 3.600 veículos pesadosmáx. 5.400 veículos pesados
Estimativa do desvio padrão x 250 veíc. pes./dia
Erro máximo admitido 200 veíc. pes./dia
nt x
2
2x
2tn
(1) (2)
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1313/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Definição do grau de confiança:O grau de confiança corresponde à probabilidade de o verdadeiro valor da média se situar dentro do intervalo de confiança que vai ser calculado. Ainda que o mais habitual seja trabalhar-se com 95%, pode admitir-se que, face ao vasto conjunto de factores que pode fazer variar os volumes de tráfego, não necessitemos nestes casos de uma tal precisão, descendo até aos 80%.
Dimensionamento da amostra:Como o valor de t/2 (abcissa correspondente ao grau de confiança pretendido na lei de t-student) depende do número de graus de liberdade (n-1), a fórmula (2) tem de ser resolvida por um processo iterativo.
Sendo a distribuição t-Student simétrica em relação à média, a um grau de confiança de 80% correspondem duas caudas de 10% cada, pelo que a abcissa do lado do erro positivo deve ser procurada no percentil 90. Algumas tabelas têm como entrada o valor 10%.
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1515/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Iterações seguintes
1715
250533,1533,1t,5n
2
3ª Iteração
Ensaio com dimensão 6
t10%,5 1,476
Dimensão da amostra (n) 3,40 4
4ª Iteração
Ensaio com dimensão 4
t10%,3 1,638
Dimensão da amostra (n) 4,19 5
5ª Iteração
Ensaio com dimensão 5
t10%,4 1,533
Dimensão da amostra (n) 3,67 4
Verifica-se assim que com o valor de t associado a uma amostra de 5 se poderia usar uma amostra 4, mas com o t correspondente a esta implica a dimensão de amostra 5. Dever-se-á optar pela dimensão cujo erro correspondente resultar não superior a 200 veículos pesados por dia.
2054
250638,1638,1t,4n
2
CONCLUSÃO: Com a dimensão de amostra 5 o erro máximo de estimação da média é de 171 veículos, para o grau de confiança 80%, sendo portanto inferior ao máximo admissível.
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1616/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Grau de confiança de 95%
1929
250306,2306,2t,9n
2
1ª Iteração
Ensaio com dimensão
t2,5%, 1,960
Dimensão da amostra (n) 6,003 7
3ª Iteração
Ensaio com dimensão 11
t2,5%,10 2,228
Dimensão da amostra (n) 7,76 8
5ª Iteração
Ensaio com dimensão 9
t2,5%,8 2,306
Dimensão da amostra (n) 8,31 9
2098
250365,2638,1t,8n
2
CONCLUSÃO: Com a dimensão de amostra 9 o erro máximo de estimação da média é de 192 veículos, para o grau de confiança 95%, sendo portanto inferior ao máximo admissível.
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1818/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Teste de Hipóteses:
Pretende-se testar se as médias das duas populações X1 e X2 são iguais, ou seja, pretende-se saber se o valor esperado de Y é nulo (y=0), sendo y= 1- 2
H0: y=0H1: y≠0
Tratando-se de amostras de pequena dimensão segue uma
distribuição t-student (t/2,GL), onde GL=n1+n2-2 e depende do grau de confiança assumido na estimativa de y.
Vamos determinar os intervalos de confiança para graus de confiança de 80% e 95%.
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 1919/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Intervalos de confiança
Grau de Liberdade = 2+8-2= 8
Erro absoluto (SLIC) onde e n=2+8=10
Limite Inferior do intervalo de confiança
Limite superior do intervalo de confiança
Grau de confiança
Grau de Liberdade (t/2,GL) Limite inferior Int.
ConfLimite superior Int.
Conf
80% 8 1,397 308,7 -28,7 588,7
95% 8 2,306 509,6 -229,6 789,6
Y2B
2B
A
2A
2St
nS
nSt
y
y
221SY
CONCLUSÃO: Como se pode observar, em ambos os casos, graus de confiança de 80% e 95%, o valor 0 pertence ao intervalo de confiança, logo não se deve rejeitar a hipótese de que as médias das duas amostras são iguais, ou seja, o tráfego de pesados à segunda-feira não é suficientemente diferente do que ocorre nos outros dias.
Instituto Superior Técnico / Mestrado Integrado Engª Civil – Transportes – Aulas Práticas 2020/20/20
Sess
ão P
rátic
a 4:
Am
ostr
agem
Para efeito de bom dimensionamento dos tempos de ciclo em exploração, pretende-se avaliar o tempo adequado de paragem do metropolitano em cada estação, em função do seu número de embarques e desembarques por hora. Esses volumes podem ser observados para as estações existentes e modelados para novas estações.
Um conjunto de observações já com alguns anos permite considerar adequado que o conjunto de estações e horas de serviço seja agrupado em três classes (tráfego intenso, médio e moderado), com tempos médios em torno dos 25 seg., 18 seg. e 12 seg.. Sabe-se que a variabilidade relativa dos tempos de embarque e desembarque é maior nas situações de tráfego intenso, para os quais valores de 8 seg. acima da média são relativamente frequentes (considere que “relativamente frequentes” corresponde a 40% das situações).
Qual o número de observações (paragens de comboios em estações) a fazer em cada uma dessas classes de intensidade de tráfego se se quiser estimar o tempo médio e o intervalo de confiança desse estimador com uma margem de erro não superior a 3 seg.?