Capítulo 6 Distribuição de Probabilidade Normaldenis.santos/Arquivos/Slides/Triola_Cap_06... · Distribuição de Probabilidade Normal 6-1 Visão Geral 6-2 Distribuição Normal
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Esta seção apresenta a distribuição normalpadronizada, que tem três propriedades:
1. Tem forma de sino.
2. Tem média igual a 0.
3. Tem desvio padrão igual a 1.
É extremamente importante desenvolver ahabilidade para se determinar as áreas (ou asprobabilidades ou freqüências relativas)correspondente a várias regiões sob o gráfico dadistribuição normal padronizada.
� Uma curva de densidade é o gráfico de umadistribuição de probabilidade contínua. Ele devesatisfazer as seguintes propriedades:
Definição
1.A área total sob a curva deve ser igual a 1.2.Cada ponto na curva deve ter uma altura verticalque é 0 ou maior. (Isto é, a curva não pode estarabaixo do eixo x.)
� A distribuição normal padronizada é umadistribuição de probabilidade com médiaigual a 0 e desvio padrão igual a 1, e a áreatotal sob sua curva de densidade é igual a 1.
Se termômetros científicos têm umaleitura média de 0 graus e um desviopadrão de 1 grau no ponto decongelamento da água, e se um destestermômetros é selecionado ao acaso,encontre a probabilidade de, no ponto decongelamento da água, a leitura ser menorque 1.58 graus.
Se termômetros têm uma leitura média de 0 graus eum desvio padrão de 1 grau, e se um destestermômetros é selecionado ao acaso, calcule aprobabilidade de que sua leitura no ponto decongelamento da água seja maior que –1.23 graus.
A probabilidade de que o termômetro selecionado ten ha leitura superior a -1.23 graus é 0.8907.
Um termômetro é selecionado aleatoriamente. Calcule aprobabilidade de que sua leitura (no ponto decongelamento da água) esteja entre –2.00 e 1.50 graus.
P (z < –2.00) = 0.0228P (z < 1.50) = 0.9332P (–2.00 < z < 1.50) = 0.9332 – 0.0228 = 0.9104
A probabilidade de que o termômetro escolhido tenha leitura entre – 2.00 e 1.50 graus é 0.9104.
Se vários termômetros são selecionados ao acaso e t estados no ponto de congelamento da água, então temos que 91.0 4% destes
termômetros terão leitura entre –2.00 e 1.50 graus.
P (z < –2.00) = 0.0228P (z < 1.50) = 0.9332P (–2.00 < z < 1.50) = 0.9332 – 0.0228 = 0.9104
Um termômetro é selecionado aleatoriamente. Calcule aprobabilidade de que sua leitura (no ponto decongelamento da água) esteja entre –2.00 e 1.50 graus.
Calculando o Escore z Para Probabilidades Dadas Usando a
Tabela A-21. Desenhe a curva da normal e identifique a região
sob a curva que corresponde à probabilidadedada. Se esta região não é uma regiãoacumulativa a partir da esquerda, trabalhe comáreas conhecidas que sejam acumuladas àesquerda.
2. Usando a área acumulada à esquerda, localize aprobabilidade mais próxima no corpo da TabelaA-2 e identifique o escore z correspondente.
Esta seção apresenta métodos para trabalharcom distribuições normais que não sãopadronizadas. Isto é, a média não é 0 ou odesvio padrão não é 1, ou ambos.
O ponto chave é que podemos usar umaconversão simples que nos permite padronizarqualquer distribuição normal de modo que osmesmos métodos da seção anterior possamser utilizados.
No Problema do Capítulo, notamos que a cargade segurança para um táxi aquático era de 3500libras (aproximadamente 1588 kg). Tambémnotamos que o peso médio dos passageiros éconsiderado igual a 140 libras. Assuma o piorcaso de que todos os passageiros são homens.Assuma também que o peso destes homens sãonormalmente distribuídos com média 172 libras edesvio padrão de 29 libras. Se um homem éselecionado ao acaso, qual é a probabilidade deque ele pese menos do que 174 libras?
1. Não confunda escores z e áreas. Os escores z sãodistâncias ao longo da escala horizontal, enquantoque as áreas são regiões sob a curva normal. ATabela A-2 lista os escores z na coluna à esquerda ena linha superior, e as áreas são encontradas nocorpo da Tabela.
2. Escolha o lado correto (direito/esquerdo) dográfico.
3. Um escore z deve ser negativo toda vez que ele selocalizar na metade esquerda da distribuição normal.4. Áreas (ou probabilidades) são positivoas ou nulas,portanto nunca serão negativas.
Procedimento para Calcular Valores Usando a Tabela A-2 e a
Fórmula 6-21. Esboce a curva da distribuição normal, introduza a probabi lidade
ou percentagem dada na região apropriada do gráfico eidentifique o valor x de seu interesse.
2. Use a Tabela A-2 para encontrar o escore z correspondente àárea acumulada à esquerda de x. Consulte o corpo da Tabela A-2para encontrar a área mais próxima, então identifique o esco re zcorrespondente.
3. Usando a Fórmula 6-2, introduza os valores de µ, σσσσ, e o escore zencontrado no passo 2, e resolva para x.
x = µ + (z • σσσσ) (Outra forma para a Fórmula 6-2)
(Se z está localizado à esquerda da média, tenha certeza de queseja um número negativo.)
4. Consulte o esboço da curva para verificar se a solução fazsentido no contexto do gráfico e no contexto do problema.
O objetivo principal desta seção é entender oconceito de distribuição amostral de umaestatística , a qual é a distribuição de todosos valores da estatística quando todas aspossíveis amostras de mesmo tamanho sãoobservadas.
Nós também veremos que algumasestatísticas são melhores que outras paraestimar parâmetros populacionais.
� A distribuição amostral de uma estatística (talcomo a proporção amostral ou a médiaamostral) é a distribuição de todos os valoresda estatística quando todas as possíveisamostras de mesmo tamanho n sãoselecionadas da mesma população.
� A distribuição amostral de umaproporção é a distribuição das proporçõesamostrais, com todas as amostras tendo omesmo tamanho amostral n sãoselecionadas de uma mesma população.
� Proporções amostrais tendem a seaproximarem do valor da proporçãopopulacional. (Ou seja, todas as possíveisproporções amostrais têm média igual àproporção populacional.)
� Sob certas condições, a distribuição daproporção amostral pode ser aproximada peladistribuição normal.
� A distribuição amostral da média é adistribuição das médias amostrais, comtodas as amostras tendo o mesmo tamanhoamostral n selecionadas de uma mesmapopulação. (A distribuição amostral damédia é tipicamente representada comouma distribuição de probabilidade noformato de uma tabela, histograma deprobabilidade ou fórmula.)
� O valor de uma estatística, tal como a médiaamostral x, depende dos valores incluídos naamostra estudada, e geralmente variam deamostra para amostra. Esta variabilidade dasestatísticas é chamada de variabilidadeamostral .
Nós podemos ver que usando as estatísticasamostrais para estimar parâmetros populacionais,algumas são melhores que outras, no sentido de“acertarem” o valor do parâmetro em questão, e sãoportanto preferíveis para obtermos bons resultados .Tais estatísticas são chamadas de estimadorescentrados ou não viesados. .
Estatísticas que acertam o valor dos parâmetrospopulacionais: média, variância, proporção
Estatísticas que não acertam o valor do parâmetropopulacional: mediana, amplitude, desvio padrão
Os procedimentos desta seção formam abase para a estimação de parâmetrospopulacionais e para os testes de hipótese –tópicos a serem discutidos ao longo doscapítulos seguintes.
1. Uma variável aleatória x tem uma distribuição (quepode ser normal ou não) com média µ e desviopadrão σσσσ.
2. Amostras aleatórias simples todas de tamanho n sãoselecionadas da população. (As amostras sãoselecionadas de tal maneira que todas as amostraspossíveis de mesmo tamanho n têm a mesma chancede serem selecionadas.)
1. Para amostras de tamanho n maiores que30, a distribuição das médias amostrais podeser aproximada razoavelmente bem pelaDistribuição Normal. A aproximação ficacada vez melhor com o aumento do tamanhoamostral n.
2. Se a população original é normalmentedistribuída. Então as médias amostrais serãonormalmente distribuídas para qualquertamanho amostral n (e não apenas paravalores de n maiores que 30).
Dado que a população de homens tem o peso distribuído normalmente com média 172 lb e um desvio padrão de 29 lb:a) se um homem é selecionado aleatoriamente, calcule a probabilidade de que seu peso seja maior que 175 lb.b) se 20 homens diferentes são selecionados aleatoriamente, calcule a probabilidade de que seu peso médio seja maior que 175 lb (ou seja, que o peso total destes homens exceda a capacidade de segurança de 3500 libras).
Dado que a capacidade de um taxi aquático éde 3500 libras, temos uma grande chance(com probabilidade 0,3228) de que ele sejasobrecarregado ao termos 20 homensescolhidos ao acaso.
Quando amostramos sem reposição e o tamanho daamostra n é maior que 5% da população finita detamanho N, ajuste o desvio padrão das médiasamostrais pelo fator de correção:
Esta seção apresenta um método para usar adistribuição normal como uma aproximação para adistribuição de probabilidade binomial.
Se as condições de np ≥ 5 e nq ≥ 5 são ambassatisfeitas, então as probabilidades de uma distribuiçãode probabilidade binomial podem ser aproximadasusando uma distribuição normal com média µ = np edesvio padrão σ = √npq
Procedimento para Usar a Distribuição Normal para Aproximar uma Distribuição
Binomial1. Estabeleça que a distribuição normal é uma
aproximação razoável para a distribuição binomialverificando se np ≥≥≥≥ 5 e nq ≥≥≥≥ 5.
2. Calcule os valores dos parâmetros µ e σσσσ calculandoµ = np e σσσσ = npq .
3. Identifique os valores discretos de x (o número desucessos). Mude os valores discretos substituindo-ospelos intervalos de x – 0.5 para x + 0.5. (Veja correçãode continuidade discutido posteriormente nesta seção.)Desenhe uma curva normal e indique os valores de µ ,σσσσ, e de x – 0.5 ou x + 0.5,o que for apropriado.
4. Substitua x por x – 0.5 ou x + 0.5, o que for maisapropriado.
5. Usando x – 0.5 ou x + 0.5 (o que for mais adequado) aoinvés de x, calcule a área correspondente para aprobabilidade desejada primeiro calculando o escore ze em seguida calculando a área a esquerda do valorajustado de x.
Procedimento para Usar a Distribuição Normal para Aproximar uma Distribuição
Quando usamos a distribuição normal (que éuma distribuição de probabilidade contínua )como uma aproximação à distribuiçãobinomial (que é discreta ), uma correção decontinuidade é feita no valor numéricodiscreto x da distribuição binomialrepresentando o valor simples x pelo intervaloda forma
de x – 0.5 para x + 0.5(ou seja, adicionando e subtraindo 0.5).
1. Quando usar a distribuição normal como umaaproximação para a distribuição binomial, sempre usea correção de continuidade.
2. Ao usar a correção de continuidade, primeiroidentifique o valor discreto x que é relevante para oproblema da distribuição binomial.
3. Desenhe uma distribuição normal centrada em tornode µ, e então desenhe uma área vertical centrada emx. Mark the left side of the strip with the number x –0.5, and mark the right side with x + 0.5. For x = 122,draw a strip from 121.5 to 122.5. Consider the area ofthe strip to represent the probability of discrete wholenumber x.
4. Agora determine se o valor de x será incluído naprobabilidade que você deseja calcular. A seguir,determine quais destas probabilidades será calculada:pelo menos x, no máximo x, maior que x, menor que x,ou exatamente x. Sombreie a área a esquerda ou adireita da marca vertical conforme apropriado, etambém sombreie o interior das marcas verticais se esomente se x será incluído. A região sombreada totalcorresponde a probabilidade a ser calculada.
Esta seção apresenta critérios para determinarse os requisitos de uma distribuição normalsão satisfeitos.
Os critérios envolvem a inspeção visual de umhistograma para ver se aparenta ter umformato de sino, identificação de algumoutlier, e a construção de um novo gráficochamado de plot de quantis normal .
� Um plot de quantis normal quantile plot(ou gráfico de probabilidades normal ) éuma gráfico que traça os pontos ( x,y ),onde cada valor x é do conjunto de dadosoriginais e cada valor y é o escore zcorrespondente que é o quantil esperadode uma distribuição normal padronizada.
b.Com uma amostra de tamanho n, cada valorrepresenta uma proporção de 1/ n da amostra.Usando o valor conhecido do tamanho amostral n,identifique as áreas de 1/2 n, 3/2n, 5/2n, 7/2n, e assimpor diante. Estas são as áreas acumuladas àesquerda dos valores amostrais correspondentes.
c.Use a distribuição normal padronizada (Tabela A-2,software ou calculadora) para calcular os escores zcorrespondentes às áreas acumuladas calculadas nopasso (b).
3. Plot de Quantis Normal
Procedimentos para Determinar se os Dados Tem Distribuição Normal - cont
d. Match the original sorted data values with theircorresponding z scores found in Step (c), then plot thepoints ( x, y), where each x is an original sample valueand y is the corresponding z score.
e. Examine the normal quantile plot using these criteria:
If the points do not lie close to a straight line, or if thepoints exhibit some systematic pattern that is not astraight-line pattern, then the data appear to come froma population that does not have a Distribuição Normal.If the pattern of the points is reasonably close to astraight line, then the data appear to come from apopulation that has a Distribuição Normal.
Procedure for Determining Whether Data Have a Distribuição Normal - cont
Interpretation: Because the points lie reasonably close to a straight line and there does not appear to be a systematic pattern that is not a straight-l ine pattern, we conclude that the sample appears to be a normally distributed population.