UNIVERSIDADE FEDERAL DA PARAÍBA Departamento de Estatística Departamento de Estatística Tarciana Tarciana Liberal Liberal
UNIVERSIDADE FEDERAL DA PARAÍBA
Departamento de EstatísticaDepartamento de Estatística
TarcianaTarciana LiberalLiberal
� Quando se estuda uma massa de dados é de freqüenteinteresse resumir as informações de variáveis.
� Costuma-se, freqüentemente, para uma melhorcompreensão dos mesmos, distribuí-los em classes ouintervalos determinando-se o número de indivíduosintervalos determinando-se o número de indivíduospertencentes a cada um dos intervalos.
� Desta forma, um arranjo tabular dos dados,juntamente com as freqüências correspondentes aosmesmos é denominado distribuição de freqüência outabela de freqüência.
1) Dados Brutos: Conjunto de dados que ainda não foramnumericamente organizados, obtidos após a crítica dosvalores.
2) Rol: É um arranjo dos dados brutos em ordem crescente.
3) Amplitude Total (AT): É a diferença entre o maior e omenor valor observado.menor valor observado.
4) Freqüência absoluta ou simples (fi): É o número deobservações que se encontra presente em uma classe ouintervalo especifico.
AT = XMÁX - XMÍN
Σ fi=n
5) Freqüência percentual (fi%): Representa o percentualde um certo valor na amostra.
6) Freqüência simples acumulada (Fi): É a soma dasfreqüências simples das classes ou dos valoresanteriores.
fi%=(fi /n)x100 Σ fi%=100
anteriores.
7) Freqüência percentual acumulada (Fi%): É a soma dasfreqüências relativas percentual das classes ou dosvalores anteriores.
Fi = f1 + f2 + ... + fi
Fi %= f1% + f2% + ... + fi%
� Utilizada em geral para dados de uma variávelqualitativa ou discreta.
� Considera-se os diferentes valores das� Considera-se os diferentes valores dasobservações ou categorias e o número de vezes(freqüência) que cada valor aparece nos dados.
Ex: Considere a idade dos alunos do 3º período do curso deEngenharia civil da UFPB.
Dados Brutos: 20 – 18 – 19 – 22 – 20 – 22 – 23 – 21 – 21 – 21 Rol: 18 – 19 – 20 – 20 – 21 – 21 – 21 – 22 – 22 – 23
IdadeIdade ff ff FF FFIdadeIdade ffii ffii%% FFii FFii%%
1818 11 1010 11 1010
1919 11 1010 22 2020
2020 22 2020 44 4040
2121 33 3030 77 7070
2222 22 2020 99 9090
2323 11 1010 1010 100100
TotalTotal 1010 100100
� De acordo com a Secretária de Turismo da Paraíba,os quatro estados com maior participação no númerode turistas que desembarcaram no aeroporto de JoãoPessoa em 2009 foram: São Paulo (SP), Rio de Janeiro(RJ), Bahia (BA) e Paraná (PR). Os dados de umaamostra de 30 turistas abordados no aeroporto sãoapresentados a seguir:apresentados a seguir:
Qual a classificação dessa variável? Organize os dados em uma tabela com fi, fi%.
SP BA BA SP RJ BA SP SP PR PR
RJ SP SP RJ PR RJ SP RJ SP BA
SP RJ PR SP BA SP PR BA SP SP
� Complete os dados que faltam na distribuição:
Xi ffii ffii%% FFii FFii%%
1111 4444
2222 8888
3333 303030303333 30303030
4444 27272727
5555 15151515 72727272
6666 83838383
7777 10101010 93939393
8888TOTAL 100100100100
� Determinou-se durante 30 dias os erros cometidos por um estagiário na digitação de documentos.
2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 5 5 5 6 6 7 7
a) Em quantos dias ele cometeu menos de 4 erros?b) Qual o percentual de dias com mais de 3 erros.c) O chefe decidiu manter o funcionário se ele
cometer mais de 3 erros em no máximo 30% dos dias. O funcionário será demitido?
� Os dados são agrupados em classes
� Considera-se a freqüência em cada classe (nºde observações pertencentes)
� São mais comuns tabelas com intervalos iguais
Para a construção de uma distribuição de freqüênciapor intervalo é necessário algumas definiçõesadicionais.
8) Número de classes (k): Representa o total de classes da variável.
9) Amplitude das classes (h): É a divisão entre a amplitude total e onúmero de classes. O valor só poderá ser arredondado paramais.
h=AT / k
10) Limites das Classes: São os números extremos das classes.Utilizaremos a seguinte representação:
Li |— Ls ( Compreende todos os valores de Li a Ls, excluindo Ls )
11) Ponto Médio (PM): É a média aritmética entre o limite superior,denotado por Ls, e o limite inferior, denotado por Li. O pontomédio será denotado por PM, onde PM = (Li+Ls)/2
h=AT / k
� Não existe uma fórmula exata para o cálculo donúmero de classes. Seja n o tamanho da amostra,temos duas alternativas
1- Para n ≤ 25, K=5 e para n > 25, temos que K ≈ raiz(n)
2- Fórmula de Sturges:
k = 1 + 3,3 × log10(n)
Dados Brutos: 20,5 Dados Brutos: 20,5 Dados Brutos: 20,5 Dados Brutos: 20,5 ---- 19,5 19,5 19,5 19,5 ---- 15,6 15,6 15,6 15,6 ---- 24,1 24,1 24,1 24,1 ---- 9,9 9,9 9,9 9,9 ---- 15,4 15,4 15,4 15,4 ---- 12,7 12,7 12,7 12,7 ---- 5,4 5,4 5,4 5,4 ---- 17,0 17,0 17,0 17,0 ---- 28,6 28,6 28,6 28,6 ---- 16,9 16,9 16,9 16,9 ---- 7,8 7,8 7,8 7,8 ----23,3 23,3 23,3 23,3 ---- 11,8 11,8 11,8 11,8 ---- 18,4 18,4 18,4 18,4 ---- 13,4 13,4 13,4 13,4 ---- 14,3 14,3 14,3 14,3 ---- 19,2 19,2 19,2 19,2 ---- 9,2 9,2 9,2 9,2 ---- 16,8 16,8 16,8 16,8 ---- 8,8 8,8 8,8 8,8 ----22,1 22,1 22,1 22,1 ---- 20,8 20,8 20,8 20,8 ---- 12,6 12,6 12,6 12,6 ---- 15,915,915,915,9
Rol: Rol: Rol: Rol: 5,4 5,4 5,4 5,4 ---- 7,8 7,8 7,8 7,8 –––– 8,8 8,8 8,8 8,8 –––– 9,2 9,2 9,2 9,2 ---- 9,4 9,4 9,4 9,4 –––– 9,9 9,9 9,9 9,9 –––– 11,8 11,8 11,8 11,8 –––– 12,6 12,6 12,6 12,6 –––– 12,7 12,7 12,7 12,7 –––– 13,4 13,4 13,4 13,4 –––– 14,3 14,3 14,3 14,3 –––– 15,415,415,415,4
15,6 15,6 15,6 15,6 –––– 15,9 15,9 15,9 15,9 –––– 16,8 16,8 16,8 16,8 –––– 16,9 16,9 16,9 16,9 –––– 17,0 17,0 17,0 17,0 –––– 18,4 18,4 18,4 18,4 –––– 19,2 19,2 19,2 19,2 –––– 19,5 19,5 19,5 19,5 –––– 20,5 20,5 20,5 20,5 –––– 20,8 20,8 20,8 20,8 –––– 22,1 22,1 22,1 22,1 ––––24,1 24,1 24,1 24,1 –––– 28,6 28,6 28,6 28,6
Passos:Passos:1. Ordenar as informações2. Variável aleatória Preço é de natureza contínua implicando numa
distribuição intervalar (Por classe).3. Calcular a amplitude total: AT = 28,6 – 5,4 = 23,2.4. Calcular o número de intervalos: k = raiz(25) = 5 .5. Calcular a amplitude do intervalo: h =AT/k = 23,2/5 = 4,64.
Tabela : Distribuição de Freqüência dos Preços do Produto ATabela : Distribuição de Freqüência dos Preços do Produto A
Preço (R$)Preço (R$) ffii ffii%% FFii FFii%%
||––
||––
||––||––
||––
||––
TotalTotal 2525 100100 -- --
� Os dados abaixo representam o valor da hora de trabalhode 25 profissionais de Engenharia de produção na cidadede João Pessoa.
20,5 9,5 15,3 24,1 19,9
15,4 12,7 7,4 15,3 26,2
14,9 7,8 23,3 11,8 18,4
Qual a classificação dessa variável? Organize os dados em uma tabela apropriada.
14,9 7,8 23,3 11,8 18,4
13,4 14,3 16,2 9,2 16,8
9,8 20,1 17,8 12,6 15,9
� Os dados abaixo referem-se aos gastos diários comreparos em máquinas na produção de uma indústria.
� 33,35,35,39,41,41,42,45,47,48,50,52,53,54,55,55,57,59,60,60,61,64,65,65,65,66,66,66,67,68,69,71,73,73,74,74,76,77,77,78,80,81,84,85,85,88,89,91,94,100
� a) Construa a tabela de distribuição de freqüência � a) Construa a tabela de distribuição de freqüência (aproxime para o inteiro mais próximo).
� b) Qual o percentual de dias que obtiveram gastos maiores ou iguais a 73 e inferiores a 93?
� c) O chefe do setor considera o processo satisfatório se o gasto diário não ultrapassou R$ 73,00 em mais de 40% dos dias. O que você pode concluir?
� d) Qual o ponto médio da primeira classe?
� A tabela de frequências abaixo refere-se às notas daturma 03 de Cálculo das probabilidades e estatística I.
NOTASNOTASNOTASNOTAS fifififi
0|---- 2 4
2|---- 4 8
4|---- 6 12
6|---- 8 8
8|---- 10 4
TOTAL 36
� Considerando nota mínima para aprovação igual a 6. Qual foi o percentual de aprovados?
� A professora considera o desempenho de uma turma satisfatório se pelo menos 60% das notas estiverem distribuídas entre 4 (incluso) e 8 (excluso). A turma teve um desempenho satisfatório? Justifique sua resposta.
�
TOTAL 36