Conceitos Fundamentais e Apresentação de dados
Conceitos Fundamentais e Apresentação de dados
1
1.Introdução
A Estatística é uma ciência cujo campo de aplicação estende-se a
muitas áreas do conhecimento humano.
Em sua essência, a Estatística é a ciência que apresenta processos
próprios para coletar, apresentar e interpretar adequadamente conjuntos
de dados, sejam eles numéricos ou não. Pode-se dizer que seu objetivo é
o de apresentar informações sobre dados em análise para que se tenha
maior compreensão dos fatos que os mesmos representam. A Estatística
subdivide-se em três áreas: descritiva, probabilística e inferencial. A
estatística descritiva, como o próprio nome já diz, se preocupa em
descrever os dados. A estatística inferencial, fundamentada na teoria das
probabilidades, se preocupa com a análise destes dados e sua
interpretação.
1.1.Conceitos fundamentais e definições
No estudo da bioestatística, encontramos tipos diferentes de dados
numéricos com variados graus de estruturas e que assumem diversos
valores. Esses dados podem ser trabalhados tanto a nível populacional
quanto, amostral.
População: refere-se a um conjunto de elementos que apresentam
pelo menos uma característica em comum, essa característica deve
delimitar corretamente quais os elementos que representam realmente
essa população. Podemos considerar, como um exemplo de população, a
quantidade de hemácias presente na corrente sanguínea de uma pessoa
adulta, considerando como características comuns: células anucleadas,
presença de hemoglobina, dentre outras.
AULA
1
Conceitos Fundamentais e Apresentação de dados
2
Amostra: refere-se a um sub-conjunto dos elementos que
constituem a população. È valido ressaltar que, a amostra deve ser
significativa, em relação a amostra. Pode-se citar como exemplo, 5mL de
sangue da totalidade de uma pessoa adulta, pois dessa forma, é possível
obter inúmeras estimativas de uma determinada pessoa, por exemplo, o
hemograma completo, a quantidade de neutrófilos, eosinófilos, basófilos,
podendo assim determinar se há um processo alérgico, presença de
helmintos, dentre outras alterações.
Em uma população e em uma amostra, podemos ter vários
elementos, e em muitos casos, devemos analisar os mesmos, com o
propósito de obtermos determinadas estimativas.
Variável: é a característica que será avaliada, medida ou contada
nos elementos de uma população ou de uma amostra. Uma variável pode
ser: o número de pessoas atendidas em uma unidade de saúde, a
quantidade de nascidos vivos em um determinado mês em uma cidade,
dentre outras.
Mas nos estudos envolvendo análise estatística, é necessário
distinguir os tipos de variáveis e como as mesmas são classificadas.
1.2.Tipos de variáveis e de dados
Para uma correta análise dos dados há a necessidade de diferenciar
os tipos de variáveis que o pesquisador está tratando durante a sua
pesquisa, pois assim, é possível realizar uma análise e uma interpretação
correta dos dados.
Variável qualitativa: são variáveis que apresentam como possíveis
valores qualidades ou atributos dos indivíduos pesquisados, essas
variáveis podem ser distribuídas em categorias mutuamente exclusivas
(são aquelas que a ocorrência de um, elimina a possibilidade de
ocorrência do outro), e podem ser expressas de duas formas, ordinal ou
nominal.
Conceitos Fundamentais e Apresentação de dados
3
Variável qualitativa nominal (categórica não ordenada): é o
tipo de variável em que a ordem dos valores não interfere na
interpretação dos dados. Em alguns casos também podemos considerar
uma variável nominal como dicotômica, como por exemplo: sexo
(masculino ou feminino) e doente (sim ou não).
Graficamente podemos representar esse tipo de variável da seguinte
forma:
Figura 1. Representação gráfica de uma variavel qualitativa nominal (1 e 2) do tipo
dicotômicas
Variável qualitativa ordinal (categórica ordenada): é o tipo de
variável em que a ordem dos valores interfere na interpretação dos dados.
Por exemplo: as lesões de uma determinada doenças podem ser
classificadas de acordo com seu nível de severidade, de modo que 1
representa um lesão fatal, 2 é severa, 3 é moderada e 4 é pequena, nesse
exemplo, existe uma ordem natural entre os agrupamentos: um nível
menor representa uma lesão mais séria.
A representação gráfica desse tipo de variável pode ser da seguinte
forma:
Conceitos Fundamentais e Apresentação de dados
4
Figura 2. Representação gráfica de uma variavel qualitativa ordinal.
Variável quantitativa: são variáveis que representam informações
que representam informações expressas em quantidades numéricas, e
pode ser expressas de duas formas, discretas ou contínuas.
Variável quantitativa discreta: são variáveis que somente
assumem valores específicos e são expressos como contagem. São
exemplos desse tipo de variável: número de gestações, número de
nascidos vivos, números de casos de enxaqueca, número de partos por
cesariana, dentre outros. Ao representar graficamente esse tipo de
variável, podemos obter o seguinte gráfico:
Figura 2. Representação gráfica de uma variavel quantitativa do tipo discreta.
Variável quantitativa contínua: são variáveis que podem assumir
qualquer valor inteiro ou não, dentro de uma determinada escala.
Podemos citar como exemplo, pressão arterial expressa em (mmHg),
Bilirrubina total (mg/dL), altura, dentre outros.
Figura 2. Representação gráfica de uma variavel quantitativa do tipo contínua.
Conceitos Fundamentais e Apresentação de dados
5
Foi possível observar pelos conceitos anteriores que há várias
formas de coletar e interpretar os dados de um estudos, os mesmos
podem ser coletados de uma população ou de uma amostra, deste que
esta seja representativa da primeira.
Geralmente os dados coletados em um estudos estão “puros”, e não
apresentam determinadas interpretações, dessa forma, há determinadas
metodologias de estatísticas descritivas que promovem uma melhor
organização dos mesmos.
2.Estatística descritiva
A estatística descritiva é um meio de organizar e resumir o um
grande número de informações, elas promovem um resumo das
características gerais de um conjunto de dados e podem assumir várias
formas, entre as quais, tabelas, gráficos, medidas de tendência central,
medidas de dispersão e medidas de posição.
2.1.Tabelas
Tendo como pré-requisito o conhecimento dos tipos de dados
(nominais ou ordinais; contínuos ou discretos) e os de variaveis
(qualitatitiva e quantitativas), é possível aprender como indentificar as
técnicas estatísticas mais apropriadas para descrever cada tipo de dado.
Embora um certo volume de informação seja perdido quando as
informações são resumidas, um grande volume também pode ser ganho.
Uma tabela talves seja a o meio mais simples de se resumir um conjunto
de observações e pode ser usada para todos os tipos de dados numéricos.
Conceitos Fundamentais e Apresentação de dados
6
2.1.1.Distribuição de frequências
Uma tabela comumente utilizada para avaliar dados é chamada de
distribuição de frequências, que consiste de um conjunto de classes ou
categorias junto com contagens numéricas que correspondem a cada
conjunto para dados nominais e ordinais. Como ilustração desse formato,
temos a tabela 1, a qual apresenta o número de individuos (contagem
numérica) que apresentaram e que não apresentaram dengue tipo 1
(classe ou categoria), para os primeiros 2560 atendimentos registrados,
para tal patologia, em uma unidade de pronto atendimento no mês de
janeiro na cidade do Rio de Janeiro.
Tabela 1. Casos de dengue tipo 1, para os primeiros 2560 atendimentos registrados,
para tal patologia, em uma unidade de pronto atendimento no mês de janeiro na cidade
do Rio de Janeiro. (Título)
Sintomas da dengue tipo 1 Número de Indivíduos →cabeçalho
SIM 246 →corpo
NÃO 2314
Na análise da tabela supracitada, é possível relatar algumas
pertinências sobre a mesma. Uma tabela deve apresentar sempre na
parte superior o título, o qual deve ser auto explicativo, ou seja, indicar
todas as informações da tabela, deve apresentar um cabeçalho, o qual
indica as variáveis em estudo,e o corpo, onde está presente os dados das
variáveis analisadas. Uma tabela não apresenta linhas na vertical, pois a
presença dessas linhas indicaria uma outra representação, denominada de
quadro. Linhas horizontais no interior no corpo da tabela podem ser
adicionadas, mas não devem, para não comprometer a estrutura da
mesma.
Para exibir dados discretos ou contínuos na forma de uma
distribuição de frequências precisa-se dividir o intervalo de valores da
Conceitos Fundamentais e Apresentação de dados
7
observações em uma série de intervalos não sobrepostos e distintos.
Como os dados discretos e os contínuos apresentam uma quantidade
maior de classes, muitas vezes as tabelas de coletas desses tipos de
dados são cansativas e não dão ao leitor uma visão rápida de uma correta
interpretação. Para isso é necessário que os dados sejam apresentados
em uma tabela de distribuição de frequências.
Imagine que, que para dar uma ideia geral sobre o peso ao nascer
de nascidos vivos, o pesquisador era apresentar não os pesos observados,
mas o número de nascidos vivos por faixas de peso. Deve, então,
construir uma tabela de distribuição de frequências.
Peso ao nascer de nascidos vivos, em quilogramas (Kg)
2,522 3,200 1,900 4,100 4,600 3,400 2,150 2,700
2,720 3,720 3,600 2,400 1,720 3,400 3,300 2,450
3.125 2,800 3,200 2,700 2,750 1,570 3,250
2,250 2,900 3,300 2,450 4,200 3,800 3,150
3,220 2,950 2,900 3,400 2,100 2,700 2,800
3,000 2,480 2,500 2,400 4,450 2,900 2,900
3,725 3,800 3,600 3,120 2,900 3,700 2,500
2,890 2,500 2,500 3,400 2,920 2,120 2,900
3,110 3,550 2,300 3,200 2,720 3,150 3,200
3,520 3,000 2,950 2,700 2,900 2,400 3,200
3,100 4,100 3,000 3,150 2,000 3,450 3,200
3,200 3,200 3,750 2,800 2,720 3,120 2,800
2,780 3,450 3,150 2,700 2,480 2,120 2,500
3,155 3,100 3,200 3,300 3,900 2,450 2,480
Pelos dados do quadro acima não é possível tirar grandes
conclusões, apenas verificar que há 100 dados coletados (observações) e
que o valor de 4,600 Kg é o maior e o de 1,570 é o menor.
Conceitos Fundamentais e Apresentação de dados
8
O primeiro passo, é definir as faixas de peso, essas faixas recebem,
nesse caso, nome de classes. Pelos dados apresentados é possível é
possível verificar que no quadro 1, o menor valor é 1,570 Kg e o maior é
4,600 kg. Arbitrariamente podemos definir classes de 1,5 a 2,0 Kg, de 2,0
a 2,5 kg, assim sucessivamente, formando sete classes, como mostra o
esquema abaixo.
1,5 ι— 2,0
2,0 ι— 2,5
2,5 ι— 3,0
3,0 ι— 3,5
3,5 ι— 4,0
4,0 ι— 4,5
4,5 ι— 5,0
A representação de cada classe é dada da seguinte forma, a
representação 1,5 ι— 2,0 significa que nessa classe, são alocados todos os
valores de 1,5 (incluindo o mesmo) até valor os valores de 1,999999...,
pois o símbolo (ι— ), significa que o intervalo é fechado em 1,5 e aberto
em 2,0, indicando que o valor 2,0 não pertence a essa classe; na classe
de 2,0 a 2,5 Kg, são alocados os nascidos que apresentam desde 2,0 até
os que nasceram com 2,499999... e assim por diante. Dessa forma, cada
classe cobre um intervalo de 0,5 Kg. A distribuição da frequência absoluta
para a variável peso ao nascer obtida a partir do quadro pode ser
representada na tabela 2.
A frequência absoluta de uma classe ou de um valor individual é o
número de observações correspondentes a essa classe ou a esse valor. De
acordo com o quadro, podemos verificar que, três (3) crianças estavam
no intervalo de 1,5 ι— 2,0, e 16 crianças estavam no intervalo de 2,0 ι—
2,5, resumindo a frequência absoluta representa o valor absoluto da
quantidade de representantes de uma determinada variável para um certo
intervalo.
Conceitos Fundamentais e Apresentação de dados
9
Tabela 2. Frequência absoluta de nascidos vivos segundo o peso ao nascer, em
quilogramas (Kg)
Classe Frequência absoluta
1,5 ι— 2,0 3
2,0 ι— 2,5 16
2,5 ι— 3,0 31
3,0 ι— 3,5 34
3,5 ι— 4,0 11
4,0 ι— 4,5 4
4,5 ι— 5,0 1
Soma 100
Algumas vezes é útil conhecer a proporção dos valores situados em
um determinado intervalo de uma distribuição de frequência, em vez
somente do número absoluto. A frequência relativa para um intervalo é
a proporção do número total de observações que nele aparece. Ela é
calculada ao dividir-se o número de valores dentro do intervalo pelo
número total de valores na tabela. A frequência relativa pode ser
calculada da seguinte forma, tomando como exemplo a primeira classe
(1,5 ι—2,0), podemos obter dividindo o valor 3 pela soma total 100 e
multiplicando por 100 para obter o valor expresso em percentagem, 3%,
analogicamente a frequência relativa da classe 2,0 ι—2,5 é (16/100) x
100 = 16%, as frequências relativas para todos os intervalos em uma
tabela somam 100%. Uma das grandes aplicabilidades das frequências
relativas, é comparar conjuntos de dados que contenham números
desiguais de observações, as frequências relativas para os dados do
quadro estão representados na tabela 3.
Conceitos Fundamentais e Apresentação de dados
10
Tabela 3. Frequência absoluta e frequência relativa de nascidos vivos segundo o peso ao
nascer, em quilogramas (Kg)
Classe Frequência
absoluta
Frequência
relativa (%)
1,5 ι— 2,0 3 3
2,0 ι— 2,5 16 16
2,5 ι— 3,0 31 31
3,0 ι— 3,5 34 34
3,5 ι— 4,0 11 11
4,0 ι— 4,5 4 4
4,5 ι— 5,0 1 1
Soma 100 100
Outra frequência que pode ser estimada, é a frequência relativa
acumulada, a qual se refere a percentagem do número total de
observações que tem um valor menor ou igual ao limite superior do
intervalo. A frequência relativa acumulada é calculada pela soma das
frequências relativas para o intervalo especificado todas as outras classes
anteriores. Assim para a frequência relativa acumulada do segundo
intervalo 2,0 ι— 2,5 é 3+16=19%, analogicamente a frequência relativa
acumulada do terceiro intervalo 2,5 ι— 3,0 é 3+16+31=50%. Tal como
as frequência relativas as frequências relativas acumuladas também
podem ser utilizadas para números desiguais de observações. Mas essas
frequências também apresentam resultados satisfatórios que promovem
várias interpretações, como por exemplo, 50% das crianças, da amostra
dos dados, apresentam peso entre 1,5 a 2,9 Kg. Os dados referentes a
frequência relativa acumulada dos dados do quadro estão representadas
na tabela 4.
Conceitos Fundamentais e Apresentação de dados
11
Tabela 4. Frequência absoluta, frequência relativa e frequência relativa acumulada de
nascidos vivos segundo o peso ao nascer, em quilogramas (Kg)
Classe Frequência
absoluta
Frequência
relativa (%)
Frequência relativa
acumulada (%)
1,5 ι— 2,0 3 3 3
2,0 ι— 2,5 16 16 19
2,5 ι— 3,0 31 31 50
3,0 ι— 3,5 34 34 84
3,5 ι— 4,0 11 11 95
4,0 ι— 4,5 4 4 99
4,5 ι— 5,0 1 1 100
Soma 100 100 -
Depois de construir uma distribuição de frequências, pode-se incluir
outras características adicionais que ajudaram a fornecer um melhor
entendimento dos dados, como por exemplo o ponto médio. O ponto
médio de uma classe é a soma dos limites superiores e inferiores da
classe dividida por dois.
2classe) da superior ( l i m i t e classe) da inferior ( l i m i t e médio ponto
O ponto médio para a primeira classe é (1,5+2,0)/2=1,75, depois
de encontra o ponto médio da primeira classe, pode-se encontrar os
pontos médios das classes seguintes, adicionando o valor do intervalo de
classe ao valor do primeiro ponto médio encontrado. Por exemplo, se o
primeiro ponto médio é 1,75 e o intervalo da classe é 0,5, então os
pontos médios restantes são:
Conceitos Fundamentais e Apresentação de dados
12
1,75 + 0,5 = 2,25
2,25 + 0,5 = 2,75
2,75 + 0,5 = 3,25
3,25 + 0,5 = 3,75
3,75 + 0,5 = 4,25
4,25 + 0,5 = 4,75
Tabela 5. Ponto médio, Frequência absoluta, frequência relativa e frequência relativa
acumulada de nascidos vivos segundo o peso ao nascer, em quilogramas (Kg)
Classe Ponto
médio
Frequência
absoluta
Frequência
relativa (%)
Frequência relativa
acumulada (%)
1,5 ι— 2,0 1,75 3 3 3
2,0 ι— 2,5 2,25 16 16 19
2,5 ι— 3,0 2,75 31 31 50
3,0 ι— 3,5 3,25 34 34 84
3,5 ι— 4,0 3,75 11 11 95
4,0 ι— 4,5 4,25 4 4 99
4,5 ι— 5,0 4,75 1 1 100
Soma 100 100 -
Como obter o intervalo de classe e o número de classes em uma
distribuição de frequências?
Conceitos Fundamentais e Apresentação de dados
13
Supondo por exemplo, a estatura em cm de 40 pessoas atendidas
durante um dia em uma unidade de saúde.
166 160 161 150 162 160 165 167 164 160
162 168 161 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161
A partir desses dados é possível obter o rol dos mesmos, o rol
refere-se a ordenação dos dados de uma determinada amostra, essa
ordenação é feita em ordem crescente:
A partir desse momento, podemos verificar o menor e o maior valor
da amostra, e também obter algumas estimativas.
Amplitude amostral (AA), é a diferença entre o maior e o menor
valor da amostra, neste caso temos: 173 – 150 = 23.
O número de classes (k), também pode se estimado, e para obter
o mesmo, há várias expressões:
Raiz quadrada: k=√n
Log (Sturges): k= 1+(3,22 x log n)
In (Milone): k=-1+(2 x ln n)
k=1 +10dAt
O valor de n corresponde ao número de observações da amostra, no
caso do exemplo n é igual a 40.
Utilizando a expressão k=√n, temos k=√40 que é igual a 6,32, esse
valor indica que para a elaboração dessa tabela de distribuição de
frequência, será necessário a obtenção de seis (6) classes.
E qual será a amplitude de cada intervalo de classe (h), para obter
tal estimativa utiliza-se a seguinte expressão, h=(AA)/k
Conceitos Fundamentais e Apresentação de dados
14
Dessa forma, temos h=(23/6) = 3,83 ≅ 4
Com esses dados podemos chegar as seguintes conclusões antes de
elaborarmos a tabela de frequência, a amostra contém 40 observações,
para elaborar a tabela de frequência temos que obter seis classes onde o
intervalo entre cada uma das classes é de 4 cm, tendo como limite inferior
para a primeira classe o valor de 150 e o limite superior para a ultima
classe o é 174 (Tabela 6).
Tabela 6. Ponto médio, frequência absoluta, frequência relativa e frequência relativa
acumulada da estatura de 40 pessoas atendidas durante um dia em uma unidade de
saúde
Classe Ponto
médio
Frequência
absoluta
Frequência
relativa (%)
Frequência relativa
acumulada (%)
150 ι— 154 152 4 10,00 10,00
154 ι— 158 156 9 22,50 32,50
158 ι— 162 160 11 27,50 60,00
162 ι— 166 164 8 20,00 80,00
166 ι— 170 168 5 12,50 92,50
170 ι— 174 172 3 7,50 100,00
Soma 40 100% -
2.1.2.Tabelas de contingência
Muitas vezes os elementos de uma amostra ou de uma população
são classificados de acordo com dois fatores, e os dados devem ser então
apresentados em tabelas de contingência. As tabelas de contingência
são utilizadas para estudar a relação entre duas variáveis categóricas
(qualitativas) descrevendo a frequências das categorias de uma das
variáveis com as categorias de outra. Os dados de uma tabela de
Conceitos Fundamentais e Apresentação de dados
15
contingência são apresentados em tabelas de dupla entrada, cada entrada
relativa a um dos fatores. Como exemplo, podemos observar a tabela 7,
que representa o número de nascidos vivos registrados entre os anos de
2008 e 2010 no Brasil. É possível verificar que o número de nascidos vivos
está registrado segundo dois fatores: o ano de registro e o sexo.
Tabela 7. Nascidos vivos registrados segundo o ano de registro e o sexo (IBGE, 2011).
ano de registro sexo
total masculino feminino
2008 1 435 103 1 362 652 2 797 755
2009 1 415 650 1 348 674 2 764 324
2010 1 414 313 1 346 288 2 760 601
As tabelas de contingência podem apresentar tanto a frequência
absoluta de uma determinada variável, quanto a frequência relativa. A
frequência relativa, em alguns casos, dão estimativas de riscos, isto é,
a probabilidade de ocorrência de um determinado dano, podemos
observar esse fato na tabela 8.
Tabela 8. Recém nascidos segundo a época de contagio de rubéola na gestante e a
condição normal ou mal formado, em uma amostra de 104 gestantes, atendidas em uma
unidade de saúde.
época de
contagio
Condição total Frequência relativa
de mal formados Normal Mal
formado
Até o 3º mês 36 14 50 28,0%
Após o 3º mês 51 3 54 5,6%
Conceitos Fundamentais e Apresentação de dados
16
As frequências relativas apresentadas na tabela supracitada
estimam o risco de um recém-nascido ser defeituoso em função da época
em que a gestante se contagio com a rubéola. Note que a frequência
relativa de defeituosos (risco) é maior quando a gestante entrou em
contato com o vírus da rubéola no primeiro trimestre de gestação. Dessa
forma, é possível concluir que o contágio com a rubéola é considerado um
fator de risco na ocorrência de recém-nascidos defeituosos.
Conceitos Fundamentais e Apresentação de dados
17
2.2.Gráficos
Uma outra maneira para resumir e apresentar os dados numéricos,
é pelo emprego de gráficos. Os gráficos devem ser elaborados de um
modo a transmitirem os padrões gerais de um conjunto de observações
em uma simples visualização.
2.1.1.Gráficos de barras
Os gráficos em barras são os mais utilizados para exibir uma
distribuição de frequência para dados nominais ou ordinais. Em um gráfico
de barras, as várias categorias, nas quais as observações são
classificadas, estão apresentadas ao longo de um eixo horizontal ou
vertical. É recomendável que cada coluna conserve uma distância entre si
de aproximadamente 2/3 da largura da base de cada barra, evidenciando
deste modo, a não continuidade na sequência dos dados.
Tabela 9. Internações hospitalares no sistema único de saúde (SUS) por grupos de
causas em 2009, no Brasil (IBGE, 2010).
Espécie Frequência absoluta Frequência relativa
Doenças infecciosas e parasitárias 928 304 8.34
Neoplasias 575 371 5.18
Transtornos mentais e comportamentais 275 286 2.48
Doenças do aparelho circulatório 1 139 140 10.24
Doenças do aparelho respiratório 1 534 953 13.79
Doenças do aparelho digestório 996 109 8.95
Doenças do aparelho urinário 758 755 6.81
Gravidez e parto 2 403 986 21.60
Causas externas 884 665 7.95
Demais causas 1 632 240 14.66
AULA
2
Conceitos Fundamentais e Apresentação de dados
18
A tabela acima apresenta dados nominais, seguido de suas
frequências absolutas e relativas. Apresentando esses dados em forma de
gráfico de colunas os mesmos poderão ser representados da seguinte
forma:
Figura 1. Internações hospitalares no sistema único de saúde (SUS) por grupos de
causas no ano de 2009, no Brasil.
Ao denominar um gráfico, o nome do mesmo sempre vem precedido
de Figura, e a sua denominação sempre deve estar abaixo do mesmo.
2.1.2.Gráficos de setores
O gráfico de setores também é utilizado para apresentar variáveis
nominais e ordinais, para elaborar um gráfico de setores, primeiro, é
necessário traçar uma circunferência, a qual, em sua totalidade,
corresponde a 100%. Dentro dessa circunferência, devem-se ser
representadas as categorias das variáveis em estudo. Para isso, toma-se a
frequência relativa de cada variável e calcula-se o ângulo central, da
seguinte maneira, se 100% correspondem a 360º, uma categoria com
frequência relativa f% terá um ângulo central x.
Conceitos Fundamentais e Apresentação de dados
19
Figura 2. Internações hospitalares no sistema único de saúde (SUS) por grupos de
causas no ano de 2009, no Brasil (IBGE, 2010).
2.1.3.Histogramas
Enquanto um gráfico de barras configura a representação de uma
distribuição de frequência tanto para dados nominais quanto ordinais, um
histograma mostra uma distribuição de frequências para dados discretos
ou contínuos.
Por definição, um histograma de frequência é um diagrama de
que representa a distribuição de frequência de um conjunto de dados. A
escala horizontal é quantitativa e mede os valores dos dados. A escala
vertical mede as frequências das classes e as barras consecutivas
devem ser encostadas umas as outras.
Em virtude das barras consecutivas no histograma estarem
encostadas, elas devem começar e terminar nas fronteiras da classe ao
invés de seus limites. As fronteiras das classes são números que separam
as classes sem formar lacunas entre elas
Para elaborarmos um histograma de frequência, vamos tomar como
base os dados da tabela 6.
Conceitos Fundamentais e Apresentação de dados
20
Tabela 6. Ponto médio, frequência absoluta, frequência relativa e frequência relativa
acumulada da estatura de 40 pessoas atendidas durante um dia em uma unidade de
saúde.
Classe Ponto
médio
Frequência
absoluta
Frequência
relativa (%)
Frequência relativa
acumulada (%)
150 ι— 154 152 4 10,00 10,00
154 ι— 158 156 9 22,50 32,50
158 ι— 162 160 11 27,50 60,00
162 ι— 166 164 8 20,00 80,00
166 ι— 170 168 5 12,50 92,50
170 ι— 174 172 3 7,50 100,00
Soma 40 100% -
O primeiro passo para elaborarmos um histograma de frequência,
devemos encontrar as fronteiras de classes. Para encontrar esse valor
devemos fazer o seguinte, obter a diferença entre o valor do limite
superior que pertence a primeira classe e o limite inferior da segunda
classe, por exemplo, a primeira classe é de 150 ι— 154, mas o valor 154
apresenta o intervalo aberto então não pertence a essa classe, dessa
forma, devemos utilizar o próximo número inteiro que pertence a essa
classe, ou seja, 153, assim temos, 154 (limite inferior da segunda
classe) – 153 (valor abaixo o limite superior da primeira classe,
que é inteiro) resultando nesse caso o valor 1. Metade dessa distância é
0,5, então as fronteiras, inferior e superior, da primeira classe são: 150 -
0,5 = 149,5 e 153 + 0,5 = 153,5.
2.1.3.Polígono de frequência
Conceitos Fundamentais e Apresentação de dados
21
O polígono de frequência é similar ao histograma, utiliza os mesmos
dois eixos que um histograma e é construído ao se colocar um ponto no
centro de cada um dos intervalos de forma tal que a altura do ponto seja
igual a frequência absoluta ou a frequência relativa associada ao
intervalo.Pontos também são colocados no eixo horizontal e é feita ligação
entre o ponto da vertical com o correspondente da vertical. Para fechar o
polígono une-se os pontos.