ANALISANDO DADOS PROF:MOISES Vivemos num mundo repleto de dados. Sua capacidade em lidar com eles, transformando-os em informações importantes, é o que vai diferenciar você das demais pessoas no mundo contemporâneo. Da leitura crítica das notícias de um jornal até a decisão de fazer um determinado investimento, passando por situações críticas no seu local de trabalho, a capacidade de se obter, organizar, representar, descrever e analisar dados requer o conhecimento de métodos e técnicas que permitam extrair o máximo que eles podem oferecer. Se entendermos Estatística como a Ciência dos Dados, será de grande valia o domínio que seu corpo de conhecimento pode nos oferecer. Primeiramente, como ponto de partida, podemos dividir a Estatística em duas áreas: a Descritiva e a Inferencial. A Estatística Descritiva postula os métodos e técnicas relacionadas à obtenção, representação, mensuração, análise e conclusões a partir de um conjunto de dados oriundos de uma população ou de uma amostra. Quando os dados são oriundos de uma população, podemos descrevê-la através de medidas estatísticas adequadas vis a vis o nível de mensuração das características estudadas. Nesse caso dizemos que o conhecimento da população em apreço é, por extensão, o conhecimento das medidas a ela associadas. Não há erro no processo, a não ser aqueles devidos à informação quando da obtenção dos dados. A aritmética, através de suas operações básicas, é suficiente para os cálculos necessários à obtenção das medidas estatísticas. No entanto, quando os dados são extraídos de uma amostra sua descrição segue as mesmas técnicas e métodos utilizados para dados populacionais. A análise, entretanto, já passa a ser feita com base nos métodos inferenciais. A Estatística Inferencial postula um conjunto de técnicas que permitem utilizar dados oriundos de uma amostra para generalizações sobre a população. Constitui esse conjunto de técnicas: a determinação do número de observações (tamanho da amostra); o esquema de seleção das unidades observacionais; o cálculo das medidas estatísticas; a determinação da confiança nas estimativas; a significância dos testes estatísticos; a precisão das estimativas; dentre outras. Essa generalização é feita a partir do processo de estimação das medidas estatísticas que podem ser calculadas, porém não sem antes se antecipar um grau de certeza de que a amostra esteja fornecendo os dados que seriam de se esperar caso toda a população fosse estudada. Nesse caso, o ramo da matemática que será utilizado para se avaliar tal grau de certeza é a probabilidade. Com ela teremos condições de mensurar a fidedignidade de cada inferência feita com base na amostra. Antes de começarmos a estudar os métodos estatísticos que nos permitirão analisar dados, sejam eles qualitativos ou quantitativos, é importante introduzirmos alguns conceitos preliminares a fim não apenas de dar nomes aos instrumentos, mas também adequar e eqüalizar a terminologia a ser utilizada ao longo do curso. Você verá que uma nova linguagem será desenvolvida ao longo desse curso e o seu domínio é fundamental para um melhor aproveitamento.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
ANALISANDO DADOS PROF:MOISES
Vivemos num mundo repleto de dados. Sua capacidade em lidar com eles,
transformando-os em informações importantes, é o que vai diferenciar você das demais pessoas
no mundo contemporâneo. Da leitura crítica das notícias de um jornal até a decisão de fazer um
determinado investimento, passando por situações críticas no seu local de trabalho, a
capacidade de se obter, organizar, representar, descrever e analisar dados requer o
conhecimento de métodos e técnicas que permitam extrair o máximo que eles podem oferecer.
Se entendermos Estatística como a Ciência dos Dados, será de grande valia o domínio que
seu corpo de conhecimento pode nos oferecer. Primeiramente, como ponto de partida, podemos
dividir a Estatística em duas áreas: a Descritiva e a Inferencial.
A Estatística Descritiva postula os métodos e técnicas relacionadas à obtenção,
representação, mensuração, análise e conclusões a partir de um conjunto de dados oriundos de
uma população ou de uma amostra. Quando os dados são oriundos de uma população, podemos
descrevê-la através de medidas estatísticas adequadas vis a vis o nível de mensuração das
características estudadas. Nesse caso dizemos que o conhecimento da população em apreço é,
por extensão, o conhecimento das medidas a ela associadas. Não há erro no processo, a não ser
aqueles devidos à informação quando da obtenção dos dados. A aritmética, através de suas
operações básicas, é suficiente para os cálculos necessários à obtenção das medidas estatísticas.
No entanto, quando os dados são extraídos de uma amostra sua descrição segue as mesmas
técnicas e métodos utilizados para dados populacionais. A análise, entretanto, já passa a ser
feita com base nos métodos inferenciais.
A Estatística Inferencial postula um conjunto de técnicas que permitem utilizar dados
oriundos de uma amostra para generalizações sobre a população. Constitui esse conjunto de
técnicas: a determinação do número de observações (tamanho da amostra); o esquema de
seleção das unidades observacionais; o cálculo das medidas estatísticas; a determinação da
confiança nas estimativas; a significância dos testes estatísticos; a precisão das estimativas;
dentre outras. Essa generalização é feita a partir do processo de estimação das medidas
estatísticas que podem ser calculadas, porém não sem antes se antecipar um grau de certeza de
que a amostra esteja fornecendo os dados que seriam de se esperar caso toda a população fosse
estudada. Nesse caso, o ramo da matemática que será utilizado para se avaliar tal grau de
certeza é a probabilidade. Com ela teremos condições de mensurar a fidedignidade de cada
inferência feita com base na amostra.
Antes de começarmos a estudar os métodos estatísticos que nos permitirão analisar
dados, sejam eles qualitativos ou quantitativos, é importante introduzirmos alguns conceitos
preliminares a fim não apenas de dar nomes aos instrumentos, mas também adequar e eqüalizar
a terminologia a ser utilizada ao longo do curso. Você verá que uma nova linguagem será
desenvolvida ao longo desse curso e o seu domínio é fundamental para um melhor
aproveitamento.
DEFINIÇÕES E CONCEITOS BÁSICOS
1. PopulaçãoÉ o conjunto de todos os elementos (unidades observacionais) que constituem a abrangência do estudo. Exemplos:1.1 Conjunto dos 5507 municípios brasileiros.1.2 Conjunto constituído pelos alunos deste curso.1.3 Conjunto dos discursos do presidente da república desde a sua posse.
2. AmostraÉ um subconjunto da população.Exemplos:2.1 Conjunto dos municípios da Região Nordeste.2.2 Alunos do Estado do Rio de Janeiro.2.3 Discursos proferidos em recintos abertos.
3. Unidade ObservávelÉ a portadora da(s) característica(s), ou propriedade(s), que se deseja investigar.Exemplos:3.1 Cada um dos 5507 municípios brasileiros.3.2 Cada aluno deste curso.3.3 Cada discurso presidencial.
4. VariávelÉ a representação simbólica da característica ou propriedade que se deseja investigar.Exemplos:4.1 Receita tributária municipal arrecadada no ano passado.4.2 Gênero dos alunos.4.3 Emprego da expressão “jamais neste país”.
5. Medidas EstatísticasSão os parâmetros da população, ou amostra, em apreço. Permitem reduzir a totalidade dos dados a apenas um certo número de medidas.
Exemplos:5.1 Receita tributária municipal média.5.2 Percentagem de mulheres.5.3 Freqüência com que a expressão “jamais neste país” foi utilizada em cada discurso.
6. InferênciaÉ o processo de generalizar na população resultados obtidos em uma amostra.Exemplos:6.1 Como a receita tributária municipal média da Região Sudeste é de $150.000.000
podemos concluir que no Brasil esta receita é de $150.000.000, em média.
6.2 Como a turma do Rio de Janeiro tem 40% de mulheres, concluímos que todas as turmas deste curso tem 40% de mulheres.
6.3 Como o presidente utilizou a expressão “jamais neste país” 55 vezes, em média, nos discursos em recintos abertos desde a sua posse, podemos concluir que seus discursos utilizam, em média, 55 vezes esta expressão em seus discursos.
2
MEDIDAS E NÍVEIS DE MENSURAÇÃO
INTRODUÇÃO
Thorndike (1918) já dizia que tudo que existe no universo existe num certo montante, e
que o conhecimento completo daquilo que se deseja investigar requer o conhecimento de sua
quantidade, bem como o de sua qualidade. Compreende-se daí a necessidade de se desenvolver
um referencial teórico capaz de dotar o gerente contemporâneo de um instrumental básico que
norteará sua tarefa de conhecer, em sua plenitude, o objeto de sua investigação através da
medida de sua quantidade e qualidade.
Para melhor se entender a finalidade da teoria das medidas vou adaptar dois exemplos
fornecidos por Lord & Novick (1968, p. 16). Suponha que se deseje medir a altura de uma pessoa.
A fim de se obter o valor numérico desta (ou de qualquer outra) característica, define-se um
procedimento de três etapas. Primeiro precisamos definir o objeto portador da característica: a
unidade observável. Segundo, precisamos definir a característica, ou propriedade, a ser medida:
no caso a altura da pessoa, definida como a distância entre a planta do pé e o alto da cabeça do
indivíduo. Finalmente, precisamos identificar a regra que vai associar o valor numérico à
propriedade da unidade observável, no caso uma fita métrica, ou outro instrumento de medida
mais preciso.
Considere agora um segundo exemplo. Suponha que a característica a ser medida seja a
proficiência matemática de uma pessoa. A regra poderia ser definida como a aplicação de um
teste constituído por algumas questões de matemática. Uma possível medida de proficiência
poderia ser expressa pelo número de questões corretas respondidas. Outra poderia ser a
porcentagem de respostas corretas.
Notamos, então, que ao contrário das duas primeiras etapas, fixas para cada processo de
mensuração de uma certa característica, a terceira etapa, que estabelece a unidade de medida a
ser empregada, não é unicamente determinada.
Não existe até hoje uma definição formal de medida que seja universalmente aceita entre
os pesquisadores da área. Weitzenhoffer (1951) descreve medida como “... uma operação
realizada no mundo físico por um observador”. Para Stevens (1946), medida é “o ato de assinalar
números a objetos ou eventos de acordo com regras”. Torgerson (1958) e Lord & Novick (1968)
aprimoraram a definição fornecida por Stevens (1946) observando que as medidas devem ser
aplicadas às propriedades dos objetos, ao invés dos objetos em si. Nos exemplos acima, as
medidas definidas na etapa três referiam-se às propriedades (características) definidas na etapa
anterior, ou seja, não era o sujeito o objeto da média, mas a sua altura e a sua proficiência.
Há que se distinguir entre uma medida física e uma medida social ou comportamental. No
primeiro caso, o objeto a ser investigado pode ser medido infinitas vezes obtendo-se resultados
congruentes, enquanto no segundo, fatores externos influenciam o resultado da medida tornando-
a mais ou menos fidedigna em função da sua consistência. Nos exemplos acima, a altura de um
3
sujeito pode ser medida tantas vezes quanto se queira chegando-se a um resultado único. No
segundo exemplo muito provavelmente chegaremos a resultados diferentes na medida em que
mudamos as questões do instrumento de avaliação, o que nos levará a mensurações diferentes do
nível de proficiência de cada unidade observável.
Finalmente, em geral uma medida física pode ser diretamente observada (altura, peso,
distância, etc.), enquanto uma medida em ciências sociais é fruto de uma construção (composição)
de conceitos latentes (não observacionais), feita através de fatores (ou indicadores) diretamente
observáveis. Por exemplo, a altura de um sujeito é imediatamente conhecida terminado o processo
de mensuração, enquanto a verdadeira proficiência matemática de um sujeito é estimada através
de um índice construído em função dos resultados observados do sujeito em cada questão do
exame (certo/errado).
Conseqüentemente, uma medida comportamental está sempre associada a um erro de
medida, de modo que a verdadeira e desconhecida medida de um sujeito, tomada por um índice
constituído de variáveis observacionais, será a soma de dois componentes: o valor do índice
observado e um erro de medida. A este índice teórico chamamos conceito ou construção. No caso
da proficiência, cada unidade observável tem a sua própria medida de proficiência, ξ, e o que o
exame faz é tentar estimá-la, através da nota, X, obtida no exame. Esta nota, no entanto, deve ser
considerada como uma aproximação desta proficiência face ao possível erro de medida, ε,
associado à essa nota (ou você acha que a sua nota reflete sempre o seu nível de conhecimento?).
Sendo assim, podemos concluir que
.ε+=ξ X
4
1. Níveis de Mensuração
Como visto anteriormente, a associação de números a propriedade(s) de indivíduos deve
seguir alguma regra sistemática preestabelecida e representativa do fenômeno estudado. Ao
desenvolvimento de tais regras dá-se o nome de escala métrica. Conseqüentemente, medir as
propriedades de um indivíduo, ou unidade, é em última forma estabelecer seu posicionamento
relativo na escala métrica definida. Por exemplo, o nível de desenvolvimento econômico de um
país pode ser obtido através de um índice, geralmente consagrado ou preestabelecido por
agências internacionais. A distribuição dos países de acordo com tal objeto permite não apenas
comparações, mas também a ordenação para fins de classificação e transformações de seus
valores para outra escala métrica equivalente. Como outro exemplo, suponha que um teste com
dez itens, do tipo certo ou errado, seja administrado a uma grande amostra de pessoas. Caso o
interesse seja medir a proficiência das pessoas, uma possível escala métrica poderia ser definida
como o número de itens respondidos corretamente, o que levaria a escala a receber valores
inteiros entre zero e dez. Porém, como a etapa três, das regras descritas acima, não é única, a
escala métrica também não é unicamente determinada, sendo passível de transformação
matemática desde que não altere a ordenação dos indivíduos. Possíveis transformações seriam,
por exemplo, elevar a nota, expressa pelo total de pontos, ao quadrado, extrair a sua raiz
quadrada, ou ainda calcular o logaritmo da razão entre o número de itens respondidos
corretamente e o número de itens respondidos incorretamente. No primeiro caso a escala varia
entre zero e 100, no segundo entre zero e 10 , e no último caso a escala seria constituída de
valores obtidos no conjunto dos números reais (entre -∞ e +∞).
Uma escala fica perfeitamente determinada quando fixamos uma origem e uma unidade.
Na matemática, geralmente a origem é fixada em zero por uma questão de conveniência. Da
mesma forma a unidade é geralmente unitária. Na estatística, também por questão de
conveniência, a origem de uma escala pode ser centrada na média e a unidade estabelecida como
desvio em relação à media.
A classificação das escalas métricas não é única. Diferentes autores classificam os
fenômenos de modo diferente. Stevens (1946) define quatro níveis de mensuração: nominal,
ordinal, intervalar e de razão. Torgerson (1958) não considera as variáveis nominais como
mensuração pela ausência de uma origem e unidade, mas distingue dois níveis ordinais. Coombs
(1950), por sua vez, define um nível de mensuração intermediário entre o ordinal e o intervalar.
Neste ponto, o aluno é encorajado a ler as citações acima e criar a sua opinião própria a respeito
da taxonomia que melhor lhe convier. No entanto, para efeitos deste curso, será adotada a
classificação proposta por Stevens, embora se reconheça que algumas limitações existam.
5
Variáveis nominais e ordinais são também conhecidas como qualitativas enquanto as variáveis
intervalares e de razão são denominadas de quantitativas, ou de escala.
1.1 Escala Nominal
A escala de medidas com o nível mais baixo de mensuração é obtida quando as variáveis
são utilizadas simplesmente para classificar os sujeitos (objetos). Nesse caso os “valores”
assumidos pela variável são meramente rótulos, isto é, os números associados às diferentes
categorias mutuamente exclusivas e exaustivas assumidas pela variável não possuem qualquer tipo
de tratamento matemático. Qualquer conjunto de números pode ser utilizado para substituir os
“valores” originais, desde que se mantenha a relação unívoca entre os valores originais e os
substitutos. A tal transformação chamamos transformação isomórfica. Por exemplo, suponha que
a cada pessoa do gênero masculino se associe o número 1 e caso a pessoa seja do gênero
feminino se associe o número 0. O conjunto original {0,1} pode ser transformado para o conjunto
{-1,10}, sem qualquer perda de sentido na informação, já que esses algarismos funcionam como
rótulos das respectivas categorias.
Na escala nominal de mensuração, não existe uma medida no sentido que vem sendo
adotado até o presente. Por isso Torgerson (1958) não a considera como nível de mensuração.
Não há nesse nível de mensuração qualquer propriedade relativa à ordenação dos “valores”, nem
origem, bem como não faz sentido se tentar definir qualquer unidade de distância entre as
possíveis categorias da variável.
Nas ciências sociais, no entanto, esse tipo de unidade de mensuração é muito utilizado,
principalmente para “medir” itens que denotam atributos individuais, tais como estado civil,
naturalidade, tipo de formação universitária, nacionalidade, etc. Pela natureza e limitações
impostas por este nível de mensuração, as estatísticas descritivas aplicáveis às variáveis nominais
são restritas àquelas que se baseiam nas freqüências das observações como, por exemplo,
proporção e moda. Às variáveis definidas nesse nível de mensuração dá-se o nome de variáveis
categóricas (ou categorizadas).
Considere, como exemplo, a variável Estado Civil e suponha que uma amostra de 500
unidades apresentou a seguinte distribuição de freqüência nas cinco classes consideradas.
Tabela 1 – Distribuição das unidades amostrais por classe de Estado Civil
Classes Freq. Perc. (%)
SOLTEIRO 125 25,0
CASADO 175 35,0
DIVORCIADO 50 10,0
VIÚVO 75 15,0
OUTRO 75 15,0
6
TOTAL 500 1,00
1.2 Escala Ordinal
Caso as categorias de uma variável nominal possam ser ordenadas, isto é, permitam uma
relação do tipo maior do que (>) ou menor do que (<) entre pares de possíveis categorias
mutuamente exclusivas e além disso cada categoria seja associada a um e apenas um número do
conjunto dos números reais, então o nível de mensuração ordinal é obtido.
Qualquer conjunto numérico pode ser utilizado para substituir o conjunto original de
valores associados a cada categoria, desde que a ordem original das categorias seja mantida. A
tal transformação chamamos transformação monotônica. A hierarquia do exército é um bom
exemplo de uma variável com nível ordinal de mensuração. Considere apenas as categorias
Soldado, Cabo e Sargento. Note que, em termos de patente, Soldado < Cabo < Sargento. Embora
Cabo seja uma patente menor do que a de Sargento e maior do que Soldado, não se pode afirmar
que Cabo esteja mais próximo de Soldado do que de Sargento. Em outras palavras, não se pode
medir distâncias entre as categorias de uma escala ordinal. Uma condição necessária para que esta
escala seja ordinal é que, se a < b e b < c, então a < c.
Como no nível de mensuração nominal, esta escala não possui origem nem unidade. Além
disso, a ordenação dos indivíduos só pode ser feita através de uma variável apenas. Não é possível
a ordenação das unidades de acordo com duas ou mais variáveis simultaneamente. Ordenamos os
indivíduos, por exemplo, pelo grau de satisfação com um certo produto, porém jamais podemos
ordená-los pela satisfação com dois produtos simultaneamente.
Considere uma amostra de 200 freqüentadores de um restaurante classificados pelo nível
de instrução mais elevado, conforme apresentada na tabela abaixo:
Tabela 2 – Distribuição dos Freqüentadores do Restaurante, Classificados pelo Nível de Instrução mais Elevado
Cada categoria, ou classe de nível instrução completa, obteve na amostra os quantitativos
apresentados na coluna das freqüências, sendo que o percentual de cada classe é mostrado na
coluna 3. Como a variável tem nível de mensuração ordinal, faz sentido calcular a freqüência
acumulada até cada uma das classes. São apresentadas as freqüências acumuladas absolutas e
relativas nas colunas 4 e 5, respectivamente.
7
1.3 Escala Intervalar
Quando os fenômenos são representados por variáveis que assumem valores num
contínuo, como o conjunto dos números racionais, dizemos que essas variáveis são quantitativas e
a descrição dos dados se torna mais informativa. Uma possível classificação para essas variáveis
pode ser feita em função do tipo de valores que a elas podem assumir: discretas, caso assumam
valores específicos, pontuais; ou contínuas, caso assumam valores em intervalos.
Independentemente do tipo da variável, discreta ou contínua, quando a origem da sua escala não
é fixa, e o valor nulo não representa a ausência do atributo sendo medido, dizemos que a variável
quantitativa tem escala intervalar de valores. Esta escala incorpora todas as propriedades das
escalas ordinal e nominal e além disso, ela especifica uma correspondência 1-1 entre os elementos
do domínio observáel e o conjunto dos números reais, permitindo assim que a distância entre as
observações tenha significado lógico.
Nessa escala, como a origem (zero) e a unidade de medida são indeterminadas, podemos
proceder a uma mudança da escala, isto é, mudar a origem e a unidade, através de uma
transformação linear do tipo Y = aX + b cujos valores de a e de b são conhecidos. Por exemplo,
considere as escalas de mensuração de temperaturas Fahrenheit (F) e Centígrados (C). A
transformação da primeira para a segunda escala é feita através da relação
9160F5C −
= ,
onde C e F representam as medidas em suas respectivas escalas. Nessa transformação a=5/9 e
b=-160/9.
Note que uma temperatura de 0o C não representa ausência de calor, ou seja, nessa
escala não existe um zero absoluto (ou zero natural). Ademais, o valor zero na escala Centígrado
tem como valor correspondente a medida 32 na escala Fahrenheit, e se somarmos 32 a qualquer
medida na escala Fahrenheit, obviamente o resultado NÃO será a própria medida. Logo o valor
zero NÃO pode ser considerado uma medida fixa. Escolhemos o ponto de congelamento da água
nas condições normais de temperatura e pressão como origem, assim como poderíamos ter
escolhido o ponto de ebulição, sem qualquer perda de informação ou prejuízo nas análises.
No campo das ciências físicas, pesquisadores investigaram a temperatura que denotasse a
ausência total de calor e encontraram o valor de -273,16o C. Uma transformação desta medida
ficou sendo então a origem, ou o valor nulo, da escala Kevin de temperatura.
A falta de uma unidade unitária de medida não nos permite estabelecer relações de
proporcionalidade entre as observações. Por exemplo, suponha que três alunos tenham obtido,
através de um teste, suas medidas indicadoras de inteligência (QI): 150, 125 e 75. Se for verdade
8
que o segundo aluno tem sua medida de inteligência mais próxima da do primeiro aluno do que da
medida do terceiro, não é verdade que o primeiro seja duas vezes mais inteligente do que o
terceiro.
Qualquer estatística descritiva pode ser aplicada a variáveis expressas por esse nível de
mensuração: medidas de posição (médias, separatrizes e moda); de variação (absolutas e
relativas); e de forma.
1.4 Escala de Razão
Esta escala representa o nível mais rico de mensuração que se pode obter na busca do
conhecimento de um objeto. Além de incorporar todas as propriedades da escala intervalar, esta
escala ainda permite que se estabeleçam relações de razão e proporção entre os valores
observados de suas variáveis. Isso é possível pela existência de uma origem fixa, ou zero absoluto
(natural) e pela existência de uma unidade unitária de medida. A denominação dessa escala
resulta do fato que, uma vez fixada sua origem, qualquer medida na escala pode ser expressa
através de uma razão.
A única transformação válida e admissível para esta escala é a transformação de razão do
tipo Y = cX, onde o coeficiente c é conhecido e denominado coeficiente de proporcionalidade entre
X e Y.
Grande parte das medidas físicas (comprimento, peso, etc.), e demográficas (idade, taxas
de crescimento, natalidade, mortalidade, etc.), são representadas através de variáveis com níveis
de mensuração expressos na escala de razão. Por exemplo, a escala de comprimento expressa em
centímetros (cm), é uma escala de razão. Uma medida igual a 0 cm significa a total inexistência do
objeto. Além disso, um objeto com 6 cm é duas vezes maior do que um com 3 cm. Uma medida
em polegadas pode ser obtida através da transformação da mesma medida em centímetros
usando a relação Y = 2,54 X, onde Y é a medida expressa em polegadas, X em centímetros e 2,54
é o coeficiente de proporcionalidade entre as duas medidas. Note que quando uma delas é nula a
outra também será, fixando a origem comum para as suas escalas e variando apenas a unidade de
medida. As estatísticas descritivas para esta escala são as mesmas aplicadas à escala intervalar.
Concluímos, então que a diferença entre as variáveis intervalares e de razão é,
basicamente, a existência, ou não, de uma origem fixa, ou zero absoluto. Essa diferença é
justificável apenas nos procedimentos de mudança de escalas, na utilização da transformação mais
apropriada.
Finalmente, notamos que uma variável quantitativa pode ser transformada numa
qualitativa, mas o reverso não é verdadeiro. Por exemplo, podemos transformar a variável salário,
numa outra, ordinal, tipo faixa salarial. Na primeira, as unidades respondem o valor do seu salário,
enquanto na segunda respondem a faixa de salário estabelecida no questionário. Nessa
9
transformação diminuímos as possibilidades de aplicação dos instrumentos de análise estatística,
por passarmos para um nível de mensuração inferior. Essas técnicas são apresentadas na seção
seguinte.
10
2. Descrevendo Dados Qualitativos
Dados qualitativos são aqueles expressos pelos níveis de mensuração nominal e ordinal.
Posto de outra forma, são aqueles na qual a variável assume “valores” em categorias, classes ou
rótulos. São, portanto, por natureza, dados não numéricos. Apesar de ser considerada de baixo
nível de mensuração, do ponto de vista da aplicação de instrumental estatístico, a variável
qualitativa oferece um vasto espectro de aplicação nas ciências sociais e do comportamento.
Variáveis qualitativas denotam características individuais das unidades sob análise, tais como sexo,
estado civil, naturalidade, raça, grau de instrução, dentre outras, permitindo estratificar as
unidades para serem analisadas de acordo com outras variáveis. Esta segmentação permite que as
generalizações fiquem restritas aos níveis da variável qualitativa. Por exemplo: faixa salarial por
sexo; renda por nível de instrução; instrução por raça; etc.
De acordo com Motta (1999), os dados qualitativos são, geralmente, obtidos através de
pesquisas conhecidas na literatura como “pesquisas qualitativas”. São meios não muito
estruturados tais como: grupo focal; incidente crítico; entrevista em profundidade; dentre outros.
A sistematização dos dados em tabelas de freqüências nem sempre é uma tarefa simples e requer
um profundo conhecimento do objeto de análise.
Obtidos os dados, a tarefa seguinte é representá-los através de uma tabela e de um
gráfico. Posteriormente, poderá ser útil calcular as freqüências, simples ou acumuladas, absolutas
ou relativas. O exemplo a seguir oferece uma orientação de como proceder a uma análise de um
fenômeno qualitativo.
Exemplo: Um grupo industrial está avaliando a possibilidade de oferecer um plano de incentivo a vendas. Quatro programas alternativos foram definidos e propostos a uma amostra de 40 vendedores que manifestaram a sua preferência. O quadro abaixo sumariza as respostas obtidas:
B A D C A C D B D BD D B A D B D A D CD B C D A D B D B CB A D B A B A C D B
Notamos que os dados são classificados como qualitativos, uma vez que a variável considerada, Plano de Incentivo, é expressa através de quatro categorias: A; B; C; e D. Cada elemento da amostra manifestou a sua preferência escolhendo a categoria que melhor se ajustava aos seus interesses. Não há números envolvidos. O nível de mensuração dessa variável é nominal. A classificação dos diferentes planos não altera o sentido da distribuição.
O primeiro passo para analisar a distribuição acima é organizar os dados de acordo com
uma tabela de freqüências. Observamos que 8 vendedores elegeram o plano A, 12 o B, 6 o C e os
restantes 14 vendedores escolheram o plano D, o mais votado. A tabela representativa da
distribuição de freqüência é fornecida abaixo:
11
Tabela 3 – Distribuição de Freqüência da Preferência dos Vendedores pelos Planos de Incentivo
PLANO Votos PercentualA 8 20B 12 30C 6 15D 14 35
TOTAL 40 100
A primeira coluna da tabela apresenta cada uma das categorias dos planos avaliados. A
segunda coluna apresenta as freqüências de votos para cada plano e a terceira a freqüência
relativa, ou percentagem, de votos de cada plano. Como variáveis qualitativas somente são
analisadas à luz de suas freqüências, podemos dizer que o plano mais votado foi o D,
representando 35% do total de votos, ficando o C com menor número de votos, representando
apenas 15% do total da amostra.
O próximo passo é representar os dados obtidos segundo uma forma gráfica. Dados
qualitativos são, geralmente, expressos através de gráficos de barras ou gráficos de setores (ou de
pizza). Ambas as formas podem ser expressas pelas freqüências absolutas ou relativas. Abaixo são
apresentados os dois tipos de gráficos.
Fig. 1 – Gráfico de Barras Fig. 2 – Gráfico de Setores
Plano
DCBA
Cou
nt
16
14
12
10
8
6
4
2
0
35,0%
15,0%
30,0%
20,0%
D
C
B
A
O gráfico de setores é uma representação pictórica de grande efeito visual. Enfatiza,
principalmente, as diferenças das freqüências relativas entre as categorias da variável. A obtenção
dos graus representativos dos setores basta proceder a uma regra de três simples. Como o círculo
tem 360 graus, representando 100% das observações, o percentual de cada setor vai equivaler ao
grau do respectivo setor.
Quando a variável qualitativa é expressa por uma variável com nível de mensuração
ordinal, pode ser de interesse avaliar as freqüências acumuladas, tanto absolutas quanto relativas.
12
Considere o exemplo dos freqüentadores de um restaurante apresentado na página 7.
Tabela 2 – Distribuição dos Freqüentadores do Restaurante, Classificados pelo Nível de Instrução mais Elevado