-
1
MTODOS QUALITATIVOS E QUANTITATIVOS EM PESQUISA: UMA
ABORDAGEM INTRODUTRIA
Daniel Arruda Coronel1
Airton Lopes Amorim2
Reisoli Bender Filho3
Eliane Pinheiro de Sousa4
1 Introduo
O primeiro passo para se realizar uma pesquisa consiste na
existncia de um problema
de pesquisa. A investigao desse problema proposto requer o uso
do mtodo de pesquisa. De
acordo Richardson (2008), o mtodo em pesquisa significa a
escolha de procedimentos
sistemticos para a descrio e explicao de fenmenos. Adotando uma
classificao
bastante ampla, possvel dizer que h dois grandes mtodos: o
quantitativo e o qualitativo.
Eles se diferenciam no apenas pela sistemtica relacionada a cada
um deles, mas
principalmente pela forma de abordagem do problema de pesquisa.
Dessa maneira, a escolha
do mtodo de pesquisa depender da natureza do problema, ou seja,
do enfoque adotado
diante do fenmeno que se procura explicar.
O mtodo quantitativo baseia-se no emprego da quantificao tanto
nas modalidades
de coleta de informaes quanto no tratamento delas por meio de
tcnicas estatsticas.
Representa, em princpio, a inteno de garantir a preciso dos
resultados, evitar distores de
anlise e interpretao, possibilitando, consequentemente, uma
margem de segurana quanto
s inferncias. frequentemente aplicado nos estudos descritivos,
naqueles que procuram
descobrir e classificar a relao entre variveis, bem como nos que
investigam a relao entre
fenmenos (RICHARDSON, 2008).
O mtodo qualitativo tem esse nome em contraposio ao mtodo
quantitativo, em
funo da forma como os dados sero tratados e da forma de apreenso
de uma realidade, em
que, no caso da pesquisa qualitativa, o mundo conhecido por meio
de experincia e senso
comum (conhecimento intuitivo), em oposio s abstraes (modelos)
da pesquisa
quantitativa. Os mtodos qualitativos e quantitativos no so
excludentes, embora difiram
quanto forma e nfase (NEVES, 1996).
1Professor Adjunto do Programa de Ps-Graduao em Administrao da
Universidade Federal de Santa Maria
(UFSM) e Doutor em Economia Aplicada pela Universidade Federal
de Viosa (UFV). E-mail:
[email protected] 2Mestre em Economia pela Universidade
Federal de Viosa (UFV). E-mail: [email protected]
3Professor Adjunto do Programa de Ps-Graduao em Administrao da
UFSM e Doutor em Economia
Aplicada pela UFV.E-mail: [email protected] 4Professora
Adjunta do Departamento de Economia da Universidade Regional do
Cariri (URCA), Pesquisadora
da FUNCAP e Doutora em Economia Aplicada pela UFV. E-mail:
[email protected]
-
2
Dalfovo, Lana e Silveira (2008), ao citarem Cassel e Symon
(1994), destacam que a
pesquisa qualitativa apresenta as seguintes caractersticas
bsicas: ao invs de focar na
quantificao, est centrada na interpretao que os participantes
possuem quanto situao
investigada; enfatiza a subjetividade, a flexibilidade no
processo de conduo da pesquisa,
assim como se orienta para o processo e no para o resultado;
preocupa-se com o contexto; e
reconhece que o pesquisador influencia a situao de pesquisa e
por ela tambm
influenciado.
Como observado por Sampson (1991), a pesquisa qualitativa mais
utilizada quando
se possui pouca informao, em situaes em que o fenmeno deve ser
observado ou em que
se deseja conhecer um processo, determinado aspecto psicolgico
complexo, ou um problema
complexo, sem muitos dados de partida. Alguns problemas de
pesquisa requerem uma
abordagem mais flexvel, e, nestas circunstncias, a aplicao de
tcnicas qualitativas
recomendada.
Na pesquisa qualitativa, os dados so coletados, sobretudo, em
contextos em que os
fenmenos so construdos; no processo de levantamento dos dados
que se procede
preferencialmente sua anlise; os estudos so realizados de modo
descritivo, em que se
busca compreender os significados dos prprios sujeitos e de
outras referncias; a partir da
anlise dos dados empricos, constroem-se os fundamentos tericos,
que so aprimorados a
posteriori, com base na reviso de literatura de outros autores;
a interao entre o pesquisador
e o pesquisado assume um papel essencial; e permite o uso
associado de dados qualitativos e
quantitativos (DALFOVO; LANA;SILVEIRA, 2008).
A pesquisa qualitativa possui carter mais exploratrio,
descritivo, indutivo e envolve
tcnicas como anlise de dados secundrios, estudos de caso,
entrevistas individuais,
discusso em grupo, Focus Group, teste de associao de palavras
(SPERS, 2001). Ademais,
Dalfovo, Lana e Silveira (2008) complementam que existem algumas
formas mais adequadas
coleta e anlise dos dados neste tipo de pesquisa, como observao
participante, anlise
documental (cartas, dirios, impressos, relatrios, etc.), histria
de vida, entre outros.
Em face da importncia desempenhada por esses mtodos de pesquisa,
este trabalho
busca apresentar, de forma sintetizada, os mtodos qualitativos e
quantitativos em pesquisa.
Entretanto, no se tem a inteno de preparar um texto com temas
novos, mas, sim, oferecer
um referencial bsico no qual o pesquisador iniciante encontre os
assuntos que ocorrem mais
frequentemente na pesquisa qualitativa e quantitativa. Tambm
evidente que no se tem a
pretenso de expor esses assuntos com um grande grau de
detalhamento, nem mesmo listar de
forma exaustiva as tcnicas estatsticas de anlise de dados, em um
espao limitado.
-
3
Este trabalho est dividido em 6 sees, incluindo a introduo. A
segunda seo
discute a abordagem qualitativa de dados; a terceira discute
alguns conceitos bsicos
relacionados abordagem quantitativa de dados; na quarta seo, so
feitos alguns
comentrios a respeito das principais fontes de dados utilizados
na pesquisa quantitativa; na
quinta seo, apresentam-se algumas tcnicas bsicas de anlise de
dados quantitativos; e, por
fim, na sexta seo, so feitas algumas consideraes finais.
2 Abordagem Qualitativa
A pesquisa qualitativa visa explicar os fenmenos sociais atravs
das experincias de
indivduos ou grupos, por meio da anlise de documentos e da
interao entre os atores
sociais. De acordo com Gibbs (2009), as pesquisas qualitativas
apresentam vrias
peculiaridades tais como acesso a experincias e ao contexto de
determinado problema,
hipteses so desenvolvidas e refinadas durante a pesquisa e forte
utilizao de notas,
manuscritos e de transcries.
As principais tcnicas utilizadas nas pesquisas qualitativas so
entrevistas, observao
e anlise de material bibliogrfico. As entrevistas podem ser
classificadas em trs tipos:
fechadas, semiestruturadas e abertas.
A entrevista fechada tem como caracterstica apresentar ao
entrevistado perguntas em
que as respostas so previamente estruturadas. Ex. sexo masculino
ou feminino, ser a favor ou
contrrio a legalizao do aborto.
De acordo com Cortes (2012), a entrevista semiestruturada
apresenta questes com
respostas abertas, onde o entrevistado pode explicitar de
maneira ampla seu posicionamento,
anlises e reflexes.
A entrevista aberta tem como caracterstica no obedecer a um
roteiro pr-definido,
sendo que o objetivo deste tipo de entrevista explorar de
maneira ampla, de modo que se
possa inserir outras questes, de acordo com o desenvolvimento da
conversa (VERGARA,
2005).
A observao consiste em analisar as interaes dos agentes sociais
em determinadas
situaes com o objetivo de verificar o seu comportamento e suas
atitudes dentro de
determinado contexto econmico, social e cultural.
Por fim, a anlise de material bibliogrfico tem como foco a
utilizao de documentos,
livros, artigos, jornais e anotaes com o objetivo de buscar
embasamento terico para o
desenvolvimento do trabalho.
-
4
2.1 Preparao de dados para Anlise Qualitativa
A preparao dos dados consiste em etapa fundamental para a anlise
qualitativa, isso
porque, ao fazer a transcrio, geralmente de dados textuais,
envolve uma mudana de meio e,
consequentemente, algum grau de interpretao (GIBBS, 2009). Logo,
tal procedimento exige
planejamento prvio, detalhamento dos nveis de transcrio,
convenes para designao e
anonimizao.
Seguindo essa temtica, nesse ponto so apresentadas, comentadas e
exemplificadas as
principais etapas para a preparao de dados qualitativos,
compreendendo a transcrio, a
realizao da transcrio, os dados de rede e a preparao de
arquivos.
A transcrio de dados, entendida como a parte da organizao e da
administrao de
dados qualitativos (ver Arksey e Knight, 1999), estabelece uma
tcnica de documentao do
material coletado e consiste em uma das formas mais utilizadas
de reproduzir entrevistas
(gravaes, instrumentos estruturados ou no, dirios de campo,
fichas de documentao,
discursos ou anlise de conversao) em cpia digitada claramente
definida, com maior ou
menor grau de detalhamento.
A transcrio constitui-se em uma das formas de anlise de contedo
que, como
exposto por Bardin (2005), define um conjunto de tcnicas de
anlise das comunicaes,
sendo que utiliza procedimentos sistemticos e objetivos de
descrio do contedo. Vergara
(2005) enfatiza que a anlise de contedo constitui uma tcnica que
trabalha os dados
coletados, objetivando a identificao do que est sendo dito a
respeito de determinado tema.
Sendo assim, a transcrio envolve um conjunto de aspectos que
compreendem a
preciso, a fidelidade e a interpretao dos dados. Deve-se
destacar que a falta de preciso e
fidedignidade na transcrio poder levar descontextualizao e, por
conseguinte, falta de
compreenso do contedo em parte ou em sua totalidade. Da mesma
forma, a mudana de
meio ocorrida pela transformao de dados (interpretao do
pesquisador) um aspecto que
Gibbs (2009) relaciona a determinados tipos de erros, entre os
quais o contexto, a linguagem e
o ambiente.
Como destaca Mishler (1991), a questo principal no se a
transcrio , em ltima
anlise, precisa, e sim se representa uma tentativa bem-sucedida
e cuidadosa de captar
determinados aspectos da entrevista. Esse aspecto condiciona a
deciso do pesquisador quanto
s estratgias que sero adotadas para a transcrio dos dados, sendo
que poder ser transcrita
apenas parte, contendo os pontos mais relevantes, ou a
integralmente das informaes.
-
5
Contudo, nesse caso, o pesquisador ter que ter a dimenso precisa
do contedo, pois o
pesquisador pode, em algum momento, distanciar-se do tema
discutido.
Gibbs (2009) chama a ateno para alguns aspectos relacionados s
estratgias,
principalmente quanto ao contedo selecionado para a transcrio.
Muitas vezes o
pesquisador descobre que as partes selecionadas para a transcrio
perderam seu contedo e
se tornaram de difcil interpretao. Alm disso, as ideias
iniciais, definidas a priori, podem
ser totalmente alteradas quando se desenvolve a verso final da
pesquisa.
Logo, necessrio definir o nvel ou grau de transcrio, o qual
depender dos
propsitos da pesquisa. Na maioria das situaes, o pesquisador
busca o maior detalhamento
possvel do tema ou do ambiente analisado; contudo, a fala, no
caso de entrevista, no ocorre
na forma de frases bem construdas e estruturadas, contendo erros
gramaticais e vcios de
linguagem. Cabe, nessas situaes, ao transcritor decidir como e
de que forma transcrever. No
Quadro 1, encontram-se exemplos de caractersticas de conversao
que no so adequadas
transcrio.
Quadro 1 Caractersticas da conversao
Caracterstica Exemplo
Abreviaes n, t, t bom
Cacoetes verbais como ah, hum, ah
Pausas cortadas ou simplesmente representadas por reticncias
(...)
Repeties quer dizer, quero dizer, o que eu quero dizer que
Fonte: Arksey e Knight (1999) e Gibbs (2009).
Buscando tornar as transcries organizadas e facilmente
analisveis, podem-se
utilizar diferentes estilos de transcrio, entre eles, a essncia,
a forma literal e a forma literal
com fala coloquial. Na transcrio da essncia, o transcritor
relata somente os principais
pontos da entrevista; na forma literal, a transcrio envolve o
sentido prprio da palavra ou da
expresso, sem considerar o contexto, e, na forma literal com
fala informal, acrescida a
linguagem utilizada no cotidiano, que no necessita a observao
integral das regras
gramaticais, de modo que haja mais fluidez na comunicao. O
Quadro 2 apresenta exemplos
de diferentes nveis de transcrio.
-
6
Quadro 2 Nveis de transcrio
Nvel transcrio Exemplo
Essncia Tento deixar as coisas prontas (...), porque ele pula de
um
(...) projeto para outro.
Literal Eu no tenho certeza. Tenho a sensao de que eles
podem
deixar as emoes aparecerem melhor.
Literal com fala coloquial Bom (...) na primeira vez que eu vi
(...) eu ainda tava no
colgio, eu tinha quinze anos (...).
Fonte: Silverman (1997) e Gibbs (2009).
Outro aspecto importante da transcrio est na confidencialidade
dos pesquisados.
Isso se torna necessrio visto que as pesquisas geralmente
armazenam dados em um arquivo
pblico para que outros pesquisadores possam fazer uso, logo o
anonimato dos nomes de
pessoas, de lugares e de empresas garante a segurana e a
identificao dos respondentes. Por
conseguinte, pode-se relatar que a informao annima aquela que no
torna possvel
identificar a quem ou a que ela se refere.
Para isso, podem-se utilizar tcnicas de controle de divulgao e
apresentao dos
dados, garantindo, tanto quanto possvel, que a informao sensvel
dos respondentes esteja
suficientemente segura, impedindo a sua identificao ou
reidentificao. A codificao e a
utilizao de pseudnimos so tcnicas que asseguram a
confidencialidade das informaes
utilizadas.
Na transcrio, ainda se deve considerar aspectos como a preciso
das informaes e
dos dados, processo que passa pela avaliao comparativa do
contedo transcrito com o
originalmente coletado. Nesse processo, pode haver desde erros
de interpretao, conforme j
comentado anteriormente, como tambm erros de escrita e de
digitao. Alternativa para
evitar esse tipo de problema passa pela utilizao de programas de
reconhecimento de voz e
de caracteres, tais como o Optical Character Recognition (OCR).
Pode-se tambm fazer a
impresso, o que torna mais fcil a conferncia do contedo
transcrito.
Os erros discutidos so mais comuns em casos em que o pesquisador
faz uso de
gravaes, entrevistas e anotaes. No entanto, a utilizao do
contedo online (via internet)
pode ser uma soluo para eliminar grande parte dos erros, uma vez
que os dados textuais
encontram-se em formato eletrnico, no sendo necessrio
transcrev-los. Como exemplo,
citam-se mensagem de correio eletrnico, pginas, notcias, entre
outros. Porm, em alguns
casos, o pesquisador dever realizar algum tipo de processamento
e/ou filtragem dos dados.
-
7
Por fim, cabe destacar aspectos de carter geral sobre a preparao
de dados
qualitativos, tais como o cuidado com as informaes coletadas
(embora seja necessrio a
anonimizao dos pesquisados, manter as informaes integrais do
contedo coletado
descrio completa), com o armazenamento dos dados (forma de
salvamento dos dados) e
com a forma de organizao e a disponibilizao dos dados (estrutura
dos documentos e
arquivamento adequado para que outros pesquisadores possam
utilizar o material
disponibilizado).
3 Abordagem Quantitativa
Como visto na introduo, o mtodo quantitativo caracteriza-se pelo
emprego da
quantificao nas modalidades de coleta de dados e no tratamento
desses por meio de tcnicas
estatsticas, desde as mais simples at as mais complexas.
3.1 Estatstica
Estatstica, conforme definido por Guimares (2008), um conjunto
de tcnicas de
anlise de dados aplicveis a quase todas as reas do conhecimento
que nos auxiliam no
processo de tomada de deciso. a Cincia que estuda os processos
de coleta, organizao,
anlise e interpretao de dados relevantes e referentes a uma rea
particular de investigao.
Ela desempenha grande papel na transformao dos mtodos de
pesquisa nas
diferentes reas do conhecimento, aumentando o nvel de confiana
das informaes
divulgadas pelas pesquisas e favorecendo a tomada de decises
acertadas, em face das
incertezas, na implementao e avaliao de polticas socioeconmicas
(IGNCIO, 2010).
Ela subdivide-se em trs reas: descritiva, probabilstica e
inferencial. A estatstica
descritiva um conjunto de tcnicas que tm como objetivo
sintetizar uma srie de valores de
mesma natureza, permitindo, dessa forma, que se tenha uma viso
mais global da variao
desses valores. A teoria de probabilidades permite descrever os
fenmenos aleatrios, ou seja,
aqueles em que est presente a incerteza. A estatstica
inferencial, fundamentada na teoria de
probabilidades, um conjunto de tcnicas e procedimentos que
permitem a extrapolao, a
um grande conjunto de dados, das informaes e concluses obtidas a
partir da amostra.
As tcnicas estatsticas so utilizadas nas mais diversas reas de
conhecimento,
podendo-se citar, como exemplo, pesquisa eleitoral, pesquisa de
mercado, controle de
qualidade, ndices econmicos, desenvolvimento de novos
medicamentos, nas tcnicas
cirrgicas e tratamento mdico, sementes mais eficientes, previses
metrolgicas, previses
de comportamento do mercado de aes.
-
8
3.2 Populao e Amostra
O pesquisador trabalha com dados estatsticos, que podem ser
obtidos com base em
uma populao ou de uma amostra. Populao a totalidade de elementos
que esto sob
discusso e dos quais se deseja investigar uma ou mais
caractersticas. Como, na maioria das
vezes, impraticvel observar toda uma populao, seja pelo custo
elevado, seja por
dificuldades operacionais, ou ainda porque o tempo pode atuar
como agente de distoro, as
observaes so limitadas a apenas uma parte da populao. Dessa
forma, uma amostra nada
mais que um subconjunto finito da populao em estudo.
Ao se trabalhar com amostras, necessrio que ela seja
representativa da populao,
ou seja, a amostra deve ter a mesma estrutura ou composio da
populao, no que diz
respeito (s) varivel(is) que se deseja pesquisar5 (RICHARDSON,
2008).
As amostras, em geral, dividem-se em dois grandes grupos:
amostras probabilsticas e
no probabilsticas. A amostragem ser probabilstica se todos os
elementos da populao
tiverem probabilidade conhecida, e diferente de zero, de
pertencer amostra. Caso contrrio,
ela ser no probabilstica6.
Na coleta de uma amostra, o pesquisador deve ficar atento para
as tcnicas de
amostragem, que garanta o mximo possvel o acaso na escolha.
(i) Amostragem aleatria simples: Nesse tipo de amostragem, todos
os elementos da
populao tm igual probabilidade de pertencer amostra e todas as
possveis
amostras tm igual probabilidade de ocorrer. Se tomarmos uma
populao com N
elementos e uma amostra de tamanho n, cada elemento da populao
tem
probabilidade de pertencer amostra. Na prtica, a amostragem
simples ao
acaso pode ser realizada numerando-se a populao de 1 a N,
sorteando-se, a
seguir, por meio de um dispositivo aleatrio qualquer n nmeros
dessa sequncia,
que correspondero aos elementos sorteados para a amostra.
Exemplo: Se se tiver uma populao de 6 pessoas [1, 2, 3, 4, 5 e
6] e se quiser selecionar uma
amostra de 2 pessoas, cada uma das 6 pessoas dever ter a mesma
probabilidade de ser
escolhida (1/6) e todos os subconjuntos de dois elementos
possveis ([1,2], [1,3], [1,4], [1,5],
5As interpretaes de populao e amostra no so fixas. O que, em uma
ocasio, populao, em outra, pode
ser uma amostra ou vice-versa (RICHARDSON, 2008, p. 73). 6A
amostragem probabilstica implica sorteio com regras bem
determinadas, cuja realizao s ser possvel se a
populao for finita e totalmente acessvel. A utilizao de uma
amostragem probabilstica melhor
recomendao que se deve fazer no sentido de garantir a
representatividade da amostra, pois o acaso o nico
responsvel por eventuais discrepncias entre populao e amostra
(GUIMARES, 2008).
-
9
[1,6], [2,3], [2,4], [2,5], [2,6], [3,4], [3,5], [3,6], [4,5],
[4,6] e [5,6]) devero ter, igualmente, a
mesma probabilidade de ser escolhidos (1/15)7.
(ii) Amostragem estratificada: Nesse tipo de amostragem, os
elementos da populao
so divididos inicialmente em grupos denominados estratos, de
forma que cada
elemento da populao pertena a um nico estrato. Depois, extrai-se
uma amostra
aleatria de cada um deles. A diviso da populao em estratos
ocorre porque, na
maioria das vezes, a mesma apresenta subgrupos muito
heterogneos, sendo
razovel supor que, de subgrupo para subgrupo, a varivel de
interesse apresente
um comportamento substancialmente diverso, tendo, entretanto,
comportamento
razoavelmente homogneo dentro de cada estrato. Nesses casos, se
o sorteio dos
elementos da amostra for realizado sem se levar em considerao a
existncia de
estratos, pode acontecer que os diversos estratos no sejam
convenientemente
representados na amostra, que seria mais influenciada pelas
caractersticas da
varivel nos estratos mais favorecidos pelo sorteio. A tendncia
ocorrncia desse
fato ser maior quanto menor o tamanho da amostra8.
Exemplo: Por exemplo, se considerarmos a varivel SEXO (com dois
nveis: 1 = masculino; 2
= feminino) e a varivel REA DE RESIDNCIA (com sete nveis: 1 =
Santa Clara, 2=
Santo Antnio, 3= Centro, 4= Bom Jesus, 5= Nova Viosa, 6=
Silvestre 7= Amoras),
dividimos a populao em 14 estratos.
(iii) Amostragem por conglomerados: Nesse tipo de amostragem, em
vez da seleo
de unidades da populao, so selecionados conglomerados dessas
unidades (por
exemplo: escolas, hospitais, fregueses, cidades, entre outros).
Cada elemento da
populao deve pertencer a um e somente a um conglomerado.
Exemplo: Se se quisesse, por exemplo, fazer uma amostragem de
conglomerados
considerando 12 escolas diferentes, ter-se-ia que selecionar
aleatoriamente uma destas escolas
e entrevistar todos os estudantes matriculados. 7Com respeito ao
modo de selecionar uma amostra, devem-se considerar duas
possibilidades: uma vez escolhido
um elemento, este ser devolvido ou no populao. Se for devolvido,
fala-se de uma amostra com reposio.
Caso contrrio, fala-se de amostra sem reposio. A diferenciao
importante para determinar a funo
probabilstica que permite calcular a probabilidade que tem a
amostra de ser representativa da populao. Dessa
forma, se a amostragem for com reposio, a funo adequada ser a
multinomial; se sem reposio, a
hipergeomtrica (RICHARDSON, 2008, p.162). 8Os estratos devem ser
definidos em funo da sua relao com o objeto de estudo, sendo que
qualquer varivel
pode ser utilizada como critrio na determinao de um estrato.
Geralmente, tomam-se como variveis de
estratificao as caractersticas socioeconmicas e demogrficas dos
indivduos (sexo, idade, nvel de
escolaridade, classe social, rea onde residem, etc.)
-
10
(iv) Amostragem sistemtica: Nesse tipo de amostragem, os
elementos que iro compor a
amostra so selecionados por meio de um critrio (um intervalo
entre sujeitos
selecionados) que aplicado de forma sistemtica a uma lista com
os nomes dos
sujeitos includos na populao (por exemplo, uma lista telefnica,
uma pauta com
o nome dos alunos de um curso, etc.). Neste tipo de amostragem
aleatria, h dois
elementos importantes: o intervalo de amostragem (IA) e o ponto
de incio da
amostragem (PIA). O primeiro define o intervalo entre um
elemento selecionado e
o elemento selecionado em sequncia; obtido dividindo o total de
elementos da
populao pelo nmero de elementos que se pretende para a nossa
amostra (IA=
N/n). O segundo especifica o ponto em que se inicia a contagem
desse intervalo,
ou seja, qual o elemento a ser escolhido no primeiro intervalo
de amostragem.
Exemplo: Se se tiver uma populao de 500 elementos (N = 500) e se
quiser selecionar uma
amostra de 100 (n = 100), o intervalo de amostragem ser igual a
5 (IA= 500/100=5). Ou seja,
ter-se- que escolher 1 elemento para a amostra em cada grupo de
5 elementos da populao.
Supondo que o ponto inicial da amostragem escolhido seja 3, isso
quer dizer que se
selecionaria um elemento de 5 em 5, comeando pelo 3 elemento da
lista. Da em diante,
contar-se-iam mais 5 elementos, isto , at o 8 da lista, que
seria o 2 selecionado, em
seguida contar-se-iam mais 5 e o 13 seria o 3 selecionado, e
assim sucessivamente, at ao
fim da lista (3; 8; 13; 18; 23; 33; 38 ).
(v) Amostragem por convenincia (no probabilstica): Nesse tipo de
amostragem, os
elementos que iro compor a amostra so aqueles que esto mais
facilmente
disponveis, ou aos quais se tem acesso direto. Nesse caso, os
elementos so
includos na amostra sem probabilidades previamente especificadas
ou conhecidas
de eles serem selecionados.
Exemplo: Um pesquisador deseja medir o nvel de aprendizado dos
estudantes de uma
Universidade e seleciona os estudantes de uma turma da qual ele
professor.
3.3 Variveis
Ao realizar a pesquisa, o pesquisador deve definir as variveis
de interesse, isto , as
caractersticas que sero observadas, medidas ou contadas nos
elementos da populao ou da
amostra, e que podem variar, isto , assumir um valor diferente
de elemento para elemento.
-
11
As variveis podem ser divididas em dois grupos, quanto forma na
qual so
expressas: qualitativas e quantitativas.
a) As variveis qualitativas apresentam como possveis realizaes
uma qualidade
(ou atributo) do indivduo pesquisado.
Varivel qualitativa categrica ou nominal no existe nenhuma
ordenao nas possveis realizaes. Exemplo: Gnero (masculino ou
feminino); raa (branco, negro, amarelo, etc.); cor dos olhos
(castanhos,
pretos, verdes, azuis); regio onde reside (rural, urbana),
etc.
Varivel qualitativa ordinal os possveis atributos ou
qualidades
apresentam uma ordem natural de ocorrncia.
Exemplo:escolaridade
(fundamental, mdio, superior); estado civil (solteiro, casado,
desquitado,
divorciado); nvel de satisfao com um curso (regular, bom,
mdio,
timo); etc.
b) As variveis quantitativas apresentam com possveis valores
nmeros resultantes
de uma contagem ou mensurao.
Variveis quantitativas discretas seus possveis valores formam
um
conjunto finito ou enumervel de nmeros que resultam,
frequentemente,
de uma contagem. Exemplo: nmero de automveis em um municpio;
nmero de alunos em uma classe; nmero de obras catalogadas em
uma
biblioteca; nmero de meninas nascidas em um determinado dia
da
semana; etc.
Variveis quantitativas contnuas seus possveis valores formam
um
intervalo de nmeros reais e que resultam, normalmente, de
uma
mensurao. Exemplo: peso de uma pessoa; renda mensal de uma
famlia;
Produto Interno Bruto de um pas; taxa de juros do cheque
especial, etc.
Ao se coletar as medidas de cada varivel de cada elemento de um
estudo, tm-se os
dados da pesquisa. O conjunto de mdias obtidas correspondente a
determinado elemento
designa-se observao e todos os dados coletados em um estudo em
particular denominam-se
conjunto de dados do estudo9.
9Como destacado por Anderson, Sweeney e Williams (2007), para
fins de anlise estatstica, importante
estabelecer a distino entre dados de seo transversal e dados de
srie histrica. Dados de seo transversal so
dados coletados no mesmo intervalo de tempo ou aproximadamente
no mesmo intervalo de tempo. Por exemplo,
a renda mdia das famlias viosenses no ano de 2012. Dados de srie
histrica so dados coletados ao longo de
diversos perodos. Por exemplo, a renda mdia das famlias
viosenses nos ltimos 10 anos.
-
12
4 Fonte de dados
Os dados a serem utilizados em uma pesquisa podem ser obtidos de
fontes existentes
(dados secundrios) ou de pesquisas e estudos experimentais
(dados primrios) elaboradas
para esse fim.
Em alguns casos, os dados necessrios a uma aplicao em particular
j existem. As
empresas mantm uma srie de banco de dados sobre seus empregados,
clientes e operaes
empresariais. Existem tambm organizaes especializadas em coletar
dados,
disponibilizando uma grande quantidade de dados empresariais e
econmicos10
.
rgos governamentais so outra fonte importante de dados
existentes. Um exemplo
disso no Brasil o Instituto Pesquisa Econmica e Aplicada (IPEA),
que disponibiliza uma
base de dados econmicos e financeiros, incluindo sries
estatsticas da economia brasileira e
dos aspectos que lhe so mais pertinentes na economia
internacional. Os dados so
atualizados e documentados de forma sistemtica e apresentados na
mesma unidade
monetria11
. O Instituto Brasileiro de Geografia e Estatstica (IBGE)
disponibiliza
informaes relacionadas s geocincias e estatsticas sociais,
demogrficas e econmicas, o
que inclui os censos12
.
Nos dias de hoje, a internet continua a se expandir como uma
importante fonte de
dados e de informaes estatsticas.
s vezes, os dados necessrios a uma aplicao em particular no se
encontram
disponveis por meio das fontes existentes. Nesses casos,
frequentemente eles so obtidos pela
realizao de um estudo estatstico. Os estudos estatsticos podem
ser classificados como
experimentais ou baseados em informao.
10
O Instituto Brasileiro de Economia da Fundao Getlio Vargas
(FGV/IBRE) dedica-se produo e
divulgao de estatsticas macroeconmicas e pesquisas econmicas
aplicadas. O acesso s sries histricas dos
ndices produzidos pelo IBRE realizado atravs do FGVDados, um
servio disponvel na Internet, sendo
algumas sries gratuitas e outras disponveis apenas a assinantes.
Dentre os ndices disponveis, est o ndice
Geral de Preos (IGP), o mais abrangente indicador de inflao do
pas, composto pelo ndice de Preos ao
Produtor Amplo (IPA), pelo ndice de Preos ao Consumidor (IPC) e
pelo ndice Nacional de Custo da
Construo Civil (INCC). 11
A Fundao Instituto de Pesquisa Econmica Aplicada (IPEA) uma
fundao pblica federal vinculada ao
Ncleo de Assuntos Estratgicos da Presidncia da Repblica do
Brasil, criada em 1964 e assumindo o nome
atual em 1967, quando se tornou uma organizao pblica. Suas
atividades de pesquisa fornecem suporte tcnico
e institucional s aes do governo para a formulao de polticas
pblicas e programas de desenvolvimento. Os
trabalhos do IPEA so disponibilizados para a sociedade por meio
de publicaes e seminrios. 12
O IBGE uma entidade da administrao pblica federal, constitudo na
forma de fundao pblica pelo
Decreto-lei n 161, de 13 de fevereiro de 1967, vinculado ao
Ministrio do Planejamento, Oramento e Gesto.
Dentre suas atribuies esto as de realizar censos e organizar as
informaes obtidas nesses censos, para suprir
rgos das esferas governamentais federal, estadual e municipal, e
para outras instituies e o pblico em geral.
-
13
Em um estudo experimental, identifica-se primeiro a varivel de
interesse e, ento,
uma ou mais variveis adicionais so identificadas e controladas a
fim de que se possam obter
dados a respeito de como elas influenciam na varivel de
interesse. Por exemplo, uma
empresa farmacutica poderia estar interessada em realizar um
experimento para saber como
um novo medicamento afeta a presso sangunea. A presso sangunea a
varivel de
interesse no estudo. Espera-se que a dosagem do novo medicamento
seja outra varivel com
efeito causal sobre a presso sangunea. Para obter dados sobre o
efeito do novo
medicamento, os pesquisadores selecionam uma amostra de
indivduos e a dosagem do
medicamento controlada, uma vez que diferentes grupos de pessoas
recebem diferentes
dosagens (ANDERSON; SWEENEY ; WILLIAMS, 2007).
Os estudos estatsticos no experimentais, ou baseados na
observao, so aqueles
que no fazem nenhuma tentativa de controlar as variveis de
interesse. Uma pesquisa talvez
seja o tipo mais comum de estudo baseado na observao. Por
exemplo, em uma pesquisa que
se realiza por muito de entrevistas pessoais, primeiramente so
identificadas as perguntas a
serem feitas; posteriormente, elabora-se o questionrio e
aplica-se o mesmo a uma amostra de
indivduos.
5 Tcnicas de Anlise de dados
Aps a coleta de dados, a fase seguinte da pesquisa a de anlise e
interpretao.
Estes dois processos, apesar de conceitualmente distintos,
aparecem sempre estreitamente
relacionados. A anlise tem como objetivo organizar e sumariar os
dados de forma tal que
possibilitem o fornecimento de respostas ao problema proposto
para investigao. J a
interpretao tem como objetivo a procura do sentido mais amplo
das respostas, o que feito
mediante sua ligao a outros conhecimentos anteriormente obtidos
(GIL, 2008, 156).
5.1 Estatstica Descritiva
Nos dias de hoje, devido ao grande avano dos computadores no que
diz respeito
capacidade de armazenamento e processamento de dados, comum que
as pesquisas resultem
em coleta de grandes quantidades de dados para anlise. Uma vez
que os dados na forma em
que foram coletados no permitem, de maneira fcil e rpida, que se
extraiam informaes,
torna-se difcil detectar a existncia de algum padro. Por isso,
torna-se imprescindvel
trabalhar os dados para transform-los em informaes, para
compar-los com outros
resultados, ou ainda para julgar sua adequao a alguma
teoria.
-
14
Para isso, o pesquisador dispe da estatstica descritiva, que um
conjunto de tcnicas
que tm como objetivo bsico sintetizar uma srie de dados,
permitindo, dessa forma, que se
tenha uma viso global da variao desses valores.
Alm de resumir os dados de uma varivel quantitativa por meio de
tabelas e grficos,
a estatstica descritiva tambm pode sintetiz-los na forma de
valores numricos,
denominados medidas descritivas. Estas medidas, se calculadas a
partir de dados
populacionais, so denominadas parmetros e, se calculadas a
partir de dados amostrais, so
denominadas estimadores ou estatsticas.
As medidas descritivas sero apresentadas nos pargrafos
seguintes, dando-se
destaque s medidas de tendncia central e s medidas de disperso.
Antes, porm, torna-se
necessrio dizer que, dada a limitao do nmero de pginas deste
trabalho, no possvel
apresentar os vrios tipos de tabelas e grficos que compem o
conjunto de ferramentas da
estatstica descritiva. Isso no significa que estas ferramentas
de sintetizao de dados sejam
menos importantes que as numricas, pelo contrrio, elas so cada
vez mais utilizadas em
trabalhos de pesquisa. Uma boa fonte de consulta sobre essas
ferramentas pode ser encontrada
nos vrios trabalhos citados nas referncias deste artigo.
5.1.1 Medidas de tendncia central
As medidas de posio, tambm chamadas de tendncia central, so
assim
denominadas por indicarem um ponto em torno do qual se
concentram os dados. As trs
medidas mais comuns so a mdia, a mediana e a moda.
5. 1.2 Mdia
Talvez a medida de posio mais importante seja a mdia, ou valor
mdio, de uma
varivel. Ela constitui uma medida de posio central dos dados,
sendo os tipos de mdias
mais utilizadas a mdia aritmtica, a mdia geomtrica e a mdia
harmnica. Cada uma
com especificidade para determinado tipo de dado.
5. 1. 3 Media Aritmtica
A mdia aritmtica de um conjunto de dados o valor obtido
somando-se todos eles e
dividindo-se o total pelo nmero de observaes.
Se os dados se referem populao, a mdia aritmtica da mesma ser
indicada pela
letra e calculada da seguinte forma:
-
15
em que: corresponde soma de todos os valores da varivel X na
populao e N, ao
nmero de elementos da populao.
Se os dados se referem a uma amostra, a mdia aritmtica da mesma
ser indicada por
e calculada da seguinte forma:
em que: corresponde soma de todos os valores observados da
varivel X na amostra
e n ao nmero total de elementos que a compem .
Para ilustrar o clculo da mdia aritmtica amostral, considere os
seguintes dados
hipotticos correspondentes ao salrio mensal de 6 funcionrios de
uma montadora de
veculos. X1 = R$ 3.596,00; X2 = R$ 3.937,00; X3 = R$ 3.790,00;
X4 = R$ 3.658,00; X5 = R$
3.407,00; e X6 = R$ 2.674,00.
Ou seja, os funcionrios da montadora de veculos recebem, em
mdia, R$ 3.510,33.
A mdia aritmtica apresenta as seguintes propriedades: (i) A mdia
depende de todas
as observaes; (ii) nica em um conjunto de dados e nem sempre tem
existncia real, ou
seja, nem sempre igual a um determinado valor observado na
amostra; (iii) influenciada
por valores extremos observados; (iv) Qualquer modificao nos
dados far com que a mdia
fique alterada, ou seja, somando-se, subtraindo-se,
multiplicando-se ou dividindo-se uma
constante a cada valor observado, a mdia ficar acrescida,
diminuda, multiplicada ou
dividida desse valor; e (v) A soma da diferena de cada valor
observado em relao mdia
zero, ou seja, a soma dos desvios zero.
5.1.4 Media Geomtrica
A mdia geomtrica de um conjunto de dados corresponde ao valor
obtido ao se tirar a
raiz ensima da multiplicao de todos os elementos desse conjunto,
em que n igual ao
nmero de elementos. Matematicamente, tem-se:
-
16
em que: corresponde multiplicao de todos os valores observados
da varivel X e
n, ao nmero total de observaes que compem o conjunto de
dados.
Para exemplificar o clculo da mdia geomtrica, considere o salrio
mensal dos 6
funcionrios da montadora de veculos.
Ou seja, os funcionrios da montadora de veculos recebem, em
mdia, R$ 3.483,90.
Apesar de ser muito pouco utilizada, a mdia geomtrica apresenta
algum interesse
para o clculo da mdia de sries, cujos elementos se apresentam
segundo uma progresso
geomtrica (exemplo, a mdia de populaes, ndices de custo de vida,
juros compostos etc.),
sendo que se define apenas para amostras constitudas por
elementos reais positivos13
.
Valer observar que, por aplicao da funo logartmica expresso da
mdia
geomtrica, obtm-se:
ou seja, o logaritmo da mdia geomtrica de uma amostra , afinal,
a mdia aritmtica dos
logaritmos dos elementos da mesma, a que se d, por vezes, a
designao de mdia
logartmica.
5.1.5 Media Harmnica
A mdia harmnica calculada dividindo-se o nmero n de valores pela
soma dos
inversos de todos os valores. Matematicamente, tem-se:
Para exemplificar o clculo da mdia harmnica, considere o salrio
mensal dos 6
funcionrios da montadora de veculos.
13
Uma progresso geomtrica uma sequncia numrica em que cada termo,
a partir do segundo, igual ao
produto do termo anterior por uma constante, chamada de razo da
progresso geomtrica.
-
17
Ou seja, os funcionrios da montadora de veculos recebem em mdia
R$ 3.454,63.
A mdia harmnica mais recomendada para calcular a mdia de um
conjunto de
dados que constituem uma srie de valores que so inversamente
proporcionais.
Pode-se notar que a mdia aritmtica maior do que a mdia geomtrica
e essa, por
sua vez, maior do que a harmnica.
5.1.6 Moda
Moda o valor que apresenta a maior frequncia, ou seja, que
aparece o maior nmero
de vezes. Se um conjunto de dados apresentar todos seus
elementos com a mesma frequncia
absoluta, no existir um valor modal, sendo a distribuio
classificada como amodal.
Entretanto, existem casos em que a sequncia de observaes
apresenta vrios elementos com
frequncia iguais, sendo a distribuio classificada como
plurimodal.
Considere, como exemplo, os dois conjuntos de dados, e
, que correspondem a duas amostras aleatrias de uma
populao e representam uma caracterstica qualquer da mesma. No
primeiro conjunto de
dados, a moda (mo) igual a 2, sendo ento a distribuio
classificada como unimodal. No
segundo conjunto de dados, a moda (mo) igual aos valores 2 e 5,
sendo a distribuio
classificada de bimodal.
Um aspecto que favorece a utilizao da moda como medida de
tendncia central
que ela pode ser obtida diretamente dos dados, sem a necessidade
de utilizao de frmulas.
Outro aspecto que torna essa medida muito apreciada que seu
valor no afetado pelos
valores extremos do conjunto de dados analisado.
5.1.7 Mediana
A mediana o valor que divide um conjunto ordenado em dois grupos
iguais, com
50% dos valores menores ou igual mediana e 50% dos valores
maiores ou iguais mediana14
.
Para calcular a mediana de um conjunto de dados no agrupados,
seguem-se os
seguintes passos:
14
Seguindo a mesma lgica, os quartis so os elementos que dividem o
conjunto em quatro partes iguais. Da
mesma forma, se se dividir o conjunto de dados em oito partes
iguais, ter-se- os octis; decis se se dividir em 10
e, mais genericamente, os percentis (SARTORIS, 2003).
-
18
Organize os dados em ordem crescente (do menor valor para o
maior valor).
a) Se o conjunto de dados tiver um nmero mpar de termos, o valor
mediano ser o
termo de ordem obtido pela seguinte frmula: , em que n igual ao
nmero
total de observaes.
b) Se o conjunto de dados tiver um nmero par de termos, o valor
mediano ser o termo
de ordem obtido pela seguinte frmula: , em que e
so termos de ordem e devem ser substitudos pelo valor
correspondente.
Como ilustrao, considere os seguintes conjuntos de dados:
e , que correspondem a duas
amostras aleatrias de uma populao que representam uma
caracterstica qualquer da mesma.
1 Ordenam-se os valores de X em ordem crescente: .
Como n = 9, a frmula ficar: , ou seja, o 5 elemento da srie
ordenada ser a
mediana. Logo, a mediana igual a 4.
2 Ordenam-se os valores de Y em ordem crescente: .
Como n =10, a frmula ficar: , em que: correspondem, na
realidade, aos valores do 5 e o 6 termos. Logo, a mediana igual
a .
Por fim, vale fazer as seguintes observaes a respeito da
mediana: (i) Quando o
nmero de elementos da srie estatstica for mpar, haver
coincidncia da mediana com um
dos elementos da srie. (ii) Quando o nmero de elementos da srie
estatstica for par, pode
no haver coincidncia da mediana com um dos elementos da srie. A
mediana ser sempre a
mdia aritmtica dos 2 elementos centrais da srie; e (iii) Ao
contrrio da mdia, a mediana
no sensvel a valores extremos15
.
15
A mediana a medida de posio mais frequentemente usada para dados
de renda anual e valor patrimonial
porque algumas rendas ou valores patrimoniais extremamente
elevados podem influenciar a mdia
(ANDERSON; SWEENEY; WILLIAMS, 2007)
-
19
5.2 Medidas de disperso
Quando se representa um conjunto de dados por meio de uma
tendncia central, tem-
se uma perda de informao, uma vez que a distribuio (informao
total) substituda por
algo que pretende ser representativo dessa distribuio. Uma forma
de reduzir essa perda de
informao, decorrente do uso de uma medida de tendncia central,
so as medidas de
variabilidade. Elas indicam o quanto os valores esto espalhados
na distribuio. Em outras
palavras, uma medida de variabilidade uma forma de se ter uma
ideia do quanto os escores
se afastam da medida de tendncia central que se est utilizando.
As principais medidas de
variabilidade so amplitude total, varincia, desvio padro e
coeficiente de variao.
5.2.1 Amplitude total
A amplitude total de um conjunto de dados a diferena entre o
maior e o menor valor
observado.
No caso dos dados hipotticos correspondentes ao salrio mensal de
6 funcionrios de
uma montadora de veculos, tem-se que a amplitude total entre
eles de R$ 1.263,00.
Embora a amplitude total seja listada como uma medida de
variabilidade, ela no
uma boa medida de disperso de dados, pois leva em considerao
apenas os extremos do
intervalo, no sendo sensvel a todo conjunto.
5.2.2 Varincia
A varincia definida como a mdia dos desvios elevados ao
quadrado.
Se os dados se referem populao, a sua varincia ser indicada por
e calculada
da seguinte forma:
Se os dados se referem amostra, a sua varincia ser indicada por
s
2 e calculada da
seguinte forma:
Para ilustrar o calculo da varincia, recorrem-se aos dados
hipotticos correspondentes
ao salrio mensal de 6 funcionrios de uma montadora de veculos.
Agora se quer saber o
-
20
quo afastado esto os salrios do seu valor mdio (R$ 3.510,33).
Como se tem uma amostra,
aplica-se a frmula amostral aos valores apresentados na Tabela
1.
Tabela 1- Clculo da varincia da amostra dos dados de salrios
mensais
Observaes 1 2.674 3.510,33 699.453,44
2 3.407 3.510,33 10.677,78
3 3.596 3.510,33 7.338,78
4 3.658 3.510,33 21.805,44
5 3.790 3.510,33 78.213,44
6 3.937 3.510,33 182.044,44
Soma - - 999.533,33
Ao se calcular a varincia, observa-se que o resultado ser medido
em unidades
quadrticas, o que dificulta a sua interpretao.
5.2.3 Desvio-padro
O desvio padro definido como a raiz quadrada da varincia.
Se os dados se referem populao, o seu desvio padro ser indicado
pela letra e
calculado da seguinte forma:
Se os dados se referem amostra, o seu desvio padro ser indicado
pela letra e
calculado da seguinte forma:
Aplicando a frmula amostral do desvio padro varincia do salrio
mensal dos 6
funcionrios de nossa amostra, obtm-se: Ou seja, em mdia, os
salrios da amostra esto dispersos da mdia em R$ 447,10.
A vantagem de se trabalhar com o desvio padro que ele medido nas
mesmas
unidades que os dados originais, tornando-se mais fcil compar-lo
mdia e a outros dados
estatsticos que esto nas mesmas unidades que os dados
originais.
-
21
Note-se que, se o objetivo a comparao entre dois conjuntos de
dados, tanto faz
usar a varincia ou o desvio padro. Se a varincia maior, o desvio
padro tambm ser
maior (e vice-versa), necessariamente (SARTORIS, 2003).
5.2.4 Coeficiente de variao
O coeficiente de variao uma medida de disperso relativa,
definida como a razo
entre o desvio padro e a mdia. Matematicamente, ele representado
da seguinte forma:
Do que foi exposto, fcil observar que, a partir do coeficiente
de variao, pode-se
avaliar a homogeneidade do conjunto de dados e,
consequentemente, se a mdia uma boa
medida para representar estes dados. Um coeficiente de variao
superior a 50% sugere alta
disperso, o que indica heterogeneidade dos dados. Quanto maior
for este valor, menos
representativa ser a mdia. Neste caso, opta-se pela mediana ou
moda, no existindo uma
regra prtica para a escolha de uma destas medidas.
Geralmente, o coeficiente de variao utilizado, tambm, para
comparar a
variabilidade de variveis que tm desvios padro diferentes e
mdias diferentes.
5.3 Medidas de relao entre variveis
Muitas vezes, o pesquisador necessita avaliar o grau de
relacionamento entre duas
variveis quaisquer. Existem diversos critrios de avaliao dessa
relao, alguns prprios
para variveis quantitativas e outros para variveis qualitativas.
No primeiro caso, comum a
utilizao do Coeficiente de Correlao de Pearson. No segundo caso,
utiliza-se o Coeficiente
de Contingncia. Esses coeficientes sero descritos nesta seo;
antes, porm, fazem-se
algumas consideraes a respeito de outra ferramenta para a
visualizao de relao entre
duas variveis.
5.3.1 Diagramas de disperso
Um mtodo muito til para avaliar a relao entre duas variveis
quantitativas, ou
entre dois conjuntos de dados, o diagrama de disperso. Para
ilustrar a utilizao desse
mtodo, considere que um pesquisador deseja avaliar a relao entre
a quantidade de adubo
nitrogenado e a quantidade produzida de gros de milho. Para
isso, ele coleta dados de reas,
com caractersticas semelhantes, que tiveram o solo corrigido com
o mesmo tipo de nutriente
-
22
nitrogenado. A Tabela 2 mostra as dez reas de plantao de milho
selecionadas
aleatoriamente, cada qual associada a uma quantidade de adubo
nitrogenado (kg/ha) utilizada
no solo e a respectiva produo de gros de milho (t/ha)
obtida.
Tabela 2- Dados referentes s reas plantadas de milho
rea Quantidade de nitrognio (kg/ha) Produo de gros de milho
(t/ha)
1 200 5,0
2 500 5,7
3 100 4,1
4 300 5,4
5 400 5,4
6 100 3,8
7 500 6,3
8 300 4,8
9 400 5,9
10 200 4,6 Fonte: Dados hipotticos
Se os pares de quantidade de nitrognio (kg/ha) e produo de gros
de milho (t/ha)
forem colocados em um diagrama cartesiano, sendo a primeira
varivel associada ao eixo das
abscissas e a segunda ao eixo das ordenadas, obtm-se um grfico
como o mostrado na Figura
1.
Figura 1- Diagrama de disperso das reas plantadas de milho
Fonte: Dados hipotticos
-
23
A Figura 1 fornece uma representao visual da relao existente
entre duas variveis,
uma nuvem de pontos, que mostra uma relao positiva entre as
mesmas, ou seja, maiores
quantidades de nitrognio esto associadas com maior produo de
gros de milho.
Pode-se, ento, definir o diagrama de disperso como uma coleo de
pontos em um
plano, cujas duas coordenadas cartesianas so os valores de cada
membro do par de dados.
Este mtodo muito utilizado quando se quer examinar os dados no
que se refere ocorrncia
de tendncias (lineares ou no), agrupamento de uma ou mais
variveis, mudanas de
espalhamento de uma varivel em relao outra e verificar a
ocorrncia de valores
discrepantes.
5.3.2 Coeficiente de correlao de Pearson
A representao grfica das variveis quantitativas ajuda a
compreender o
comportamento conjunto das mesmas quanto existncia ou no de
associao entre elas.
Entretanto, muitas vezes necessrio quantificar esta associao, o
que ser feito
considerando-se o tipo de relao mais simples, que a linear.
Nesse caso, o que se procura
definir uma medida que avalia o quanto a nuvem de pontos no
grfico de disperso aproxima-
se de uma reta16
.
A forma de medir a correlao entre duas variveis quantitativas o
Coeficiente de
Correlao Linear de Pearson, tambm conhecido como Coeficiente de
Correlao do
Momento Produto. Este coeficiente mede o grau de relacionamento
entre as variveis, por
meio de um nmero, que indica como as variveis variam
conjuntamente.
Considerando duas variveis quantitativas quaisquer, denominadas
de X e Y, o
coeficiente de correlao de Pearson dado por:
em que: = covarincia entre X e Y; o desvio padro de X e o
desvio padro de Y17
.
16
Uma relao linear supe que uma mudana na varivel X produza uma
mudana semelhante na varivel Y: (i)
positiva um aumento de X produz um aumento de Y; (ii) negativa
um aumento de X produz um decrscimo
em Y (RICHARDSON, 2008, p. 134). 17
A Covarincia mostra como duas variveis variam de forma conjunta.
Apesar de a covarincia ser uma
estatstica adequada para medir relao linear entre variveis, ela
no adequada para comparar graus de relao
entre as mesmas, dado que ela est influenciada pelas unidades de
medida de cada varivel. Para evitar a
influncia da ordem de grandeza e unidades de cada varivel,
divide-se a covarincia pelo desvio padro de X e
-
24
Os valores do coeficiente de correlao variam no intervalo de -1
e 1, podendo-se
identificar trs situaes:
a) Variveis positivamente correlacionadas, . Se a correlao for
perfeita
positiva,
b) Variveis negativamente correlacionadas . Se a correlao
for
perfeita negativa .
c) Variveis no correlacionadas, .
No caso do exemplo da Tabela 2, tem-se que 99, e
. Logo, o coeficiente de correlao entre a quantidade de
nitrognio (kg/ha)
aplicada no solo e a produo de gros de milho (t/ha) por rea ser
igual a:
Este valor mostra que a correlao linear entre as variveis
consideradas positiva e muito
elevada.
importante fazer algumas observaes a respeito do coeficiente de
correlao de
Pearson: (i) a correlao entre duas variveis no implica
causalidade; (ii) o coeficiente de
correlao de X e Y o mesmo que Y e X; (iii) a relao entre as duas
variveis linear; (iv)
as variveis envolvidas devem ser medidas no mnimo em escala
intervalar; e (v) as variveis
devem ter distribuio normal bivariada conjunta, o que equivale a
dizer que, para cada X
dado, a varivel Y normalmente distribuda.
Vale observar ainda que, dentre os fatores que afetam a
intensidade do coeficiente de
correlao , e a preciso da estimativa da correlao populacional ,
esto: (i) o tamanho
da amostra, principalmente quando pequena; (ii) os outliers
(valores discrepantes); (iii) a
restrio da amplitude de uma das variveis ou de ambas; e (v)
erros de medidas.
de Y, dando origem ao coeficiente de correlao de Pearson. Como o
coeficiente de correlao est isento de
unidades e da ordem de grandeza das variveis, este toma valores
entre -1 e 1 (GUIMARES, 2008).
-
25
5.3.3 Coeficiente de contingncia C
O coeficiente de Contingncia (C) mede a associao entre dois
conjuntos de atributos
quando um ou ambos os conjuntos so medidos em escala nominal.
Ele representado
matematicamente pela seguinte frmula:
em que: a estatstica Qui-quadrado, que dada por ; com l
representando o nmero de categorias de resposta da primeira
varivel e c o nmero de
categorias de resposta da segunda varivel; oij o valor observado
das categorias; eij o valor
esperado das categorias, caso elas fossem independentes, que
dado por:
, por fim, n o total de observaes
O p-valor associado ao valor da estatstica Qui-quadrado com
(r-1)x(k-1) graus de
liberdade a prova de significncia do coeficiente de contingncia
C, em que k e r so as
categorias nas quais os escores so divididos. O coeficiente de C
se caracteriza por assumir
valor zero quando h inexistncia de associao, porm nunca ser
igual a 1. O limite superior
do coeficiente dado por (quando k = r) (GUIMARES, 2008).
Para ilustrar o clculo do coeficiente de contingncia, considere,
por exemplo, que se
quer verificar o grau de associao entre as variveis Gnero e
Curso escolhido pelos
estudantes matriculados em uma escola de ensino
profissionalizante. Os dados hipotticos
encontram-se na Tabela 3.
Tabela 3-Distribuio dos matriculados nos cursos
profissionalizantes oferecidos, em relao
ao gnero do estudante
Gnero Informtica Enfermagem Secretria Motorista Total
Feminino 200 300 310 140 950
Masculino 450 210 220 170 1050
Total 650 510 530 310 2000
Fonte: Dados hipotticos
-
26
Caso houvesse independncia entre gnero do estudante e o curso
profissionalizante
escolhido, esperava-se ter a seguinte tabela de contingncia:
Tabela 4- Distribuio esperada dos matriculados nos cursos
profissionalizantes oferecidos, em relao ao gnero do estudante
Gnero Informtica Enfermagem Secretria Motorista Total
Feminino 308,75 242,25 251,75 147,25 950
Masculino 341,25 267,75 278,25 162,75 1.050
Total 650 510 530 310 2.000
Fonte: Dados hipotticos.
Para calcular os valores da Tabela 4, faz-se uso da frmula do
valor esperado das
categorias. Vai-se ilustrar apenas o clculo do valor associado
ao gnero feminino e curso
informtica, uma vez que os demais seguem a mesma lgica:
.
Agora, de posse dos valores esperados das categorias, calcula-se
o Qui-quadrado:
. E por fim, calcula-se o valor
do coeficiente de contingncia,
Para testar a significncia deste coeficiente, precisa-se
verificar o valor crtico de ,
considerando e graus de liberdade. Esse valor igual a 7,81.
Comparando com o valor calculado de 125,53, pode-se admitir a
existncia de associao
significativa entre gnero e curso escolhido.
6 Consideraes finais
Neste captulo, buscou-se apresentar as abordagens qualitativas e
quantitativas,
mostrando sucintamente as principais caractersticas de cada um
desses mtodos de pesquisa.
A pesquisa qualitativa visa explicar os fenmenos sociais atravs
das experincias de
indivduos ou grupos, por meio da anlise de documentos e da
interao entre os atores
sociais, sendo que as principais tcnicas utilizadas compreendem
as entrevistas, a observao
e a anlise de material bibliogrfico. Para se proceder a este
tipo de anlise, torna-se
necessrio que seja feita a transcrio, geralmente de dados
textuais.
A pesquisa quantitativa caracteriza-se pela quantificao da
coleta de dados e pelo
tratamento desses dados por meio de tcnicas estatsticas, que se
revestem de importncia na
tomada de decises. Os dados podem ser provenientes de fontes
existentes (secundrios), em
-
27
que se podem exemplificar os rgos governamentais, que dispem de
base de dados
econmicos e financeiros, como o Instituto Pesquisa Econmica e
Aplicada e informaes
relacionadas s geocincias e estatsticas sociais, demogrficas e
econmicas, como o
Instituto Brasileiro de Geografia e Estatstica (IBGE). Alm
desses, tambm foram mostrados
os dados primrios, coletados em estudos experimentais.
No tocante s tcnicas de anlise quantitativa, o estudo centrou-se
no uso da estatstica
descritiva, que corresponde a um conjunto de tcnicas que
pretende sintetizar uma srie de
dados, possibilitando que se obtenha uma viso abrangente da
variao desses valores, em que
se destacaram as principais medidas de posio e de variabilidade.
Para permitir a avaliao
do grau de relacionamento entre duas variveis quaisquer, foram
apresentados os mtodos do
Coeficiente de Correlao de Pearson e do Coeficiente de
Contingncia, sendo empregados,
respectivamente, para variveis quantitativas e qualitativas.
Por fim, vale ressaltar que, apesar de cada uma dessas
abordagens apresentarem suas
especificidades, esses dois mtodos apresentados podem ser
utilizados de forma
complementar em uma mesma pesquisa cientfica.
Referncias
ANDERSON, D. R.; SWEENEY, D. J.; WILLIAMS, T. A. Estatstica
Aplicada
Administrao e Economia. 2 ed. So Paulo: Cengage Learning,
2009.597 pg.
ARKSEY, H; KNIGTH, P. Interviewing for social scientists. Sage
Publications IndiaPvt
Ltd., California, 1999.
BARDIN, C. M. How I stopped dreading and learned to love
transcription. Qualitative
Inquiry, 2005.
CASSELL, C.; SYMON, G. Qualitative methods in organizational
research. London: Sage
Publications, 1994.
CORTEZ, S. M. V. Como fazer anlise qualitativa de dados. In:
BRNI, D.A.;
FERNANDEZ, B. P. M. Mtodos e tcnicas de pesquisa: modelando as
cincias
empresariais. So Paulo: Saraiva, 2012.
DALFOVO, M. S.; LANA, R. A.; SILVEIRA, A. Mtodos quantitativos e
qualitativos: um
resgate terico. Revista Interdisciplinar Cientfica Aplicada,
Blumenau, v.2, n.4, p.01-13,
2008.
GUIMARES, P. R. Mtodos Quantitativos Estatsticos. Curitiba:
IESDE Brasil S.A.,
2008.
GIBBS, G. Anlise de dados qualitativos. Porto Alegre: Artmed,
2009.
-
28
GIL, A. C. Mtodos e Tcnicas de Pesquisa Social. Sexta edio. So
Paulo: Editora Atlas,
2008. 200 p.
IGNCIO, S. A. Importncia da estatstica para o processo de
conhecimento e tomada de
deciso. Nota tcnica do Instituto Paranaense de Desenvolvimento
Econmico e Social
n.6. Curitiba: IPARDES, 2010.
MISHLER, E. Representing discourse. The rhetoric of
transcription. Journal of Narrative
and Life History, v. 1, n. 6, p. 255-280, 1991.
NEVES, J. L. Pesquisa Qualitativa Caractersticas, Usos e
Possibilidades. Caderno de
Pesquisas em Administrao. V. 1, n. 3, 2o sem/1996.
RICHARDSON, R. J. Pesquisa Social - Mtodos e Tcnicas. 3 edio. So
Paulo, Atlas,
2008. 334 p.
SAMPSOM, P. Qualitative research and motivation research. In:
Consumer Market
Research Handbook. 3rd Edition, Amsterdam: ESOMAR, 1991.
SARTORIS, A. Estatstica e Introduo Economia. So Paulo: Editora
Saraiva, 2003.
SILVERMAN, D. Qualitative research: theory, method and practice.
London: Sage, 1997.
SPERS, R. G. Focus group em pesquisa qualitativa: fundamentos e
reflexes. Administrao
OnLine (So Paulo), v. 2, p. 1-15, 2001.
VERGARA, S. C. Mtodo de pesquisa em administrao.So Paulo: Atlas,
2005.