Mineração de Dados em Tuberculose Pleural Bernardo Martins Costa Projeto de Graduação apresentado ao Curso de Engenharia de Computação e Informação da Escola Politécnica, Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Engenheiro. Orientador: José Manoel de Seixas Rio de Janeiro Março de 2014
71
Embed
Mineração de Dados em Tuberculose Pleural...Mineração de Dados em Tuberculose Pleural Bernardo Martins Costa Projeto de Graduação apresentado ao Curso de Engenharia de Computação
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Mineração de Dados em Tuberculose Pleural
Bernardo Martins Costa
Projeto de Graduação apresentado ao Curso de
Engenharia de Computação e Informação da
Escola Politécnica, Universidade Federal do Rio de
Janeiro, como parte dos requisitos necessários à
obtenção do título de Engenheiro.
Orientador: José Manoel de Seixas
Rio de Janeiro
Março de 2014
MINERAÇÃO DE DADOS EM TUBERCULOSE PLEURAL
Bernardo Martins Costa
PROJETO DE GRADUAÇÃO SUBMETIDO AO CORPO DOCENTE DO CURSO
DE ENGENHARIA DE COMPUTAÇÃO E INFORMAÇÃO DA ESCOLA
POLITÉCNICA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO
PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE
ENGENHEIRO DE COMPUTAÇÃO E INFORMAÇÃO.
Examinada por:
______________________________________________
Prof. José Manoel de Seixas, D.Sc.
______________________________________________
Prof. Sergio Lima Netto, Ph.D.
______________________________________________
Profa. Anete Trajman, D.Sc.
______________________________________________
Prof. Henrique Cukierman, D.Sc.
RIO DE JANEIRO, RJ – BRASIL
Março de 2014
1
Bernardo Martins Costa
Mineração de Dados em Tuberculose Pleural /
Bernardo Martins Costa. – Rio de Janeiro: UFRJ/ Escola
Politécnica, 2014.
XIII, 59 p.: il.; 29,7 cm.
Orientador: José Manoel de Seixas
Projeto de Graduação – UFRJ/ Escola Politécnica/
Curso de Engenharia de Computação e Informação, 2014.
Referências Bibliográficas: p.68
1. Mineração de Dados 2. Tuberculose pleural 3.
Redes Neurais Artificiais I. Seixas, José Manoel II.
Universidade Federal do Rio de Janeiro, Escola Politécnica,
Curso de Engenharia de Computação e Informação. III.
Título.
2
Aos que são loucos o suficiente
para mudar o mundo
3
AGRADECIMENTOS
A minha família, meus pais, meus irmãos, tios, primos e avós, pelo apoio
incondicional e o suporte de todos os dias. Só vocês para comprarem minhas ideias nada
convencionais. Obrigado pelo carinho, pela atenção e por me aturarem desde que nasci.
Aos amigos da ECI, por compartilharem os momentos mais difíceis e os mais
alegres. Foram incontáveis noites de desespero e trabalho duro, impossíveis de serem
concluídas sem a presença de vocês. Obrigado pela cumplicidade de sempre.
Aos amigos da Fluxo Consultoria, por terem sido uma escola dentro da
universidade. Com vocês aprendi a sonhar grande e a correr atrás dos sonhos, com
vocês fui testado além dos limites diversas vezes e com vocês quis ser um melhor
engenheiro. Obrigado pelas risadas, pelos apelidos e por acreditarem em mim.
Aos amigos que fiz na Bélgica, onde ousamos aprender engenharia em francês,
obrigado por estarem lá quando tudo o que me era fundamental esteve a um oceano de
distância. Obrigado por terem sido o meu pedacinho do Brasil naquela terra fria e
cinzenta, e por compartilharem comigo as melhores cervejas do mundo.
Aos amigos da Intratec Solutions, obrigado pela confiança, e por me ensinarem
a aprender e a fazer trabalhos excelentes.
Ao meu orientador, professor José Manoel de Seixas, por toda a paciência, toda
a ajuda e a cobrança que fizeram desse trabalho ser possível. Ao pessoal do LPS,
especialmente Junior Moura e Luiz Évora, por aturarem minhas perguntas e estarem
sempre dispostos a ajudar mesmo tendo tempo escasso.
4
Resumo do Projeto de Graduação apresentado à Escola Politécnica/ UFRJ como parte
dos requisitos necessários para a obtenção do grau de Engenheira de Computação e
Informação.
Mineração de Dados em Tuberculose Pleural
Bernardo Martins Costa
Março/2014
Orientador: José Manoel de Seixas
Curso: Engenharia de Computação e Informação
A tuberculose é uma doença conhecida pela comunidade médica, com
diagnóstico, exames, tratamento e métodos preventivos acessíveis. No entanto seus
números ainda assustam, principalmente depois da epidemia de AIDS nos anos 1980. É
uma doença altamente contagiosa, e em uma de suas formas extrapulmonares, como a
pleural, apresenta diagnóstico não trivial. Os exames que são acessíveis como a
baciloscopia não detectam o bacilo da micobactéria no caso pleural, e os de melhor
performance são invasivos, apresentando riscos e não estando disponíveis em muitos
lugares. Nesse contexto, sistemas de apoio ao diagnóstico se tornam uma ferramenta
importante para o auxílio a decisão para triagem e diagnóstico. Um bom desempenho
nessas duas etapas implica melhor utilização de recursos hospitalares, de equipamento e
laboratoriais, necessários para exames e tratamento. Este trabalho tem o objetivo de,
através do uso de redes neurais artificiais, analisar características de pacientes suspeitos
de tuberculose pleural em busca daquelas mais relevantes, com o intuito de selecioná-
las para elaborar modelos de melhor performance.
5
Abstract of Undergraduate Project presented to POLI/UFRJ as a partial fulfillment of
the requirements for the degree of Computer and Information Engineer.
Data Mining on Pleural Tuberculosis
Bernardo Martins Costa
March/2014
Advisor: José Manoel de Seixas
Major: Computer and Information Engineering
Tuberculosis is a well-known disease, with accessible diagnosis, tests and treatment.
However the number of infected people is large, and became larger after the HIV
pandemic in the 1980’s. It is highly infectious, and one of its extra pulmonary forms,
like pleural tuberculosis, doesn’t have an easy diagnosis. The tests that are affordable
like sputum smear don’t detect the mycobacteria in the pleural case, and those that
perform better are invasive, presenting risks and requiring special equipment, thus not
being available. In this context, decision-support systems become an important tool to
help decision making for screening and diagnosis. A good performance on these two
steps means better use of health-care resources, equipments and laboratories needed for
examination and treatment. The goal of this work is to analyze, by the use of Artificial
Neural Networks, characteristics of patients suspicious of having pleural tuberculosis,
searching for those that are the most relevant, intending to select the best of them to
CAPÍTULO 3 - BASE DE DADOS E MÉTODO DE TRABALHO ............................. 24 3.1. BASE DE DADOS .................................................................................................................. 24 3.2. IMPUTAÇÃO MÚLTIPLA ....................................................................................................... 28 3.3. MÉTODO ............................................................................................................................. 32 3.3.1. PREPARAÇÃO DOS DADOS .................................................................................................. 32 3.3.2. MODELOS PROPOSTOS ........................................................................................................ 32 3.3.3. ESCOLHA DA TOPOLOGIA ................................................................................................... 34 3.3.4. VALIDAÇÃO CRUZADA ....................................................................................................... 34 3.3.5. ÍNDICES DE DESEMPENHO ................................................................................................... 35 3.3.6. SELEÇÃO DA REDE DE OPERAÇÃO ....................................................................................... 36 3.3.7. ANÁLISE DE RELEVÂNCIA ................................................................................................... 37 3.3.8. NOVO TREINAMENTO ......................................................................................................... 38
4.1.1. MODELO I – REDE SOBRE DADOS PESSOAIS .................................................................. 39 4.1.2. MODELO II – REDE SOBRE DADOS SOCIAIS ................................................................... 42 4.1.3. MODELO III – REDE SOBRE DADOS PESSOAIS E SOCIAIS ................................................ 44 4.1.4. MODELO IV – REDE SOBRE OS MODELOS I E II ............................................................. 47
4.3.1. MODELO V – REDE SOBRE DADOS PESSOAIS ................................................................. 52 4.3.2. MODELO VI – REDE SOBRE DADOS SOCIAIS .................................................................. 54 4.3.3. MODELO VII – REDE SOBRE DADOS PESSOAIS E SOCIAIS .............................................. 56 4.3.4. MODELO VIII – REDE SOBRE MODELOS V E VI ............................................................. 58 4.3.5. MODELO IX – REDE SOBRE DADOS PESSOAIS E SOCIAIS ................................................ 60
4.4. COMPARAÇÃO ENTRE AS REDES MLP ................................................................................ 64 CAPÍTULO 5 - CONCLUSÃO E TRABALHOS FUTUROS ....................................... 66
Figura 2.3-1 – Neurônio artificial ............................................................................................................... 20
Figura 2.3-2 – Rede Neural Artificial Multicamada (MLP) ....................................................................... 20
Figura 3.1-1 – Porcentagem de dados faltantes na totalidade de dados ...................................................... 27
Figura 3.1-2 – Porcentagem de amostras com dados faltantes ................................................................... 27
Figura 3.1-3 – Porcentagem de variáveis com dados faltantes ................................................................... 27
Figura 3.2-1 – Média de cada variável entre os conjuntos original e IM ................................................... 29
Figura 3.2-2 - Desvio padrão de cada variável entre os conjuntos original e IM ....................................... 30
Figura 3.2-3 - Curtose de cada variável entre os conjuntos original e IM .................................................. 30
Figura 3.2-4 - Obliquidade de cada variável entre os conjuntos original e IM ........................................... 31
Figura 3.2-5 - Distância KL de cada variável entre os conjuntos original e IM ......................................... 31
Figura 3.3.2-1 – Modelo I ........................................................................................................................... 33
Figura 3.3.2-2 – Modelo II .......................................................................................................................... 33
Figura 3.3.2-3 – Modelo III ........................................................................................................................ 33
Figura 3.3.2-4 – Modelo IV ........................................................................................................................ 33
Figura 4.1.1-1 – Modelo I – SP médio das 50 melhores redes para cada topologia ................................... 39
Figura 4.1.1-2 – Modelo I – Curva ROC e Curvas de Performance de Treinamento da Rede de Operação
hcw Profissional da saúde 1=sim; 2=não 0% trabalho Atividade principal 0=não se aplica;
1=indústria; 2=comercio; 3=prestação de serviço; 4=agropecuária; 5=construção civil; 6=serviço público; 7=não sabe ou não quer informar
5%
renda Renda em faixas 1=sem rendimentos; 2=menos que 1 salário mínimo; 3=1 a 4 salários mínimos; 4=4 a 8 salários mínimos; 5=8 a 12 salários mínimos; 6=12 ou mais;
8%
26
7=não sei rendaant Renda há 2 anos 1=maior; 2=igual;
Tabela 3.1-1 – Relação de variáveis do tipo Dados Pessoais
Dados Sociais Identificação Descrição Valores
possíveis Dados faltantes
asppo Número de aspiradores de pó
0=0;
1=1;
2=2;
3=3;
4=4 ou mais.
15%
carro Número de carros banheiro Número de banheiros freezer Número de freezers (duplex) geladeira Número de geladeiras duplex gel Número de geladeiras simples maquina Número de máquinas de lavar radio Número de rádios tv Número de TVs em cores vídeo Número de reprodutores de vídeo pessoas Número de pessoas que convive com
você nos últimos 2 anos 11%
comodos Número de cômodos 15% dorm Número de cômodos usados como
dormitório 16%
morua Morador de rua (ex- ou não) 1=sim; 2=não 5% preso Foi detento nos últimos 2 anos 1=sim; 2=não 6%
Tabela 3.1-2 – Relação de variáveis do tipo Dados Sociais
27
Figura 3.1-1 – Porcentagem de dados faltantes na totalidade de dados
Figura 3.1-2 – Porcentagem de amostras com dados faltantes
Figura 3.1-3 – Porcentagem de variáveis com dados faltantes
Completo 91%
Incompleto 9%
Total de dados
�Completo 77%
Incompleto
23%
Amostras
Completo 12%
Incompleto 88%
Variáveis
28
3.2. Imputação Múltipla
Em todo projeto que envolve análise de dados, deseja-se fazer inferências sobre
a população de interesse. No entanto, podem haver dados faltantes e em alguns casos
essa falta altera bastante as características originais da população que gerou os dados.
A Imputação Múltipla (IM) é um método proposto por Rubin (1987) para tratar
dados faltantes que tem sido estudado e utilizado desde então. Um método mais simples
de imputação utiliza variáveis correlacionadas presentes no conjunto de dados e sem
dados faltantes para realizar uma estimativa dos valores faltantes nas variáveis-alvo.
Como a imputação é um processo de estimação, Rubin propõe realizar diversas
imputações para que a incerteza inerente a esse processo seja levada em conta.
O objetivo da IM não é adivinhar um valor para o dado faltante, e sim manter a
variabilidade do conjunto original e a relação entre as variáveis. Espera-se que o
conjunto imputado não se distancie do conjunto original em termos de média, variância,
por exemplo, que é o grande problema da imputação única, por não considerar a questão
da variabilidade. [16]
A IM é um processo simples e de fácil computação, podendo ser brevemente
descrita nos seguintes passos:
1- São obtidos m bancos de dados completos por meio de técnicas de
imputação;
2- Cada banco gerado é então analisado, utilizando-se técnicas estatísticas
comuns, usadas na maioria dos projetos de análise.
3- Os resultados encontrados são combinados de uma maneira simples (a média
das imputações, por exemplo), possibilitando a inferência a partir dos
conjuntos imputados.
29
Para mitigar a influência dos dados faltantes, vistos na seção 3.1 deste trabalho,
a IM foi utilizada de modo que fosso possível aproveitar ao máximo a base de dados
disponível. Foram geradas 5 imputações (m = 5), e, a partir delas, gerado uma nova
base imputada contendo, para cada valor faltante, o valor mediano referente das 5
imputações.
A IM foi avaliada segundo comuns de análise estatística. O intuito é identificar
grandes desvios em relação à variabilidade do conjunto original. Foram avaliadas a
média, o desvio padrão, a curtose, a obliquidade (skewness) e a distância de Kullback-
Leibler (KL), que é uma medida de distância entre distribuições. As Figura 3.2-2,
Figura 3.2-3, Figura 3.2-4 e Figura 3.2-5 apresentam as avaliações feitas.
Figura 3.2-1 – Média de cada variável entre os conjuntos original e IM
É possível afirmar que, na totalidade das variáveis, as médias variaram pouco, o
que indica que a imputação múltipla pouco afetou esta medida estatística. As variáveis
‘pessoas’ e ‘comodos’ sofreram as maiores variações na média, sugerindo talvez que
um aprofundamento em sua análise deva ser feito, a partir de outras medidas
estatísticas.
0.000
1.000
2.000
3.000
4.000
5.000
est civil
estuda
escolarid
ade
emprego
hcw
trabalho
rend
a rend
a ant
inst che
f asp pó
carro
banh
eiro
freezer
gelade
ira
gel
maquina
radio tv
vide
o pe
ssoas
comod
os
dorm
mo rua
preso
Média Orig.
Média IM
30
Figura 3.2-2 - Desvio padrão de cada variável entre os conjuntos original e IM
O desvio padrão manteve-se praticamente estável para todas as variáveis, não
havendo considerações relevantes a serem feitas sobre a maioria das variáveis. A maior
variação se deu na variável ‘tv’, ocorrendo um leve aumento, o que indica que a IM
tornou sua distribuição mais dispersa.
Figura 3.2-3 - Curtose de cada variável entre os conjuntos original e IM
A curtose é uma medida sobre o pico ou achatamento de uma distribuição. As
maiores variações da curtose ocorreram justamente naquelas variáveis que possuem
muitos valores de um tipo, e poucos valores de outro tipo, como é o caso de ‘mo rua’ e
‘preso’. De fato, poucas pessoas se declararam como ex-moradores de rua ou ex-
detentos, o que leva a IM a alterar significativamente a curtose nesses dois casos.
0.000 0.500 1.000 1.500 2.000 2.500
est civil
estuda
escolarid
ade
emprego
hcw
trabalho
rend
a rend
a ant
inst che
f asp pó
carro
banh
eiro
freezer
gelade
ira
gel
maquina
radio tv
vide
o pe
ssoas
comod
os
dorm
mo rua
preso
Desv.Pd. Orig.
Desv.Pd. IM
-‐5.000
0.000
5.000
10.000
15.000
20.000
25.000
30.000
est civil
estuda
escolarid
ade
emprego
hcw
trabalho
rend
a rend
a ant
inst che
f asp pó
carro
banh
eiro
freezer
gelade
ira
gel
maquina
radio tv
vide
o pe
ssoas
comod
os
dorm
mo rua
preso
Curtose Orig.
Curtose IM
31
Figura 3.2-4 - Obliquidade de cada variável entre os conjuntos original e IM
A obliquidade, ou skewness, é uma medida de assimetria de uma distribuição.
Distribuições simétricas possuem obliquidade zero, ao passo que distribuições com
caudas longas tem alta obliquidade. O sinal da medida de obliquidade indica se a cauda
fica à direta (>1) ou à esquerda (<1). Novamente, as maiores variações foram nas
variáveis ‘mo rua’ e ‘preso’, e podem ser explicadas pelo mesmo motivo de alteração da
curtose.
Figura 3.2-5 - Distância KL de cada variável entre os conjuntos original e IM
A distância ou divergência de Kullbach-Leibler (KL) é uma medida da diferença
entre duas distribuições. A KL foi utilizada para comparar as distribuições de cada
variável. Em termos gerais, houve pouca variação na distribuição das variáveis, o que
O primeiro momento de retreino, retirando-se 4 variáveis, não foi bem sucedido,
com exceção ao modelo III, que teve uma leve melhora segundo o índice SP. O segundo
momento de retreino, retirando-se 10 variáveis da base, mostrou uma melhora ainda
maior para o caso do modelo III, porém, neste trabalho só houve retreino, nessas
condições, para esse modelo. Seria interessante, como continuação desse trabalho,
retreinar os demais modelos sem as 10 variáveis, de modo a verificar se são obtidos
melhores desempenhos ou se foi somente um caso isolado.
O modelo IV teve uma piora significativa, quando poderia se esperar uma leve
melhora, mesmo tendo sido retreinados apenas com a base sem as 4 variáveis do
primeiro momento. Isso pode ser devido à maior complexidade desse modelo, que torna
difícil o seu treinamento e prejudica portanto o seu desempenho de generalização.
66
Capítulo 5 - Conclusão e Trabalhos Futuros
Em diversas áreas, os sistemas de apoio à decisão tem se mostrado
importantes no suporte a processos decisórios que levam em conta uma grande
quantidade de dados, que, muitas vezes, são de alta dimensionalidade. Sobretudo na
área médica, onde os impactos das decisões afetam os recursos dos sistemas de saúde e
a própria saúde dos pacientes e da população em geral, e onde também há muitos
desafios a serem superados, ter apoio tecnológico de qualidade se torna cada dia mais
necessário.
A tuberculose pleural é uma doença de difícil diagnóstico, necessitando de
alto poder de detecção, de modo a evitar que a doença evolua nos pacientes infectados.
Ao mesmo tempo, os exames comuns para tuberculose pulmonar tem baixo
desempenho frente ao caso pleural, e os demais são ou caros, ou invasivos, ou
demorados.
Este trabalho teve como objetivo avaliar a relevância das variáveis contidas
na base de dados de pacientes suspeitos de tuberculose pleural, com o intuito de prover
melhores informações para alimentar sistemas classificadores que irão atuar no processo
de triagem de pacientes. Trabalhou-se com dados que não são comumente utilizados,
mas que estão disponíveis, de modo extrair deles informação útil mas que é
subutilizada. Por outro lado, procurou-se identificar também as variáveis que tem baixa
relevância para o problema descrito, visando elaborar modelos com base apenas em
dados que irão contribuir para um bom desempenho.
67
Foram utilizados modelos de Redes Neurais Artificiais para verificar a relevância de
variáveis relacionadas a dados pessoais e a dados sociais, ao passo que geralmente os
SAD para apoio à área da saúde se utilizam de dados sintomáticos e de resultados de
exames. Após análise da relevância, os modelos foram retreinados, eliminando-se as
variáveis de baixa contribuição, no sentido de obter modelos mais robustos ou ainda de
melhor desempenho.
Dentre as variáveis estudadas, algumas apresentaram baixa relevância,
como o gênero, a renda, o tipo de emprego, se foi morador de rua, ou ainda confundiram
os modelos, atrapalhando seu desempenho, como foi o caso da variável número de
cômodos. Por outro lado, variáveis como o número de pessoas com que convive se
mostraram bastante relevantes, assim como o grau de instrução do chefe de família.
Ao se remover as variáveis consideradas de baixa relevância, pode-se
elaborar modelos para reavaliar o problema de classificação. Num primeiro momento,
retirando-se apenas 4 variáveis, os resultados não foram satisfatórios. Já num segundo
momento, retirando-se 10 variáveis, obteve-se um bom resultado, melhorando o
desempenho do modelo. Foi possível, ainda, propor modelos de redes neurais que
tiveram bom desempenho no problema de classificação de pacientes com tuberculose
pleural, tendo o melhor modelo proposto 100% de sensibilidade e 90% de
especificidade. Vale ressaltar que os resultados obtidos estão restritos à população de
estudo, devendo haver cuidado na aplicação destes resultados a outras populações.
Como trabalhos futuros, podem ser feitas extensões deste trabalho, por
exemplo, reavaliando treinamentos de mais modelos e retirando-se um número mais
adequado de variáveis, ou ainda, utilizando-se de técnicas que permitem visualização
dos dados, como as Redes Neurais do tipo Self-Organizing Maps (SOM). Outras
variáveis poderiam ser avaliadas, como, por exemplo, variáveis sintomáticas.
68
Referências
[1] CASCÃO, L. V. C. Modelos de Inteligência Computacional para Apoio à Triagem de Pacientes e Diagnóstico Clínico de Tuberculose Pulmonar. Dissertação de M. Sc., Programa de Engenharia Elétrica, COPPE/UFRJ, Rio de Janeiro, RJ, Brasil – 2011.
[2] HAYKIN, S. Neural Networks and Learning Machines. Prentice Hall, Inc., 2008. [3] EL-SOLH, A. A., HSIAO, C., GOODNOUGH, S., et al. “Predicting active
pulmonary tuberculosis using an artificial neuronal network”, Chest, n. 4, pp. 968-973 – 1999.
[4] SANTOS, A. M. Redes Neurais e Árvores de Classificação Aplicadas ao
Diagnóstico de Tuberculose Pulmonar Paucibacilar. Tese de D. Sc., COPPE / UFRJ, Rio de Janeiro, RJ, Brasil, 2003.
[5] SANTOS, A. M., PEREIRA, B., SEIXAS, J. M., et al. “Neural Networks: An
Application for Predicting Smear Negative Pulmonary Tuberculosis”, Advances in Statistical Methods for the Health Sciences, pp. 279-289 – 2007.
[6] SEIXAS, J. M., FARIA, J., SOUZA FILHO, J. B. O., VIEIRA, A.F.M., KRITSKI,
A., TRAJMAN, A. “Artificial neural network models to support the diagnosis of pleural tuberculosis in adult patients”, The International Journal of Tuberculosis and Lung Disease, pp. 682-686 – 2013.
[7] BETHLEM, E. P. “Manifestações Clínicas da Tuberculose Pleural, Ganglionar,
Geniturinária e do Sistema Nervoso Central”, Pulmão RJ, 21(1), pp. 19-22 – 2012.
[8] CAPONE, D. et al. “Tuberculose Extrapulmonar”, Revista do Hospital
Universitário Pedro Ernesto UERJ, Ano 5, Julho / Dezembro – 2006. [9] ARUN GOPI, M.B.B.S. et al. “Diagnosis and Treatment of Tuberculous Pleural
Effusion in 2006”, Chest, 131(3), Março – 2007. [10] SEISCENTO, M. et al. “Tuberculose Pleural”, Jornal Brasileiro de
Pneumologia, 32(4), pp. 174-181 – 2006. [11] OHRAN, E. et al. “Tuberculosis Disease Diagnosis Using Artificial Neural
Networks”, Journal of Medical Systems, 34, pp. 299-302 – 2010. [12] WHO. “Diagnóstico de Tuberculose Extrapulmonar em Adultos e Crianças”,
TB / HIV: Manual Clínico, Cap. 5, pp. 79-94 – 2004. [13] NEVES, D. D. et al., “Rendimento de variáveis clínicas, radiológicas e
laboratoriais para o diagnostico de tuberculose pleural”. Jornal Brasileiro de Pneumologia, 30, 4, Julho / Agosto – 2004.
69
[14] NEVES, D. D. et al., “Predictive Model for the Diagnosis of Tuberculous Pleural Effusion”, The Brazilian Journal of Infectious Diseases, 11(1), pp. 83-88 – 2007.
[15] TRAJMAN, A. et al., “Novel tests for diagnosing tuberculous pleural effusion:
what works and what does not?” European Respiratory Journal, pp. 1098-1106 – 2008.
[16] NUNES, L. N. et al. “Uso da imputação múltipla de dados faltantes: uma
simulação utilizando dados epidemiológicos”, Cad. Saúde Pública, Rio de Janeiro, 25(2), pp. 268-278 – fevereiro 2009.
[17] RUBIN, D. B. “Multiple imputation for nonresponse in surveys”. Nova Iorque:
Wiley – 1987. [18] KALANTRI, Y. et al. “Evaluation of real-time polymerase chain reaction,
interferon-gamma, adenosine deaminase, and immunoglobulin A for the efficient diagnosis of pleural tuberculosis”, International Journal of Infectious Diseases, pp.226-231 – 2011.
[19] Portal Brasil – “Teste rápido para diagnosticar tuberculose sera oferecido no