MODELOS DE INTELIG ˆ ENCIA COMPUTACIONAL PARA APOIO ` A TRIAGEM DE PACIENTES E DIAGN ´ OSTICO CLINICO DE TUBERCULOSE PULMONAR Lu´ ıs Victor Coelho Casc˜ ao Disserta¸c˜ ao de Mestrado apresentada ao Programa de P´os-gradua¸ c˜ao em Engenharia El´ etrica, COPPE, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necess´ arios ` a obten¸ c˜aodot´ ıtulo de Mestre em Engenharia El´ etrica. Orientadores: Jos´ e Manoel de Seixas Afrˆ anio Lineu Kritski Rio de Janeiro Outubro de 2011
123
Embed
Modelos de Inteligência Computacional para Apoio à Triagem ...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
MODELOS DE INTELIGENCIA COMPUTACIONAL PARA APOIO A
TRIAGEM DE PACIENTES E DIAGNOSTICO CLINICO DE TUBERCULOSE
PULMONAR
Luıs Victor Coelho Cascao
Dissertacao de Mestrado apresentada ao
Programa de Pos-graduacao em Engenharia
Eletrica, COPPE, da Universidade Federal do
Rio de Janeiro, como parte dos requisitos
necessarios a obtencao do tıtulo de Mestre em
Engenharia Eletrica.
Orientadores: Jose Manoel de Seixas
Afranio Lineu Kritski
Rio de Janeiro
Outubro de 2011
MODELOS DE INTELIGENCIA COMPUTACIONAL PARA APOIO A
TRIAGEM DE PACIENTES E DIAGNOSTICO CLINICO DE TUBERCULOSE
PULMONAR
Luıs Victor Coelho Cascao
DISSERTACAO SUBMETIDA AO CORPO DOCENTE DO INSTITUTO
ALBERTO LUIZ COIMBRA DE POS-GRADUACAO E PESQUISA DE
ENGENHARIA (COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE
JANEIRO COMO PARTE DOS REQUISITOS NECESSARIOS PARA A
OBTENCAO DO GRAU DE MESTRE EM CIENCIAS EM ENGENHARIA
ELETRICA.
Examinada por:
Prof. Jose Manoel de Seixas, D.Sc.
Prof. Afranio Lineu Kritski, D.Sc
Prof. Mariane Rembold Petraglia, Ph.D.
Dr. Paulo Albuquerque da Costa, D.Sc.
Prof. Alcione Miranda dos Santos, D.sc.
Prof. Marley Maria Bernardes Rebuzzi Vellasco, Ph.D.
RIO DE JANEIRO, RJ – BRASIL
OUTUBRO DE 2011
Cascao, Luıs Victor Coelho
Modelos de Inteligencia Computacional para Apoio a
Triagem de Pacientes e Diagnostico Clinico de Tuberculose
Pulmonar/Luıs Victor Coelho Cascao. – Rio de Janeiro:
UFRJ/COPPE, 2011.
XIV, 109 p.: il.; 29, 7cm.
Orientadores: Jose Manoel de Seixas
Afranio Lineu Kritski
Dissertacao (mestrado) – UFRJ/COPPE/Programa de
Engenharia Eletrica, 2011.
Referencias Bibliograficas: p. 99 – 104.
1. Sistema de Apoio a Diagnostico. 2. Mapas
Auto-Organizaveis. 3. Tuberculose. 4. Escore
de Triagem e Diagnostico. I. Seixas, Jose Manoel de
et al. II. Universidade Federal do Rio de Janeiro, COPPE,
Programa de Engenharia Eletrica. III. Tıtulo.
iii
Aos meus pais Luiz Augusto e
Eliane, ao meu irmao Luıs
Bernardo e a toda minha famılia.
iv
Agradecimentos
• A Deus, pela saude e disposicao que me permitiram a realizacao deste trabalho.
• A minha famılia pela educacao que me deram e pela infra-estrutura que me
permitiu mais esta conquista. Alem disto, agradeco pelo contınuo incentivo,
pelo investimento e pela paciencia.
• A minha namorada Juliana Freixo e a sua famılia pelo apoio, compreensao,
carinho e ajuda incondicional.
• Ao meu orientador Jose Manoel de Seixas pela confianca e toda a sua ajuda
que foram fundamentais para realizacao desse trabalho.
• A todos do Programa Academico de Tuberculose da Faculdade de Medicina
da UFRJ, em especial ao meu orientador Dr. Afranio Kritski e ao Dr. Paulo
Albuquerque pelas discussoes, sugestoes e crıticas realizadas ao longo deste
trabalho
• Aos amigos de longa data pelo apoio, pela paciencia e pelos momentos de
descontracao.
• Aos colegas que ajudaram na realizacao do mestrado em especial: Rodrigo
Torres, Felipe Grael, Fernando Ferreira, Joao Baptista, Thiago Ciodaro, Diego
Rodrigues, Eduardo Simas, Jose Marcio Faier, Natanael Moura, Moura Jr. e
Andressa Sivolella pelas dicas e sugestoes dadas neste trabalho.
• Aos funcionarios do LPS por estarem sempre dispostos a ajudar e pela infra-
estrutura disponibilizada no laboratorio.
v
• Ao Prof. Antonio Carlos Fernandes, Ivan Falcao, Fabio Moreira Coelho, Luiz
Antonio Ferreira, Anderson Araujo do Santos e Anderson Ricardo Soares e
todos os alunos do Laboratorio de Ondas e Correntes pelo apoio e companhei-
rismo dado ao longo desses ultimos tres anos.
vi
Resumo da Dissertacao apresentada a COPPE/UFRJ como parte dos requisitos
necessarios para a obtencao do grau de Mestre em Ciencias (M.Sc.)
MODELOS DE INTELIGENCIA COMPUTACIONAL PARA APOIO A
TRIAGEM DE PACIENTES E DIAGNOSTICO CLINICO DE TUBERCULOSE
PULMONAR
Luıs Victor Coelho Cascao
Outubro/2011
Orientadores: Jose Manoel de Seixas
Afranio Lineu Kritski
Programa: Engenharia Eletrica
A tuberculose (TB) e uma das principais enfermidades que acomete a humani-
dade. Um dos principais desafios para o controle da TB e a baixa taxa de deteccao
dos casos. Como a tosse cronica e o sintoma mais comum da TB pulmonar, nao
tem sido eficaz a recomendacao de que todos os pacientes que apresentem tosse por
3 semanas ou mais devem fazer o exame de escarro. Portanto, novas tecnologias e
abordagens que sejam apropriados para o uso em paıses em desenvolvimento sao ne-
cessarias para que se tenha um diagnostico rapido dos casos de TB. Neste trabalho e
proposto a utilizacao de metodos de otimizacao e processamento neural para o apoio
a triagem dos pacientes e ao diagnostico medico da TB, utilizando um conjunto de
pacientes de referencia atendidos na Policlınica Augusto Amaral Peixoto, situado
no bairro de Guadalupe, no Rio de Janeiro. Baseado num questionario de sintomas
e identificado o grupo de risco e calculado o escore de triagem, que da a chance
do paciente ser portador de TB pulmonar, com 81,4% de sensibilidade e 61,3% de
especificidade.
vii
Abstract of Dissertation presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Master of Science (M.Sc.)
MODELS OF COMPUTATIONAL INTELLIGENCE TO SUPPORT PATIENT
SCREENING AND CLINICAL DIAGNOSIS OF PULMONARY
TUBERCULOSIS
Luıs Victor Coelho Cascao
October/2011
Advisors: Jose Manoel de Seixas
Afranio Lineu Kritski
Department: Electrical Engineering
Tuberculosis (TB) is one of the main deseases affecting mankind. One of the
main challenge for TB control is the low rate of detection of cases. As chronic cough
is the most common symptom of pulmonary TB, has not been effective the recom-
mendation that all patients suffer from cough for three weeks or more should do the
sputum smear examination. Therefore, new diagnostic technologies and approaches
that are appropriate for usage in developing countries are necessary in order to have
a rapid diagnosis of TB cases. This work proposes the use of optimization meth-
ods and neural processing to support patient screening and medical diagnosis of
TB, using a reference set of patients treated at the Health Center Augusto Amaral
Peixoto,located on the neighborhood of Guadalupe at Rio de Janeiro. Based on a
set of symptoms is identified the patient’s risk group and calculated the screening
score, which gives the patient’s chance of having contracted tuberculosis, with 81.4%
Devido aos avancos da informatica temos que lidar com volume de dados cada vez
maiores e de maior complexidade, devido a diferentes possibilidades de usos que
possam existir nos sistemas informatizados existentes. Portanto, cada vez mais se faz
necessaria a utilizacao de sistemas de apoio a decisao (SAD). Os SADs sao sistemas
que ajudam o homem em tarefas que envolvem tomadas de decisao, compilando
uma grande quantidade de dados a serem analisados, documentos, conhecimento
previo sobre o tema ou modelos matematicos para identificar e achar uma solucao
que auxilia a decisao requerida para o problema.
Os SAD sao amplamente utilizados na area de financas, na analise de credito;
marketing, no auxilio a definicao do publico-alvo para as campanhas; engenharia,
no suporte ao gerenciamento de custos de projetos e, em particular, na area medica.
Na area medica, o principal objetivo do SAD e auxiliar no servico medico de
diagnostico e prognostico nas unidades de saude que prestam a atencao primaria,
fazendo com que o profissional de saude interaja com o sistema, que o pode apoiar
na triagem, diagnostico ou acompanhamento de um determinado paciente.
Em geral, e desejavel que os sistemas de apoio a triagem e diagnostico medico
apresentem as seguintes caracterısticas: alta eficiencia na deteccao da doenca em
questao, aliada a uma baixa incidencia de falsos alarmes (falsos positivos); facil
implementacao e uso; propriedades que agilizem o servico medico. E com os avancos
nas tecnicas de inteligencia computacional e aprendizado de maquinas, almeja-se
1
que os sistemas aprendam com as experiencias passadas e/ou reconhecam padroes
ou caracterısticas relevantes nos dados clınicos dos pacientes.
O crescente aumento de informacao que pode estar disponıvel sobre o paciente
para o profissional de saude pode dificultar o julgamento clınico, principalmente
em reconhecer padroes recorrentes, devido a dificuldade inerente do ser humano em
tratar de dados em alta-dimensionalidade.
Portanto, e possıvel usar metodos baseados no conhecimento especialista sobre o
problema, juntamente com metodos estatısticos lineares e nao-lineares de reconhe-
cimento de padroes e extracao de caracterıstica , de modo que se possa desenvolver
um sistema de apoio a decisao clınica.
1.1 Motivacao
A potencialidade de utilizacao de sistemas de apoio a diagnostico, baseados em es-
tatısticas, na area medica, deve-se a diversos fatores economicos-socias, bem como,
pelo fato de algumas doencas apresentarem testes diagnosticos de sensibilidade li-
mitada, como e o caso da tuberculose (TB).
A TB e umas das principais enfermidades que acometem a humanidade e consti-
tui um serio problema de saude publica. Segundo a Organizacao Mundial de Saude
(OMS), aproximadamente um terco da populacao mundial esta infectada por My-
cobacterium tuberculosis, agente causador da tuberculose. No ano de 2009 foram
registrados 9,4 milhoes de novos casos e houve 1,7 milhoes de mortes devido a en-
fermidade, apesar de existir tratamento medicamentoso com elevada eficacia.
No Brasil, segundo o Ministerio da Saude, em 2009, foram registrados 73.598
novos casos de TB e 70.601 novos casos em 2010. O Rio de Janeiro e o estado com a
maior taxa de incidencia da doenca de todo o paıs, com 71,79 novos casos por cem
mil habitantes no ano de 2010.
Um dos fatores que mais favoreceu o aumento da incidencia da TB foi a co-
infeccao pelo vırus da imunodeficiencia humana (HIV). A associacao (HIV/TB)
constitui um serio problema de saude publica, podendo levar ao aumento da morta-
2
lidade pela tuberculose.
Outros fatores socio-economicos, como a falta de sistemas publicos de saude
eficientes a desigualdade social, o crescimento da populacao marginalizada rural e
urbana sao relacionados com o aumento da incidencia de TB.
A TB pulmonar e uma doenca infecto-contagiosa, que e transmitida pelo ar. A
importancia da doenca pulmonar decorre da forma de transmissao da TB, que ocorre
por via aerea atraves da inalacao do agente causador, eliminado no meio ambiente
pelo doente com TB pulmonar. Entretanto, a TB tambem pode ocorrer em qualquer
area do corpo humano, TB extrapulmonar, sendo mais frequentes na pleura e nos
linfonodos. Tambem pode atingir o sistema urogenital, ossos, articulacoes, fıgado,
baco, sistema nervoso central e pele.
O diagnostico da TB pulmonar e feito com base nos sinais e sintomas relatados
pelo paciente, associados ao uso de testes diagnosticos. A baciloscopia e a cultura
para micobacteria tem sido indicados como dois testes fundamentais para diagnostico
da tuberculose pulmonar.
A baciloscopia direta do escarro e o exame prioritario para os casos suspeitos de
TB pulmonar, porque permite descobrir a fonte mais importante de infeccao, que e
o paciente bacilıfero. Por ser um metodo simples e seguro, e praticado em todos os
servicos de saude que disponham de laboratorio. Entretanto, a baciloscopia possui
uma baixa sensibilidade, podendo apresentar resultados falsos-negativos de 30 a 40%
dos casos.
A cultura e o teste mais sensıvel para o diagnostico da TB pulmonar e considerada
padrao ouro. Sendo este teste indicado para suspeitos de tuberculose pulmonar
persistentemente negativos ao exame direto do escarro. Entretanto, poucas unidades
de saude primarias ou hospitalares tem acesso a cultura. Como a cultura, em meio
solido, leva de 4-8 semanas para ser interpretada, impossibilita seu uso como primeira
linha de diagnostico. Existem metodos automatizados de cultura em meio liquido,
logo, mais rapidos e mais caros; porem, ficam restritos a laboratorios de referencia.
Nos casos suspeitos de tuberculose pulmonar paucibacilar, sem expectoracao ou
3
com baciloscopia negativa, constituem cerca de 29% dos casos notificados de tuber-
culose pulmonar no Brasil em 2009. Portanto, na ausencia da cultura, muitos casos
paucibacilares sao diagnosticados com base nos sintomas clınicos, exames radiologi-
cos e outros testes laboratoriais, tendo a chance diminuıda de um diagnostico correto
usando tecnicas rotineiras.
O diagnostico da TB, da forma como usualmente e feito, tende a produzir um
atraso na identificacao do doente, retardando-lhe o tratamento e permitindo que a
transmissao do bacilo ocorra, contaminando outras pessoas.
1.2 Objetivos
Os exames rotineiros, utilizados para o diagnostico de TB pulmonar, nem sempre
sao suficientes para a deteccao dos pacientes com TB pulmonar ativa. A falha na
deteccao do paciente portador do bacilo facilita a transmissao da doenca. Segundo
a OMS, a melhoria na deteccao dos casos implica diretamente na diminuicao da
incidencia da doenca.
Logo, obter um sistema que, alimentado com dados clinıcos que tenham quali-
dade e que sejam representativos de determinada realidade, seja capaz de identificar
um paciente com TB pulmonar ativa, pode colaborar significativamente na pratica
clınica e na tomada de decisao clınica, assim como, entender o relacionamento dos
sintomas com a doenca.
Este trabalho objetiva produzir um escore clinıco para TB pulmonar de facil uti-
lizacao pela equipe de enfermagem em sıtios com recursos limitados. Para tal, serao
utilizadas redes neurais nao-supervisionadas do tipo Self Organizing Map (SOM),
procurando obter agrupamentos entre pacientes, com base nos sintomas e sinais de-
clarados, e a relacao entre os sintomas clınicos e a presenca de TB pulmonar na
populacao em estudo, e metodos de otimizacao e classificacao para elaboracao do
escore em si.
O escore a ser obtido deve ser de facil utilizacao em postos de saude que nao
disponham de recursos computacionais, onde nao possam ser utilizados sistemas
4
de apoio ao diagnosticos mais refinados. Partindo destas premissas, tal sistema de
ponderacao, escore, se restringira a uma ponderacao composta somente por numero
inteiros, visando um rapido calculo pelo profissional de saude, agilizando a triagem
dos pacientes e, eventualmente, orientando o tratamento da doenca em situacoes
onde os recursos humanos sejam bastante limitados.
Objetiva-se como desdobramento desse trabalho, a utilizacao do escore em par-
ceria com a Faculdade de Medicina na triagem dos pacientes atendidos no Hospital
Universitario Clementino Fraga Filho e na Policlınica Augusto do Amaral Peixoto,
onde os dados para este trabalho foram coletados.
1.3 Apresentacao do Trabalho
No proximo capıtulo, e apresentada uma breve introducao da doenca em estudo,
definindo os principais sintomas da doenca e o seu processo de diagnostico. Assim
como uma revisao bibliografica sobre diferentes trabalhos desenvolvidos para siste-
mas de apoio a decisao na area medica e tecnicas utilizadas no diagnostico da TB,
por meios de inteligencia computacional.
No capıtulo 3, e apresentada a base de dados a ser utilizada e o escore que hoje
em dia e utilizado na Policlınica Augusto do Amaral Peixoto que sera a referencia
de eficiencia deste trabalho.
No capıtulo 4 e realizada a investigacao inicial sobre a existencia de agrupamentos
nos casos da base de dados, e o relacionamento entre os sintomas clınicos e os
agrupamentos, utilizando redes neurais nao-supervisionadas do tipo SOM. Tambem
sao descritas as diversas tecnicas que foram utilizadas no projeto dos diferentes
escores de triagem de TB pulmonar desenvolvido.
Ja no capıtulo 5, sao apresentados os resultados obtidos para os diferentes escores
produzidos neste trabalho. As conclusoes e discussoes sobre o uso do escore no diag-
nostico da TB pulmonar sao apresentadas no capıtulo 6, assim como as perspectivas
futuras para a continuidade dos trabalhos de pesquisa.
5
Capıtulo 2
Tuberculose Pulmonar
Neste capıtulo, sera apresentada a doenca em estudo, trazendo na secao 2.1 um
panorama sobre a TB no mundo. Na secao 2.2 serao abordados os fatores de risco
associados com a tuberculose. Ja na secao 2.3, serao definidos os sinais e sintomas
da doenca. Por fim, a secao 2.4 mostra o processo de diagnostico da tuberculose
pulmonar e o sistemas de apoio a essa tarefa existentes .
2.1 Introducao
A tuberculose e, certamente, uma das mais antigas doencas que afligem a
humanidade[1]. No cenario brasileiro, vem se firmando como uma das principais
causas de morbi/mortalidade, atingindo indistintamente diversas faixas etarias e
classes sociais [3].
A principal fonte de infeccao e o homem, e raramente algumas regioes, o gado
bovino [4]. Entende-se por fonte de infeccao qualquer vetor capaz de transmitir o
bacilo da tuberculose. Em geral, a fonte de infeccao e o indivıduo com a forma
pulmonar da doenca, eliminando bacilos para o exterior. Calcula-se que durante um
ano, numa comunidade, uma fonte de infeccao podera infectar, em media, de 10 a
15 pessoas que com ela tenham tido contato [5].
Estima-se que cerca de 2 bilhoes de indivıduos em todo o mundo estejam infecta-
dos por Mycobacterium tuberculosis, correspondendo a 30% da populacao mundial,
6
sendo que novas infeccoes ocorrem a uma taxa de uma por segundo [1]. A proporcao
de pessoas que contraem TB a cada ano esta estavel ou decaindo mundialmente
porem, devido ao crescimento populacional , os numeros absolutos de novos casos
continua crescendo.
Segundo a OMS, em 2009, estima-se a ocorrencia de 9,4 milhoes de novos casos
e 1,3 milhoes de mortes [1]. A distribuicao dos casos de tuberculose nao e uniforme
pelo mundo, como pode ser visto na figura 2.1. Um total de 22 paıses, principalmente
da Asia e Africa, e responsavel por 80% dos casos de tuberculose. No Brasil, 19o
paıs em numero de casos de TB, no mesmo perıodo de tempo, foram notificados
94 mil casos de doentes cronicos, 87 mil novos casos detectados e ocorreram 4 mil
mortes devido a tuberculose [1] [6].
Figura 2.1: Estimacao da taxa de incidencia de TB em 2009. Fonte OMS [1]
Analisando-se mais a fundo os casos de tuberculose no Brasil, as regioes Norte e
Centro-Oeste sao as regioes que tem a maior e a menor taxa de incidencia do Myco-
bacterium tuberculosis respectivamente. Se tratando dos estados individualmente, o
estado do Rio de Janeiro tem a maior incidencia de novos casos da doenca 74,06 por
100.000 habitantes enquanto a media nacional foi de 38,41 novos casos por 100.000
7
habitantes, no ano de 2009[6]. Ja no municıpio do Rio de Janeiro, onde foram co-
letados os dados deste trabalho, em 2009 a taxa de incidencia da tuberculose foi de
66,4 novos casos por 100.000 habitantes [2].
Varios eventos contribuıram para o atual panorama da TB no mundo: o aumento
de casos de infeccao por HIV [7], a deterioracao das condicoes socio-economicas
de parte da populacao mundial, alto ındice de abandono do tratamento anti-
tuberculose, o aparecimento da multi-resistencia e a falta de interesse da comunidade
cientıfica e dos governos em desenvolver polıticas publicas em relacao a TB, ao nao
incentivar o desenvolvimento de novos instrumentos para o controle da TB [8]. A
concentracao dos casos, nas areas urbanas, em particular nas Unidades Hospitalares
e Prisoes, locais de elevada concentracao de pessoas e as vezes com prevalencia de pa-
cientes com co-morbidades, tambem propiciou um aumento do risco de transmissao
da infeccao e de adoecimento por TB.
Desde que a OMS, em 1993, declarou a tuberculose em estado de emergencia
mundial, o Brasil sinalizou, com marcos pontuais, sua posicao frente as novas pers-
pectivas do problema. O Ministerio da Saude lancou, em 1998, o Plano Emergencial
para o controle da doenca, recomendando a implantacao da Estrategia do Trata-
mento Diretamente Observado (DOTS) para o controle da Tuberculose no Brasil.
Dada a permanencia do problema, com altas taxas de abandono do tratamento,
com baixo percentual de cura e de deteccao dos casos, em 1999 foi lancado o Plano
Nacional de Controle da Tuberculose [3].
A estrategia DOTS tem como objetivo detectar 70% dos casos que apresentaram
baciloscopia positiva, tratar corretamente 85% dos casos detectados e reduzir para
5% o abandono ao tratamento [1], sendo constituıda de cinco componentes:
• Comprometimento governamental
Colocando como prioridade entre as polıticas publicas de saude o desen-
volvimento de sistemas de controle, monitoramento e treinamento em TB.
• Deteccao de novos casos
8
Deteccao de casos por baciloscopia entre os casos atendidos nas unidades
de saude.
• Tratamento padronizado
Regime de tratamento diretamente observado por um profissional de saude
por no mınimo dois meses.
• Fornecimento regular de farmacos
• Registro das Informacoes
Sistema de registro de informacao que assegure a avaliacao do tratamento.
Baseado no sucesso da estrategia DOTS, porem reconhecendo a necessidade de
expansao do seu escopo, a OMS lancou em 2006 o programa Stop TB que da as
diretrizes de implementacao da estrategia DOTS entre outras. Os principais obje-
tivos do Stop TB e conseguir, ate 2015, detectar 84% dos casos de TB e conseguir
tratar corretamente 87% dos casos detectados. Com isso se espera reduzir a metade
as mortes por TB em 2015 em comparacao ao ano de 1990 [9].
2.2 Fatores de Risco
A TB pulmonar esta associada com a situacao socio-economica, a desnutricao, ma
condicoes de higiene e saude publica deficitaria [10]. O risco de se contrair TB
aumenta em decorrencia do contato frequente com portadores da forma pulmonar
da doenca, presenca em locais de grandes aglomeracoes ou de condicoes de vida
insalubres e alimentacao precaria.
Pessoas com o sistema imunologico debilitado, como acontece com os portadores
da Sındrome da Imunodeficiencia Adquirida (SIDA), aquelas fazendo tratamento de
quimioterapia e receptores de transplantes, que tomam medicamentos contra rejei-
cao, apresentam risco maior de contrair a doenca. Tambem sao mais susceptıveis a
doenca criancas e idosos, indivıduos com ma nutricao, profissionais de saude, minei-
ros portadores de silicose, indivıduos dependentes do alcool, aqueles que fazem uso
9
de medicamentos como corticoides, portadores de outras doencas como o diabetes
mellitus e neoplasias malignas[11].
2.3 Sinais e Sintomas
A doenca costuma aparecer algumas semanas apos a infeccao primaria, podendo,
ainda, ficar latente durante anos antes de causar a doenca. Se o sistema de defesa do
organismo estiver em condicoes normais, na maioria dos casos, a bacteria nao causara
a doenca, ficando latente. Se, em algum momento da vida, o sistema imunologico
ficar debilitado, a bacteria que estava latente podera entrar em atividade e vir a
causar a doenca, chamada de TB pos-primaria. Mas, tambem ha a possibilidade
da doenca se desenvolver no primeiro contato da pessoa com o bacilo, chamada TB
primaria.
No inıcio, a TB pulmonar apresenta-se assintomatica, isto e, sem sinais ou sin-
tomas. Em geral, esses so aparecem quando a lesao torna-se visıvel em exames
radiologicos, ou quando e possıvel se observar o bacilo infiltrado no pulmao. Com
o agravamento da doenca, surgem novos sintomas. Os principais sintomas e sinais
da forma pulmonar sao: tosse ha mais de 15 dias, geralmente com expectoracao,
cansaco, febre vespertina, sudorese noturna, perda de apetite, emagrecimento, he-
moptoicos (escarro com estrias de sangue) e hemoptise (escarro de sangue) [5] .
A evolucao da tuberculose e muito variavel, apresentando-se com sintomas leves
ou ausentes. Frequentemente, na fase inicial da doenca, a suspeita baseia-se nas
avaliacoes obtidas mediante radiografias de torax. Em adultos, a grande maioria
dos casos de TB pulmonar inicia-se com uma lesao no pulmao.
2.4 Diagnostico
O diagnostico clınico e a identificacao de uma doenca por meio da anamnese e exame
fısico do paciente [12]. De um modo geral, o processo de diagnostico pode ser visto
como uma tarefa de decisao, que e realizada com base nos sinais, nos sintomas e
10
outros indıcios laboratoriais. Frequentemente, esse processo envolve incertezas dos
exames, devido as variacoes entre os pacientes, erros na observacoes dos sintomas
entre outros motivos.
Os testes diagnosticos, quantitativos ou qualitativos, podem ser utilizados para
a identificacao de fatores de risco especıficos, ou no processo de diagnostico de uma
doenca. Portanto, eles podem uteis no tratamento do doente, avaliando a gravidade
da doenca, no estabelecimento do seu prognostico e na monitorizacao da evolucao
clınica do paciente.
O teste de diagnostico pode resultar em quatro possibilidades: o teste e positivo
e o paciente tem a doenca (detecao ou sensibilidade); o teste e positivo, porem o
paciente nao tem a doenca (falso-positivo); o teste e negativo, mas o paciente tem
a doenca (falso-negativo) e por ultimo o teste e negativo e o paciente nao tem a
doenca (especificidade do teste).
Um teste muito sensıvel e util para detectar a presenca da doenca em indivıduos
doentes, podendo ser utilizado numa fase inicial de triagem dos pacientes. Por outro
lado, um teste muito especıfico serve para excluir a presenca da doenca em indivıduos
sadios, sendo util na fase de diagnostico, apos a triagem dos pacientes.
O diagnostico de TB pulmonar pode ser feito pela identificacao dos sinais e
sintomas, mas sao necessarios exames para se confirmar a presenca do bacilo da
TB. Para isso, os principais exames sao: radiografia do torax e exames de escarro (
baciloscopia e cultura)
A baciloscopia do escarro e o metodo utilizado rotineiramente para a identificacao
do bacilo causador da TB por ser um exame simples, barato e de facil execucao.
Entretanto, este exame tem baixa sensibilidade, em media de 60%, em pacientes
com cultura positiva, nao sendo capaz de discriminar a especie da micobacteria [13].
Ja a cultura para o bacilo da TB e um metodo mais sensıvel, pois detecta 70%
a 89% dos casos, em media 80%, e permite a identificacao da especie da micobac-
teria, atraves de testes bioquımicos ou geneticos [14]. Porem, esse metodo e muito
demorado, visto que o resultado da cultura fica disponıvel entre 15 a 60 dias apos a
11
coleta do material respiratorio. Portanto, nos pacientes com baciloscopia negativa
no escarro, o diagnostico da TB e geralmente tardio. Logo, o doente estara dissemi-
nando a micobacteria na comunidade e, em pacientes com HIV, este retardo pode
ser fatal.
O exame radiologico do torax e auxiliar no diagnostico da tuberculose,
justificando-se sua utilizacao, se possıvel, nos casos suspeitos. Este exame per-
mite a identificacao de pessoas portadoras de imagens sugestivas de tuberculose ou
de outras enfermidades. O exame radiologico, em pacientes com baciloscopia po-
sitiva, tem como funcao principal a exclusao de outra doenca pulmonar associada
que necessite de tratamento concomitante, alem de permitir avaliacao da evolucao
radiologica dos pacientes [8].
Entretanto, cada vez mais se tem verificado que o diagnostico de certas doencas,
inclusive os diversos tipos de TB, pode ser auxiliado ou melhorado por meio da com-
binacao de testes clınicos e modelos estatısticos. Quando formulados de uma forma
sistematica e com uma base de dados consistente, esses modelos podem represen-
tar o problema clınico em questao, atuando como sistema de apoio ao diagnostico.
Ajudando os profissionais de saude nas suas rotinas clinicas, assim como na admi-
nistracao de polıticas publicas de saude [15].
Hoje em dia, os modelos estatısticos mais utilizados no apoio ao diagnostico sao:
• Regressao Logıstica;
• Redes Bayesianas;
• Arvores de Decisao;
• Redes Neurais Artificiais.
A regressao logıstica e uma tecnica bastante utilizada que tem como objetivo
produzir, a partir de um conjunto de observacoes, um modelo que permita a predicao
de valores tomados por uma variavel categorica, frequentemente binaria, a partir de
uma serie de variaveis explicativas contınuas e/ou binarias [16].
12
Esta tecnica e amplamente usada na area clınica para identificar os fatores de
risco relacionados com uma doenca de interesse. Entretanto, existem limitacoes no
uso da regressao logıstica, principalmente na area medica, quando nao se tem uma
grande quantidade de dados para serem utilizados nos modelos [17].
Ja as redes bayesianas consistem em uma forma grafica de modelagem que re-
presenta um conjunto de variaveis aleatorias e suas dependencias condicionais em
forma de grafos, podendo, assim, representar a relacao probabilıstica entre doencas e
sintomas. Portanto, atraves das redes bayesianas, podem-se representar as relacoes
de causa e efeito entre as variaveis em estudo [18], podendo ainda ser utilizada como
ferramenta de apoio ao diagnostico medico. Como, por exemplo, para diagnostico
de doencas do coracao [19], cancer de ovarios [20], pneumonia associada a ventila-
cao mecanica [21], entre outras doencas. Entretanto, a especificacao completa de
uma rede bayesiana e uma tarefa complexa, uma vez que requer os valores de to-
das as probabilidades condicionais e as probabilidades a priori de todas as variaveis
explicativas, o que dificulta o seu uso em aplicacoes com grande numero de variaveis.
Outro metodo muito utilizado no apoio ao diagnostico e o referente as arvores de
decisao [22] [23] [24] [25]. Esta tecnica visa particionar recursivamente um conjunto
de dados, ate que cada subconjunto do particionamento contenha casos iguais, o
que forma um modelo graficamente estruturado, compacto e de forte apelo intuitivo
para a classificacao. Entretanto, problemas mais complicados tendem a necessitar de
arvores de decisoes grandes, na qual podem surgir sub-arvores identicas em diferentes
caminhos, alem do fato de quanto maior o numero de decisoes tem se tomar na
arvore, mais nos a se percorrer, menos acurado serao os resultados obtidos.
O uso as redes neurais artificiais [26] ja e uma realidade na area medica, se
mostrando extremamente eficiente em inumeras areas da medicina, principalmente
no auxilio ao diagnostico [27], prognostico e reconhecimento de padroes em sinais
biologicos [28], exames clınicos e imagens medicas [29].
Os modelos estatısticos descritos acima podem auxiliar na triagem de pacientes,
no apoio ao diagnostico, na escolha terapeutica e no prognostico, facilitando a pratica
13
clınica.
Varias metodologias estatısticas, relacionadas ao diagnostico da TB pulmonar,
sao sugeridas na literatura. A seguir, sao apresentadas algumas dessas metodologias.
Bock et al. (1996) [30] utilizando um modelo logıstico multivariado, identificaram
que achados radiologicos no lobulo superior dos pulmoes, exposicao ao bacilo, prova
tuberculınica positiva e a nao utilizacao da terapia preventiva com isoniazida sao
fatores associados ao diagnostico de TB.
Samb et al. (1997) [31] identificaram quatro variaveis clınicas para o diagnostico
de tuberculose pulmonar paucibacilar, atraves de um modelo logıstico multivariado.
As quatro variaveis sao: tosse por mais de 21 dias, dor toracica por mais de 15
dias, expectoracao e dispneia. O diagnostico TB, usando duas das quatro varia-
veis, tem alta sensibilidade (85%) e baixa especificidade (67%). Quando utilizadas
tres das quatro variaveis, a especificidade aumenta levemente (86%), mas reduz a
sensibilidade (49%).
El-Solh et al. (1999) [32] estabeleceram um modelo para identificacao de TB
pulmonar com uso das redes neurais artificiais. Diferentes variaveis foram incluıdas
no modelo, entre elas: idade, diabetes mellitus, SIDA, dor toracica, emagrecimento,
tosse, sudorese, febre, dispneia e achados radiograficos.
Kanaya et al. (2001) [33] criaram escores, baseado em regressao logıstica, para a
predicao de TB pulmonar paucibacilar usando variaveis clınicas como expectoracao,
resultado positivo na prova tuberculınica, achados radiologicos e HIV positivo. Aris
et al. (1999) [34], atraves de um estudo prospectivo, propuseram um sistema de
escores para discriminar TB pulmonar paucibacilar baseado na presenca de resultado
positivo na prova tuberculınica, derrame pleural, sarcoma de Kaposi, linfonodos
aumentados na regiao cervical, linfonodo emaranhados e achados radiologicos no
torax.
Mello (2001) [8] desenvolveu um modelo de regressao logıstica multivariado e
uma arvore de classificacao, utilizando as informacoes sobre achados radiologicos,
presenca de escarro, emagrecimento e idade de pacientes atendidos em regime am-
14
bulatorial na Rede de Saude do Municıpio do Rio de Janeiro, com suspeita de tu-
berculose pulmonar paucibacilar. Obtendo 65,9% de sensibilidade e 60,1% de espe-
cificidade para o modelo de regressao logıstica e 64,2% de sensibilidade e 60,6% de
especificidade para a arvore de classificacao.
Santos (2003) [35] e Santos et al.(2007) [36] trazem um modelo de redes neu-
rais artificiais para um conjunto de pacientes do Hospital Universitario Clementino
Fraga Filho da Universidade Federal do Rio de Janeiro. A amostra tinha 59 casos
com TB pulmonar e 77 casos sem TB, onde foram identificadas as caracterısticas
demograficas (sexo, idade e renda familiar), sintomas clınicos (tosse, febre, sudorese,
emagrecimento, anorexia e outros) e fatores de riscos (diabetes, alcoolismo, SIDA
e outros), totalizando 26 variaveis, tipicamente considerados relevantes e de facil
obtencao por anamnese para o diagnostico da tuberculose. O modelo obteve uma
especificidade de 83% para uma sensibilidade de 71% na classificacao dos casos de
TB paucibacilar.
Benfu et al. (2009) [37] desenvolveram um modelo neural para diagnostico de
TB paucibacilar que utiliza 29 variaveis no modelo, sendo estas relativas as infor-
macoes pessoais (idade, sexo, estado civil, ocupacao), historico medico (alcoolismo,
presenca de doencas cronicas, febre, tosse, sudorese, emagrecimento e outros) acha-
dos radiograficos e exames laboratoriais. Num conjunto de pacientes com 291 casos
de TB positivo e 298 casos de TB negativo, o modelo obteu especificidade de 100%
e sensibilidade de 88,9%.
Ucar et al. (2010) [38] utilizam um modelo de redes bayesianas para diagnosticar
a presenca de TB pulmonar entre 503 pacientes utilizando trinta variaveis clınicas
para a classificacao.
Asha et al. (2010) [39] propoem o uso de esemble methods [40] para o diagnos-
tico da TB pulmonar, pois esse metodo melhora a acuracia da classificacao devido
a votacao entre os classificadores. Para um conjunto de 250 pacientes, usando a
idade, semanas de tosse, emagrecimento, febre, sudorese noturna, hemoptise, dor
toracica, SIDA, achados radiologicos no torax, exame de escarro e chiado no torax
15
como variaveis clınicas, obtendo 80% de sensibilidade e 100% de especificidade para
classificacao da TB pulmonar e 100% de sensibilidade e 80% de especificidade nos
casos de TB pulmonar retroviral, quando o paciente e HIV positivo, com o metodo
de AdaBoost [41] .
Os modelos foram formulados com diferentes metodologias e aplicados em dife-
rentes populacoes. Alem disso, os modelos formulados incluem diferentes variaveis,
sinalizando que cada populacao demanda a elaboracao e a validacao de modelos
apropriados as suas caracterısticas socio-epidemiologicas.
Segundo as diretrizes da estrategia DOTS, o exame prioritario para os casos sus-
peitos de TB pulmonar e a pesquisa direta do bacilo alcool-acido resistente (BAAR)
em amostras de escarro espontaneo, devido ao baixo custo dessa tecnica. Contudo,
em pacientes com suspeita de TB pulmonar, apresentando sintomas respiratorios e
com achados radiograficos compatıveis com TB pulmonar, cuja pesquisa do BAAR
falham em revelar a micobacteria, ou quando nao se obtem escarro, surge um pro-
blema de difıcil solucao. O medico se depara com a decisao de iniciar o tratamento
de prova anti-TB, ou utilizar tecnicas mais invasivas para documentar a TB e excluir
outras enfermidades, ou ainda, permite-se aguardar por 15 a 60 dias os resultados
de culturas, disponıveis em poucos centros [35]. Devido a esses fatores, vemos o
crescente numero de sistemas de apoio a decisao no diagnostico da TB paucibacilar.
Os modelos que apresentaram resultados melhores necessitam de poder compu-
tacional para fazer a classificacao, ja que os mesmos usam nao linearidades, como
as redes neurais e o AdaBoost, ou necessitem de contas que nao sao facilmente
contabilizadas, como a regressao logıstica. Ja nos modelos de escore explicitados,
ideia semelhante a ser desenvolvida neste trabalho, se fez presente o uso de achados
radiologicos e exames laboratoriais como o teste de escarro (BAAR) e a prova tu-
berculınica (PPD), exames estes que nao serao utilizados durante o desenvolvimento
dos escores para deteccao da TB pulmonar deste trabalho.
Convem ressaltar que devido aos recentes avancos da engenharia genetica, a pos-
sibilidade do diagnostico de TB se basear na tecnica de Reacao de Polimerase em
16
Cadeia (PCR), onde identifica-se a existencia de sequencias do gene de Mycobac-
terium tuberculosis numa amostra de escarro. Uma dessas tecnicas e chamada de
GeneXpert, onde este metodo tem a vantagem de alta sensibilidade, para os casos
com teste de escarro positivo e negativo, 98% e 72%, respectivamente, alta especifici-
dade, 99,2%, e o resultado final do teste fica pronta em 90 minutos [42]. Entretanto,
esse exame ainda tem um custo muito elevado, inviabilizando o seu uso como um
exame de rotina, tornando seu uso restrito a alguns centros de pesquisa e hospitais
referencias.
17
Capıtulo 3
Base de Dados
O banco de dados a ser utilizado neste trabalho refere-se as informacoes clinıcas dos
pacientes atendidos no setor de Pneumologia da Policlınica Augusto Amaral Peixoto
(PAAP) na Area Programatica (AP)3.3 da Secretaria Municipal de Saude do Rio
de Janeiro (SMS-RJ), no perıodo compreendido entre 26/09/06 a 31/07/07.
A Policlınica Augusto do Amaral Peixoto esta localizada na AP3.3 da cidade do
Rio de Janeiro, onde residem cerca de 1.100 mil habitantes. Esta unidade e responsa-
vel pela assistencia medica ambulatorial dos bairros de Guadalupe, Deodoro, Costa
Barros, Pavuna, Acari, Anchieta, Ricardo de Albuquerque, onde residem cerca de
330 mil habitantes. Na AP 3.3, nos anos de 2006 e 2007, a incidencia de casos de
TB notificados foi de 78,3 e 80,2 por 100.000 habitantes, respectivamente [2]. Na
figura 3.1, podemos ver o panorama geral da taxa de incidencia da TB no municıpio
do Rio de Janeiro e suas respectivas areas programaticas.
A populacao de referencia foi formada por pacientes que procuraram pela pri-
meira vez atendimento no setor de pneumologia da PAAP, ou que retornaram apos
abandono de tratamento de TB no perıodo do estudo. Foram coletadas informa-
coes clınicas com os pacientes sobre: os sinais e sintomas da doenca, fatores de
risco para tuberculose, historia de tuberculose e de outras doencas previas e dados
socio-demograficos, atraves de questionario padrao.
O diagnostico de TB pulmonar ativa foi estabelecido nas seguintes situacoes [8]:
18
(a)
(b)
Figura 3.1: (a)Areas Programatica do Municıpio do Rio de Janeiro. (b)Estimacaoda taxa de incidencia de TB no municıpio do Rio de Janeiro. Fonte SecretariaMunicipal de Saude e Defesa Civil do Rio de Janeiro [2]
19
• Presenca de baciloscopia positiva, associada a resposta clınica ao tratamento
anti-TB instituıdo;
• Cultura para micobacterias positiva, associada a resposta clınica ao tratamento
anti-TB instituıdo;
• Pacientes com resultados negativos a baciloscopia e cultura para a micobacteria
e com melhora clınico-radiologica nos 2 meses iniciais de tratamento anti-
TB, adotado de forma empırica, desde que nao houvesse o emprego de outra
terapeutica associada que justificasse uma resposta favoravel ao tratamento.
Para esse trabalho, foram utilizados os dados de 1.144 pacientes submetidos a
entrevista de triagem da enfermagem do setor de pneumologia da PAAP/SMS-RJ
que aceitaram em participar do estudo. A amostra em estudo foi gentilmente ce-
dida pelo Programa Academico de TB da Faculdade de Medicina da Universidade
Federal do Rio de Janeiro, onde ha uma proporcao igualitaria entre homens e mu-
lheres, a media de idade e aproximadamente de 46 anos e 21% dos pacientes tiveram
diagnostico final de TB pulmonar.
O projeto foi aprovado pela Comissao de Etica em Pesquisa (CEP) do Hospi-
tal Universitario Clementino Fraga Filho/Universidade Federal do Rio de Janeiro
(HUCFF/UFRJ) com parecer numero 067/06 em 24/04/06 (Apendice A).
Os dados obtidos nos questionarios foram armazenados de forma confidencial
e somente o pessoal autorizado do grupo de pesquisa do Programa Academico de
Tuberculose da Faculdade de Medicina da UFRJ teve acesso a estas informacoes.
Todos os pacientes que participaram da pesquisa concordaram e assinaram o Termo
de Consentimento Livre e Esclarecido (TCLE) (Apendice B ).
Para essa mesma amostra de pacientes foi elaborado um questionario de triagem
que permitiu a elaboracao de um escore clınico, que foi elaborado por um painel de
especialistas em pneumologia [43], e sera a referencia de desempenho deste trabalho.
O escore clınico foi baseado nos sintomas mais relevantes a TB pulmonar ,identi-
ficados pela analise multivariada atraves de redes neurais nos pacientes atendidos
20
no Hospital Universitario Clementino Fraga Filho no Rio de Janeiro [35] [44] [45].
Sendo este formado por um conjunto de sintomas no qual o paciente nao sofresse
constrangimentos numa entrevista de triagem junto a equipe de enfermagem e que
fosse de facil contabilizacao. Portanto, o escore, proposto por especialistas, e for-
mado com uma pontuacao para os sintomas variando de 0 a 6 conforme mostrado
Como o objetivo deste trabalho e desenvolver um escore para o auxilio na triagem
e no diagnostico da tuberculose pulmonar, se faz necessaria uma analise previa dos
casos contidos na base de dados. Uma das formas de se realizar essa investigacao
inicial e explorar a distribuicao dos sintomas para ver se existem variaveis com algum
vies.
Apos o estudo das distribuicoes das variaveis, os casos da base de dados passam
por um processo de clusterizacao que buscara pela existencia de agrupamentos na-
turais nos dados, ajudando num melhor entendimento da informacao produzida por
esses agrupamentos.
Por fim, serao discutidos os metodos de desenvolvimento do escore clınico de
forma que este seja simples, de facil entendimento e que nao necessite de recursos
computacionais para seu calculo.
4.1 Analise dos sintomas e condicoes
A base de dados em estudo e composta de 1.144 pacientes, sendo 242 pacientes,
com TB pulmonar ativa. Foram observadas 12 variaveis explicativas, incluindo uma
variavel numerica e variaveis qualitativas, conforme mostra a tabela 3.2.
Para a variavel com codificacao numerica, idade, foram feitos os histogramas,
apresentados na figura 4.1. A mediana da idade da populacao em estudo e de 47
24
anos, os casos sem TB seguem a tendencia de idade populacao, com mediana da
idade de 48 anos. Porem, podemos ver uma predominancia de pessoas um pouco
mais jovens que foram diagnosticadas com tuberculose, uma vez que a mediana da
idade desses casos e de 39 anos.
(a)
(b) (c)
Figura 4.1: (a)Histograma da idade da populacao em estudo (b)Histograma da idadedos casos com diagnostico de TB (c)Histograma da idade dos casos sem TB
Ja para as variaveis dicotomicas, foi verificada a quantidade de ignorados pre-
sentes na base de dados e foi feito um estudo retrospectivo, calculando-se a razao
de chance [46], do ingles odds ratio, das mesmas, conforme a tabela 4.1.
O odds ratio (OR) e uma forma simples e de facil interpretacao do relacionamento
de um sintoma com uma doenca.Uma razao de chances de 1 indica que o sintoma sob
estudo e igualmente provavel de ocorrer nos dois grupos, com ou sem TB. Uma razao
de chances maior do que 1 indica que a condicao ou evento tem maior probabilidade
de ocorrer nos casos com TB. Finalmente, uma razao de chances menor do que 1
indica que a probabilidade e menor nos casos com TB do que nos sem TB.
Ao analisarmos a tabela 4.1, podemos observar que as quatro variaveis que apre-
25
Tosse Hemoptise Sudorese NoturnaOR = 3,71 OR = 2,32 OR = 2,72