COPPE/UFRJ COPPE/UFRJ DESCOBERTA DE CONHECIMENTO EM UM PROGRAMA DE GESTÃO DE BENEFÍCIO DE MEDICAMENTOS Valmir Santos Sobral Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia Civil, COPPE, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Mestre em Engenharia Civil. Orientador: Nelson Francisco Favilla Ebecken Rio de Janeiro JANEIRO de 2009
90
Embed
COPPE/UFRJ - livros01.livrosgratis.com.brlivros01.livrosgratis.com.br/cp098254.pdf · No capítulo 3 é apresentado o contexto do negócio, o problema e o processo de implementação
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
COPPE/UFRJCOPPE/UFRJ
DESCOBERTA DE CONHECIMENTO EM UM PROGRAMA DE GESTÃO DE
BENEFÍCIO DE MEDICAMENTOS
Valmir Santos Sobral
Dissertação de Mestrado apresentada ao
Programa de Pós-graduação em Engenharia
Civil, COPPE, da Universidade Federal do Rio
de Janeiro, como parte dos requisitos necessários
à obtenção do título de Mestre em Engenharia
Civil.
Orientador: Nelson Francisco Favilla Ebecken
Rio de Janeiro
JANEIRO de 2009
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
DESCOBERTA DE CONHECIMENTO EM UM PROGRAMA DE GESTÃO DE
BENEFICIO DE MEDICAMENTOS
Valmir Santos Sobral
DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO
LUIZ COIMBRA DE PÓS-GRADUAÇÃO E PESQUISA DE ENGENHARIA
(COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE
DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE
EM CIÊNCIAS EM ENGENHARIA CIVIL.
Aprovada por:
________________________________________________
Prof. Nelson Francisco Favilla Ebecken, Dsc.
________________________________________________ Prof. Alexandre Gonçalves Evsukoff, Dr.
________________________________________________ Prof. Elton Fernandes, Ph.D.
RIO DE JANEIRO, RJ - BRASIL
JANEIRO DE 2009
iii
Sobral, Valmir Santos
Descoberta de Conhecimento em um Programa de
Gestão de Beneficio de Medicamentos / Valmir Santos
Sobral. - Rio de Janeiro: UFRJ/COPPE, 2009.
IX, 49 p.: il.; 29,7 cm.
Orientador: Nelson Francisco Favilla Ebecken
Dissertação (mestrado) – UFRJ/ COPPE/ Programa de
Engenharia Civil, 2008.
Referencias Bibliográficas: p. 50-41.
1. Mineração de dados. 2. Regras de Associação.
3.Gestão de Medicamentos. I. Ebecken, Nelson Francisco
Favilla. II. Universidade Federal do Rio de Janeiro,
COPPE, Programa de Engenharia Civil. III. Titulo.
iv
Agradecimentos
Aos meus pais José Freire Sobral e Maria José Santos Sobral e a minha avó Maria
Petronila Cruz.
Ao Professor Dsc. Nelson Ebecken pela paciência e na ajuda da realização de um
sonho.
Ao meu inestimável amigo Humberto Rubens Maciel Pereira.
Ao Amigo Martius Vicente Rodriguez y Rodriguez pelo estimulo na obtenção do
conhecimento.
As Dras. Angélica de Oliveira Gonçalves, Karla Costa Kurtz e Maria Tereza Castro
Telles e ao Dr. Frederico Araújo de Lucena, especialistas técnicos que contribuíram
com suas análises.
v
Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos
necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)
DESCOBERTA DE CONHECIMENTO EM UM PROGRAMA DE GESTÃO DE
BENEFICIO DE MEDICAMENTOS
Valmir Santos Sobral
Janeiro/2009
Orientador: Nelson Francisco Favilla Ebecken
Programa: Engenharia Civil
Os custos em saúde estão em uma curva de ascendência e algumas Operadoras de
Plano de Saúde oferecem aos seus beneficiários um Programa de Beneficio farmácia
cujo objetivo é facilitar a aquisição de medicamento para que a saúde seja restabelecida
e desta forma também minimizar os custos do tratamento da doença. As organizações
que prestam serviços em saúde estão usando as técnicas Data Mining como ferramenta
de auxilio na gestão. Na utilização da técnica de Data Mining, os algoritmos de
extração de regras de associação, constituem um ferramental bastante importante que
tem o objetivo de identificar o conhecimento em grandes bases de dados. O objetivo
deste trabalho foi a explicitação de conhecimento em base de dados de compra de
medicamentos, em Programa de beneficio de medicamentos em uma operadora de
plano de saúde, através da classe terapêutica.
vi
Abstract of Dissertation presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Master of Science (D.Sc.)
DISCOVERY OF KNOWLEDGE IN ONE PROGRAM OF MANAGEMENT OF
BENEFIT OF MEDICINES
Valmir Santos Sobral
January/2009
Advisor: Nelson Francisco Favilla Ebecken
Department: Civil Engineering
Health costs are in an ascending curve and some health plano companies offer theur
beneficiaries a pharmacy benefit program whose goal is to make the acquisition of
medicine easy, so that health is restored and therefore treatment costs are reduced as
well. The companies which render service in health are using data mining techniques as
a management support tool. By doing so, the algorithms of association rules extraction
form a quite important instrument that aims at identifying knowledge in large database.
Our work is to obtain rules of utilization of these medications through the therapeutical
• Subsídio Parcial – Medicamentos para tratamento das doenças crônicas
elencadas que terão subsídio parcial pela Petrobras, cabendo ao
Beneficiário Titular a complementação da participação.
• Custeio Integral – Medicamentos que constam da lista e medicamentos
que não constam da lista que serão integralmente custeados pelo
Beneficiário.
3.7 Ciclo da Utilização do Benefício Farmácia
O beneficiário se dirige a farmácia e apresenta o cartão de identificação da AMS
junto com um documento de identidade com foto e a receita médica com o carimbo e a
assinatura do profissional solicitante. O atendente confere os documentos apresentados,
acessa o sistema da PBM para checar a elegibilidade do beneficiário e se o
medicamento prescrito se encontra na lista de medicamentos estabelecidos pela
Petrobras, digita o valor do medicamento para verificação do saldo disponível conforme
limite máximo de compra mensal definido para cada grupo familiar. Caso o saldo
19
disponível não seja suficiente para a compra do medicamento o beneficiário poderá
efetuar a complementação do valor necessário.
Conforme data definida no contrato assinado com a operadora os dados das
compras serão enviados a Petrobras para processamento, análise e posterior débito na
folha de pagamento e pagamento das compras realizadas.
Periodicamente, a PBM envia relatórios estatísticos de compra dos
medicamentos e epidemiológicos para análise dos perfis de compra, indicadores da
saúde dos beneficiários e manutenção atualizada da lista de medicamentos.
A PBM de posse da informação de compra dos beneficiários negocia com a
industria, distribuidores e varejistas descontos e oferta dos medicamentos.
O laboratório negocia com os varejistas a oferta de medicamentos e junto aos
profissionais de saúde faz divulgação dos medicamentos a serem prescritos que lhe
sejam vantajosos.
Figura 1 - Ciclo do PBM
20
3.8 O Problema
Obter informações a partir dos dados de utilização da compra de medicamentos
que possam subsidiar ações de gestão no que se refere a adesão dos beneficiários ao
programa de medicamentos e descobrir padrões de utilização de medicamentos através
da classe terapêutica.
21
4 - O PROCESSO DE DESCOBERTA DO CONHECIMENTO
O desenvolvimento de sistemas de KDD está relacionado com diversos
domínios de aplicações: marketing, análises corporativas, astronomia, medicina,
biologia, entre outros. Existem diversas tarefas de KDD que são, principalmente,
dependentes do domínio da aplicação e do interesse do usuário; cada tarefa de KDD
extrai um tipo diferente de conhecimento do banco de dados e pode requerer um
algoritmo diferente para cada tarefa.
Segundo FELDENS (1996), fundamenta-se no fato de que as grandes bases de
dados podem ser uma fonte de conhecimento útil, porém não explicitamente
representado, cujo objetivo do KDD é desenvolver e validar técnicas, metodologias e
ferramentas capazes de extrair o conhecimento implícito nesses dados e representá-lo de
forma acessível aos usuários.
De acordo com SOUZA FILHO (2004) dentre estes algoritmos as regras de
associação são utilizadas para descobrir associações e correlações existentes entre os
dados que atendam a critérios estabelecidos que podem ser objetivos ou subjetivos,
servindo para determinar se uma regra de associação encontrada é interessante ou não.
Neste estudo será dada ênfase no método de Regras de Associação.
22
4.1 Regras de Associação
Regras de Associação é a técnica que tem por objetivo a identificação de
relacionamentos existentes entre os eventos representados numa base de dados. Esta
técnica também é conhecida como análise de cesta de compras, devido a sua principal
utilização, que é estabelecer relações entre os produtos a partir das cestas de compras
dos clientes, segundo SILVA SANTOS (2007). Uma regra de associação tem a forma X
=> Y que indica que a ocorrência do evento X implica no evento C.
Conforme inicialmente proposto por AGRAWAL (1993), uma regra de
associação ou afinidade de grupos visa a combinar itens importantes, tal que, a presença
de um item em uma determinada transação pressupõe a de outro na mesma transação.
Desse modo, o objetivo das regras de associação é encontrar tendências que possam ser
usadas para entender e explorar padrões de comportamento dos dados.
As aplicações de técnicas de regras de associação têm seu uso difundido em
diversas áreas, mas seu uso é mais difundido na área de marketing em que se pretende
descobrir as associações existentes entre produtos vendidos. As grandes redes varejistas
estudam as compras dos clientes para descobrir quais as vendas que são normalmente
realizadas ao mesmo tempo, denominando este estudo de market basket analysis. As
bases de dados envolvidas nestes processos são muito grandes, sendo assim, é
necessário que sejam utilizados algoritmos rápidos e eficientes.
Segundo DILLY (1995) uma regra de associação é uma expressão representada
na forma X => Y (X implica em Y), em que X e Y são conjuntos de itens da base de
dados; X é o antecedente da regra (lado esquerdo) e Y é o conseqüente da regra (lado
direito) e pode envolver qualquer número de itens em cada lado da regra.
A tarefa associação tem a premissa básica de encontrar elementos que implicam
na presença de outros elementos em uma mesma transação, ou seja, encontrar
relacionamentos ou padrões freqüentes entre conjuntos de dados com um determinado
grau de certeza. Este grau de certeza de uma regra é definido por dois fatores: o fator de
suporte e o fator de confiança.
23
De acordo com AGRAWAL et al. (1993), considerando que os conjuntos de
itens X e Y estão sendo analisados, o suporte é definido como a fração de registros que
satisfaz a união dos itens no conseqüente (Y) e no antecedente (X), correspondendo à
significância estatística da regra e a confiança é expressa pelo percentual de registros
que satisfaz o antecedente (X) e o conseqüente (Y), medindo a força da regra ou sua
precisão. Estes fatores limitam a quantidade de regras que serão extraídas e descrevem a
qualidade delas.
Para AGRAWAL et al. (1997), o problema das regras de associação é encontrar
todas as regras de associação que possuem o suporte e confiança acima de um
determinado valor mínimo, pois, na prática os usuários normalmente estão interessados
somente em um determinado subconjunto de associações.
4.2 Formalização do problema
O problema pode ser formalizado como se segue. Seja I = {I1, I2, I3, ..., Im} um
conjunto de atributos binários chamados itens e seja T uma base de dados de transações,
onde cada t é representada por um vetor binário, com t[k] = 1 se t indica a compra do
item Ik e t[k] = 0, ausência da compra. Existe uma dupla na base de dados para cada
transação. Seja X um conjunto de itens em I. É dito que a transação t satisfaz X se, para
todos os itens Ik em X, T[k] = 1.
Uma regra de associação é uma implicação da forma X => Y, onde X ⊂ I, Y ⊂ I,
e X ∩ Y = ∅. A regra X => Y é válida no conjunto de transações T, com o grau de
confiança c, se c% das transações em T que contêm X também contêm Y. A regra X =>
Y tem suporte s em T, se s% das transações em T contêm X ∪ Y. Se as condições forem
satisfeitas, c% representará o fator de confiança e s% o fator de suporte.
Em algumas literaturas o lado esquerdo da regra (se a regra é X=>Y, o lado
esquerdo é X) é denominado de antecedente e o lado direito de conseqüente (Y).
24
Dado o conjunto de transações I, há o interesse em gerar todas as regras que
satisfaçam certas restrições de duas diferentes formas:
• Restrições Sintáticas: Estas restrições envolvem restrições sobre itens que
podem aparecer numa regra. Por exemplo, pode haver interesse apenas em
regras que tenham um item Ix específico aparecendo no conseqüente, ou regras
que tenham um item Iy aparecendo no antecedente. Combinações das restrições
acima também são possíveis. Podem ser solicitadas todas as regras que tenham
itens de algum conjunto X de itens predefinido aparecendo no conseqüente, e
itens de algum outro conjunto Y aparecendo no antecedente.
• Restrições de Suporte: Estas restrições se referem ao número de transações em I
que suportam a regra. O suporte para uma regra é definido como a fração de
transações em I que satisfazem a união de itens no conseqüente e antecedente da
regra. Suporte não deve ser confundido com confiança. Enquanto confiança é
uma medida da força da regra, suporte corresponde à significância estatística.
Além da significância estatística, outra motivação para restrições de suporte vem
do fato de usualmente haver interesse apenas em regras com suporte acima de
algum limiar mínimo por razões do negócio. Se o suporte não é extenso o
suficiente, significa que a regra não merece consideração ou que é simplesmente
menos preferida.
Nesta formulação, o problema de mineração de regras pode ser decomposto em
dois problemas:
• Gerar todas as combinações de itens que tenham suporte a transação fracionária
acima de um certo limiar denominado minsuporte. Denominando estas
combinações extenso conjunto de itens, e todas as outras combinações, que não
atingem o limiar, de pequeno conjunto de itens. Restrições sintáticas
posteriormente restringem as combinações admissíveis. Por exemplo, se apenas
regras envolvendo um item Ix no antecedente são de interesse, então é suficiente
gerar apenas aquelas combinações que contém Ix.
25
• Para um dado extenso conjunto de itens Y = I1, I2, I3, ... Ik, gerar todas as
regras (no máximo k regras) que usam itens do conjunto I1,I2, I3, ..., Ik, .O
antecedente de cada uma destas regras será um subconjunto X de Y tal que X
tem k – 1 itens, e o conseqüente será o item Y – X. Para gerar uma regra X Þ Ij |
c, onde X = I1, I2, ..., Ij-1 Ij+1 ...Ik, toma o suporte de Y e divide-o pelo suporte
de X. Se a razão é maior que c então a regra é satisfeita com fator de confiança
c; caso contrário não. As regras obtidas a partir de Y devem satisfazer a restrição
de suporte porque Y satisfaz a restrição de suporte e Y é a união dos itens no
conseqüente e antecedente de toda regra.
Um dos algoritmos mais referenciados para este método é o Apriori, nas diversas
variações, tais como, o AprioriTid, DHP e Partition.
4.3 Interessabilidade das Regras
Segundo SOUZA (2004), as regras de associação têm sua aplicação comprovada
em diversas aplicações práticas, mas produzem um grande número de regras, muitas das
quais não são interessantes e os usuários/especialistas tem dificuldade em analisar cada
regra obtida para encontrar as mais interessantes e para solucionar este problema foram
desenvolvidas diversas aproximações para encontrar as regras mais interessantes de um
conjunto de regras obtidas.
Segundo SOUZA (2004), a determinação do conjunto de regras de associação
interessantes obtidas pode ser facilitada pela análise de interessabilidade que consiste
em encontrar regras que são interessantes e úteis aos usuários/especialistas, de acordo
com os critérios definidos. Diversas pesquisas que utilizaram técnicas de Mineração de
Dados mostram que podemos medir a interessabilidade de uma regra usando medidas
objetivas e subjetivas:
As medidas objetivas consistem em analisar a estrutura das regras, a
performance preditiva e a significância estatística obtidas no suporte e confiança.
26
Devido aos resultados obtidos com as medidas objetivas não serem suficientes
para determinar a interessabilidade de uma regra descoberta o estudo de medidas
subjetivas são necessários para melhor classificação. As duas principais medidas
subjetivas de interessabilidade são:
• Inesperabilidade: As regras são interessantes se elas são desconhecidas do
usuário ou contradizem ao existente conhecimento do usuário (ou esperado);
• Acionabilidade: As regras são interessantes se os usuários podem acionar
alguma atividade que produza benefício.
As regras interessantes podem ser classificadas dentro de três categorias:
• Regras que são ambas inesperadas e acionáveis;
• Regras que são inesperadas, mas não são acionáveis, e
• Regras que são acionáveis, mas esperadas.
Segundo LIMA DE SOUZA (2008) as regras de associação têm sua
interessabilidade avaliada em função de duas métricas: O suporte, que é a freqüência
com que os dados aparecem no conjunto de dados, e a confiança que indica a
probabilidade de associação entre os dados selecionados. Com base nos resultados são
tomadas decisões de negócios e podem ser traçadas novas estratégias de atuação.
No presente estudo usaremos como métricas de interessabilidade: Suporte e
Confiança.
27
5 - O ESTUDO DE CASO
Neste capitulo são apresentados detalhes do estudo de caso realizado.
Inicialmente é apresentada uma descrição dos dados utilizados seguida de uma
estatística básica e dos resultados obtidos com a técnica de regras de associação.
5.1 Descrição dos dados
A base de dados utilizada para aplicação da técnica de regras de associação
continha 06 atributos e um total de 361.892 registros referentes à compra de
medicamentos pelos beneficiários do Programa de Beneficio de Medicamentos da AMS
de abril de 2007 à agosto de 2008.
Na tabela 3 estão relacionados os atributos que foram utilizados neste estudo na
utilização da técnica de regras de associação estão relacionados e para cada um a
descrição de seu significado
Tabela 3 - Atributos utilizados no estudo
Atributo Descrição do atributo
Código do Beneficiário
Identificação única do beneficiário que adquiriu o medicamento
Sexo Sexo do Beneficiário
Faixa etária Faixa etária do Beneficiário
Faixa Salarial Faixa Salarial do beneficiário
Código da Classe Código da classe terapêutica do medicamento
Código do Tipo do Beneficiário Código da classe do beneficiário
A tabela 4 relaciona o domínio das faixas etárias utilizada, referência da ANS, obtida a partir da base de dados dos beneficiários cadastrados na AMS.
28
Tabela 4 - Faixas etárias segundo ANS
Faixa etária Descrição
0-18 Faixa 1
19-23 Faixa 2
24 – 28 Faixa 3
29 – 33 Faixa 4
34 – 38 Faixa 5
39 – 43 Faixa 6
44 – 48 Faixa 7
49 – 53 Faixa 8
54 – 58 Faixa 9
Acima de 58 Faixa acima 58 A tabela 5 relaciona o domínio das faixas salariais obtida a partir da base de dados dos beneficiários cadastrados na AMS e para cada faixa o limite de compra mensal por grupo familiar. Tabela 5 - Limites de compra
Faixa salarial Valor Limite de compra
1 754,43 120,00
2 1.392,79 240,00
3 2.785,58 480,00
4 5.571,17 800,00
5 11.142,34 800,00
6 acima de 11.142,35 800,00
A tabela 6, relaciona o domínio dos tipos de beneficiários obtida a partir da base de dados dos beneficiários cadastrados na AMS Tabela 6 - Domínio do tipo de beneficiários
TITULAR APOSENTADO
TITULAR ATIVO
TITULAR CURATELADO
TITULAR PENSIONISTA
TITULAR TUTELADO
DEPENDENTE DE APOSENTADO
DEPENDENTE DE ATIVO
DEPENDENTE DE CURATELADO
DEPENDENTE DE PENSIONISTA
DEPENDENTE DE TUTELADO
29
A tabela 7 apresenta os domínio dos códigos de sexo utilizados Tabela 7 - Domínio do campo sexo Sexo Descrição
F Feminino
M Masculino
Diariamente a PBM envia arquivo no formato txt, em layout previamente combinado, os dados das compras realizadas adquiridas no dia anterior.
30
Na tabela 8 estão descritos os atributos e a sua descrição Tabela 8 - Atributos e respectivas descrições Atributo Descrição Código do Beneficiário Código único do beneficiário
adquirente do medicamento Código da Faixa etária Código da faixa etária do beneficiário
que adquiriu o medicamento Código da Faixa salarial Código da faixa salarial do
beneficiário que adquiriu o medicamento
Código do Sexo Código do sexo do beneficiário que adquiriu o medicamento
Data da compra Data de compra do medicamento pelo beneficiário
CNPJ do local da compra CNPJ da farmácia que vendeu o medicamento
Sigla Estado do local da compra Sigla do estado da federação no qual foi realizada a venda
Município do local da compra Nome do município no qual a venda foi realizada.
Bairro do local da compra Nome do bairro no qual a venda foi realizada
Profissional prescritor Nome do profissional que prescreveu o medicamento
Código do registro profissional (CRM / CRO) Sigla do conselho de classe do profissional que prescreveu o medicamento
Número do registro profissional Número de registro do profissional que prescreveu o medicamento
Tipo do medicamento Indica se o medicamento é de marca ou genérico
Código da classe terapêutica Código da classe terapêutica do medicamento
Nome do medicamento Nome do medicamento adquirido pelo beneficiário
Quantidade adquirida Quantidade de medicamento adquirida Valor do medicamento Valor do medicamento adquirido ICMS Valor do ICMS do medicamento Apresentação Apresentação do medicamento
adquirido. ( Ex. Caixa com 12 drágeas)
O arquivo de origem contem informações sobre aquisições de medicamentos.
Entretanto, foi considerado que para diminuir a pulverização de regras, deveria ser feito
estudo utilizando-se a classe terapêutica do medicamento. Isto deve-se também ao fato
31
de que a classe terapêutica é uma forma de agrupamento de medicamento muito
utilizada pelos especialistas.
Os dados recebidos em arquivo no formato TXT foram carregados para uma
planilha Excel e complementados com a descrição da classe terapêutica (anexo yy) e
tipo do beneficiário (tabela xx) para obter a complementação do registro para submissão
ao processo de regra de associação.
Os dados da compra acrescidos da descrição da classe terapêutica e do tipo do
beneficiário foram carregados para uma planilha Excel, em folders diferentes e utilizou-
se a função PROCV para a complementação do registro. A partir do registro completo a
planilha resultante foi exportada para o formato txt para processamento na ferramenta
de análise.
5.2 Estatística dos dados
A seguir apresentaremos algumas estatísticas referente a utilização do Programa
de Benefício de Medicamentos.
A tabela 9 apresenta as faixas etárias dos beneficiários que adquiriram
medicamentos, a quantidade de beneficiários distintos em cada faixa etária, o percentual
destes beneficiários, a quantidade de itens comprados e o percentual de itens
comprados. Observe que nas 03 últimas faixas, Faixa etária entre 49 e 53, Faixa etária
entre 54 e 58 e Faixa etária acima de 58 apresentam uma concentração de 80,55% de
dos medicamentos comprados e uma concentração de 58,45% dos beneficiários.
32
Tabela 9 – Faias etárias de beneficiários que adquiriam medicamentos Faixa etária Quantidade de
beneficiários distintos
% de benefici
ários distintos
Quantidade de itens
comprados
% de itens comprados
Faixa etária entre 00 e 18 2.816 9,02 9.599 2,65
Faixa etária entre 19 e 23 1.258 4,03 4.760 1,31
Faixa etária entre 24 e 28 1.278 4,09 4.569 1,26
Faixa etária entre 29 e 33 1.361 4,36 6.372 1,76
Faixa etária entre 34 e 38 1.268 4,06 6.620 1,83
Faixa etária entre 39 e 43 1.791 5,73 11.073 3,06
Faixa etária entre 44 e 48 3.205 10,26 27.410 7,57
Faixa etária entre 49 e 53 3.939 12,61 42.761 11,81
Faixa etária entre 54 e 58 3.754 12,02 52.662 14,55
Faixa etária acima de 58 10.564 33,82 196.156 54,19
Total 31.234 100,00 361.982 100,00
A tabela 10 apresenta a quantidade de beneficiários por sexo que adquiriram
medicamentos, a quantidade de beneficiários distintos em cada faixa etária, o percentual
destes beneficiários, a quantidade de itens comprados e o percentual de itens
comprados.
Tabela 10 – Beneficiários e itens comprados
Sexo
Quantidade de beneficiários
distintos
% de beneficiários
distintos
Quantidade de itens
comprados % de itens comprados
Feminimo 14.926 47,79 146.404 40,45
Masculino 16.308 52,21 215.578 59,55
Total 31.234 100,00 361.982 100,00
A tabela 11 apresenta a quantidade de beneficiários por faixa salarial que
adquiriram medicamentos, a quantidade de beneficiários distintos em cada faixa etária,
o percentual destes beneficiários, a quantidade de itens comprados e o percentual de
itens comprados. Observe que as Faixas 4 e 5 apresentam uma concentração de 68,36%
dos medicamentos comprados e uma concentração de 74,13% dos beneficiáros que
adquiriram medicamentos no Programa.
33
Tabela 11 – Beneficiários por faixa salarial
Faixa salarial Quantidade de beneficiários distintos
% de beneficiários distintos
Quantidade de itens comprados
% de itens comprados
1 69 0,22 1.679 0,46
2 298 0,95 5.400 1,49
3 3.665 11,73 46.587 12,87
4 10.531 33,72 123.553 34,13
5 12.623 40,41 138.386 38,23
6 4.048 12,96 46.377 12,81
Total 31.234 100,00 361.982 100,00
A tabela 12 apresenta a quantidade de itens comprados por Classe terapêutica e o
percentual de cada item. Observe a classe terapêutica Sistema Cardiovascular concentra
46,71% dos medicamentos comprados.
Tabela 12 – Itens comprados por classe terapêutica
A análise da regra efetuada por um especialista concluiu que esta regra
caracteriza associação terapêutica utilizada para pacientes diabéticos com dislipidemia.
Todas as ações mencionadas para a regra 9, poderão ser aplicadas aqui também.
O especialista classificou esta regra como acionável e esperada.
46
6 - CONCLUSÕES
O objetivo deste trabalho foi a descoberta de regras de consumo de
medicamentos a partir da classe terapêutica dos mesmos. Para tal utilizamos os dados de
compras dos medicamentos efetuados pelos beneficiários, a partir da implementação de
um programa de beneficio de medicamentos, em uma operadora de plano de saúde na
modalidade de autogestão usando uma empresa de PBM.
Foi utilizada a técnica de regras de associação é a técnica que tem por objetivo a
identificação de relacionamentos existentes entre os eventos representados numa base
de dados para a descoberta das regras de consumo à partir da classe terapêutica dos
medicamentos.
Os dados diários de compra de medicamentos foram compilados em uma única
planilha. Desta planilha foram extraídos 06 atributos, totalizando 361.892 registros que
foram submetidos para avaliação no software de mineração de dados que produziu um
total de 68.358 regras de associação.
As regras de associação tem sua aplicação comprovada em diversas aplicações
práticas mas produzem um grande número de regras, algumas interessantes e outras não
e os usuários/especialistas tem dificuldade em cada regra obtida para encontrar as mais
interessantes. Para determinar a interessabilidade de uma regra diversas pesquisas
mostram que podemos usar medidas objetivas e subjetivas.
As regras de associação têm sua interessabilidade avaliada em função de 02
métricas objetivas: O suporte, que é a freqüência com que os dados aparecem no
conjunto de dados, e a confiança que indica a probabilidade de associação entre os
dados selecionados.
As duas principais medidas subjetivas de interessabilidade são a inesperabilidade
(são regras interessantes e desconhecidas ou que contradizem o conhecimento do
especialista/usuário) e a acionabilidade (são regras interessantes se o
especialista/usuário podem efetuar alguma ação que produza benefício).
47
Do total de 68.358 regras obtidas no software de mineração dividimos em 03
conjuntos, exportados para 03 planilhas, que foram entregues a 03 especialistas médicos
para análise.
Cada planilha foi classificada em ordem decrescente de Suporte e Confiança e
somente as 100 primeiras regras foram analisadas.
Houve uma dificuldade, algumas regras apareciam repetidas, isto é, algumas
vezes havia uma inversão entre o antecedente (lado esquerdo) e o conseqüente (lado
direito) da regras. O antecedente tornava-se conseqüente e o conseqüente tornava-se
antecedente. Quando isto acontecia uma das regras era eliminada manualmente.
Segundo os especialistas no conjunto analisado havia somente regras acionáveis
não havendo nenhuma regra inesperada.
Este estudo permitiu explicitar informações que subsidiarão a Gestão do
Programa de Medicamentos e também o estabelecimento de vínculos com a utilização
de procedimentos médicos complementares. Abaixo algumas conclusões:
a) Identificar os beneficiários que utilizem medicamentos associados a eventos
cardiovasculares e incluí-los em Programa de Gerenciamento com o objetivo de analisar
a ocorrência prévia destes eventos e fazer o acompanhamento para comprovar a
efetividade dessa associação;
b) Fornecer gratuitamente ou aumentar o subsídio dos medicamentos para
estimular a adesão ao tratamento entre os pacientes do sexo masculino aposentados
pertencentes a esse grupo de risco;
c) Propor programa de reabilitação cardíaca, com o objetivo de aumentar a
adesão ao tratamento;
d) Analisar o impacto nos custos com procedimentos terapêuticos aos diversos
grupos de beneficiários identificados;
e) Propor ações de prevenção para reduzir a exposição aos fatores de risco para o
desenvolvimento de doenças cardiovasculares;
f) Avaliar os protocolos utilizados pelos médicos assistentes;
48
g) Negociar descontos maiores nos preços dos medicamentos envolvidos nessa
associação de grupos terapêuticos para os pacientes do sexo masculino.
h) Possibilitar a seleção das associações terapêuticas mais efetivas e mais
utilizadas e negociar padronização com rede credenciada
i) Negociar maior índice de descontos para os medicamentos envolvidos na
associação.
j) Implementar programa de orientação nutricional ;
k) Definir política de alimentação saudável na Companhia;
l) Estimular programa de combate ao sedentarismo;
A utilização da técnica de regra de associação trouxe benefícios pois a partir do
uso das medidas de insteressabilidade explicitou associações de regras esperadas e
acionáveis que contribuirão na Gestão do Benefício trazendo melhorias de qualidade de
vida para os beneficiários e otimização de custos para o plano.
49
6.1 Trabalhos Futuros
Efetuar estudos para desenvolver modelos preventivos com o uso de técnicas de
data mining, com os dados de utilização de procedimentos médicos, utilização de
medicamentos, dados dos ambientes de trabalho e de exames periódicos de saúde anual
com o objetivo de antecipar necessidades de tratamentos, melhora da qualidade de vida,
otimização de custos para o plano e análise considerando um conjunto maior de regras
buscando por regras que sejam inesperadas e acionáveis.
50
REFERÊNCIAS BIBLIOGRÁFICAS
AGRAWAL, R. & R. Srikant (1993) Fast algorithms for mining association rules in large databases. In Proceedings of the 20th International Conference on Very Large Databases, pp. 487–499. Disponível em: <http://www.almaden.ibm.com/u/ragrawal/pubs.htm>. Acesso em Mar 2008. AGRAWAL, R. & R. Srikant (1997) et al. Mining Association Rules With Item Constraints. Disponível em: < http://www.aaai.org/Papers/KDD/1997/KDD97-011.pdf>. Acesso em Mar 2008. AMO, S (2003). Técnicas de Mineração de Dados, Universidade Federal de Uberlândia, MG. Disponível em: < http://www.deamo.prof.ufu.br/arquivos/JAI-cap5.pdf>. Acesso em Set 2008. ANAND, A. KHOTS, D. “A data mining framework for identifying claim overpayments for the health insurance industry”, Proceedings of the 3rd INFORMS Workshop on Data Mining and Health Informatics (DM-HI 2008), J. Li, D. Aleman, R. Sikora, eds, 2008. BERTSIMAS, D, et al. ”Algorithmic Prediction of Health-Care Costs” OPERATIONS RESEARCH Vol. 56, No. 6, November-December 2008, pp. 1382-1392 CHAN, Chien-Lung, CHIEN-WEI Chen; BAW-JHIUNE, Liu. “Discovery of association rules in Metabolic Syndrome related diseases”, Neural Networks, 2008. IJCNN 2008. (IEEE World Congress on Computational Intelligence). IEEE International Joint Conference on Volume , Issue , 1-8 June 2008 Page(s):856 - 862 Digital Object Identifier 10.1109/IJCNN.2008.4633898. Disponivel em: <http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=4633898.>. Acesso em Jan 2009. DILLY , R. Data Mining - an introduction . Parallel Computer Centre - Queen's University of Belfast. Dezembro, 1995. FAYYAD, Usama, PIATETSKY-SHAPIRO, Gregory, SMYTH, Padhraic. From data mining to knowledge discovery: an overview. In: Advances in Knowledge Discovery and Data Mining, AAAI Press / The MIT Press, MIT, Cambridge, Massachusets, and London, England, 1996, p.1-34. FELDENS, M. A.; CASTILHO, J. M. V. de (1996). Descoberta de Conhecimento Aplicada à Detecção de Anomalias em Bases de Dados: Trabalho Individual, PPGC-UFRGS, Rio Grande do Sul, RS.
51
FILHO, H. Souza (2004). Extração de Regras de Associação de um Banco de Dados Relacional, M. Sc, COPPE/UFRJ, Rio de Janeiro, RJ, Brasil. FILHO, J. Rodrigues (2001). Data Mining: Conceitos, Técnicas e Aplicação. Msc, Escola Politécnica da Universidade Federal de São Paulo, São Paulo, SP, Brasil. IBM. IBM'S data mining technology. White Paper, 1996. JAMA – Uses and abuses of prescriptiondrug information in Pharmacy benefits management programs, Bernard Lo; Ann Alpers. Disponivel em <http://jama.ama-assn.org/cgi/content/full/283/6/801> Acesso em Dez 2009. KENNETH S. Lubel (1998). Data Mining: A New Way to Find Answers, Disponível em <http://faculty.ed.umuc.edu/~meinkej/inss690/lubel.htm>. Acesso em Dez 2007. MAGALHAES, L. H.; ARBEX, M. A. Data mining - extração e exploração de conhecimento. Disponível em < http://www.viannajr.edu.br/site/menu/publicacoes/publicacao_tecnologos/artigos/edicao1/200615801.pdf>. Acesso em Jun 2008. MIRANDA, Claúdio da Rocha. Gerenciamento de custos em planos de assistência à saúde – Projeto ANS/PNUD, 2003. SANTOS, R. Silva,2007, Ambiente para extração de informações através da Mineração das Bases de Dados do Sistema Único de Saúde, D.Sc., UNIFESP, São Paulo, SP, Brasil, 2007. SOUZA, F. T.,2004, Predição de escorregamentos das encostas do município do Rio de Janeiro através de técnicas de mineração de dados, D. Sc, COPPE/UFRJ, Rio de Janeiro, Brasil. SOUZA, S. L.,2008, Evasão no ensino superior: Um estudo utilizando a mineração de dados como ferramenta de gestão do conhecimento em um banco de dados referente a graduação em Engenharia, M. Sc, COPPE/UFRJ, Rio de Janeiro, RJ, Brasil.
52
ANEXOS ANEXO A – TABELA CLASSE TERAPEUTICA X FAIXA SALARIAL
TODOS OUTROS ANTI-ASMATICOS E BRONCODILATADORES INALATORIOS 121 181 302
TODOS OUTROS PRODUTOS P/TRATAMENTO DE FERIDAS 28 28 56
TRANQUILIZANTES 5633 5195 10828
TRICOMONICIDAS SISTEMICOS 460 429 889
TRICOMONICIDAS TOPICOS 322 106 428
TRIPTANICOS ANTIENXAQUECA 206 149 355
VASOPROTETORES SISTEMICOS 557 589 1146
VASOTERAPIA CEREBRAL E PERIFERICA EXCLUINDO ANTAGONISTAS CALCIO 439 678 1117
XANTINICOS-SISTEMICOS 164 222 386
63
64
ANEXO C - Telas do SAS
A ferramenta utilizada para a descoberta de regras na base de dados de utilização
do benefício farmácia foi o SAS (Statistical Analsys System – SAS Institute inc.
www.sas.com).
Este anexo descreve o processo realizado no SAS, executado após a preparação
descrita na sessão 5.1, para a descoberta de regras.
Inicialmente é necessário definir a estrutura para o SAS trabalhar. A figura
abaixo mostra a interface de trabalho do SAS Enterprise Miner versão 5.3.
Figura 2 - Criação de diagrama para uso na técnica de Regra de Associação
Nas figuras seguintes é mostrado passo a passo como realizar e interpretar uma
análise de associação dentro do Software.
O primeiro passo é fazer a definição da tabela analítica (Flat Table) que servirá
de insumo para a criação das regras de associação. Na janela de definições do projeto
(figura 3), clicando com o botão direito no menu “Data Source” e selecionando
65
“Create Data Source”, será aberto um wizard para a definição da tabela. Este wizard
está detalhado nas figuras 3 a 10.
Figura 3 - Seleção do diretório de dados
A figura 3 apresenta a opção de seleção do repositório de dados onde
se encontra a tabela de dados. Este repositório é um arquivo na visão do
sistema operacional.
Figura 4 - Nome da tabela criada
66
O repositório é semelhante a uma biblioteca e é composto por várias tabelas. A
figura 4 apresenta a seleção da flat table analítica, que é parte deste
repositório.
Figura 5 – Biblioteca para carga dos dados
A figura 5 apresenta o passo no qual, opcionalmente, é incluída uma
definição de library SAS, apontando o local físico onde se encontra a flat –
uma pasta no sistema operacional.
Figura 6 – Propriedades da tabela criada
67
Após o passo descrito na figura 5, o SAS realiza uma análise estatísitca básica e
A figura 6 apresenta a visualização de estatísticas da flat. Algumas
informações são: data de criação, quantidade de registros.
Figura 7 – Definição das variáveis para uso na técnica de Regra de Associação
A figura 7 caracteriza o passo no qual ocorre a definição automática
das variáveis. Para este estudo, ......., foi utilizada a opção “basic”. A opção
“advanced” seria.....
Figura 8 - Seleção de variável
68
A figura 8 é o passo no qual ocorre a seleção das variáveis que consiste na
escolha do conjunto que será analisado dentro do conjunto total de campos
disponíveis no arquivo carregado. Especificamente a figura 8 mostra a
seleção da variável “matrícula”.
Figura 9 – Seleção para uso em redes não supervisionadas
A figura 9 é o passo no qual ocorre a definição do custo/ganho de
cada decisão tomada. Não se aplica no contexto de Análise de associação.
Figura 10 – Definição da finalidade da tabela (Transação)
69
A figura 10 é o passo no qual ocorre a definição da finalidade de uma
tabela analítica. Para análise de associação a tabela deve ser definida como
Transaction.
Figura 11 – Construção do diagrama – Seleção da tabela de dados
70
Figura 12 – Construção do diagrama – Seleção da técnica – Regra de Associação
Neste passo, após a definição da tabela, é necessário colocá-la na área de
trabalho (figura 11). O nó Association, também deve estar na área de trabalho e uma
ligação deve ser criada entre o ícone da tabela e do nó Association (figura 12).
71
Figura 13 – Input de parâmetros da técnica de Regra de Associação
Clicando sobre o nó Association, é possível parametrizá-lo através da janela de
propriedades à esquerda da área de trabalho (figura 13). É possível especificar a
quantidade de regras, restrições para se criar uma regra e a complexidade das regras
criadas. Depois de definidas as propriedades do nó, clique sobre ele com o botão direito
e selecione a opção “Run” para executar o modelo de associação e criar as regras.
Depois o processo terminar, selecione a opção “Results” para ver os resultados da
análise.
72
As figuras 14 a 17 mostram os resultados gerados pelo SAS Enterprise Miner
5.3 para a análise de associação.
Figura 14 – Matriz de regras geradas
A figura 14 mostra, em uma matriz, a estatística confiança (confidence) de todas
as regras que foram geradas. Como pode ser visto na legenda, pontos mais próximos do
azul indicam confiança mais baixa, e pontos vermelhos indicam maior confiança. Os
eixos X e Y, respectivamente “Mão direita da regra” e “Mão esquerda da regra”,
facilitam encontrar todas as regras ligadas a determinado produto. A “mão esquerda”
pode ser interpretada como a causa e a “mão direita” como a conseqüência de uma
regra. Por exemplo, veja a regra abaixo:
Se comprou produto A => 60% também comprou produto B
Mão esquerda Mão direita confiança
73
Figura 15 - Gráfico Suporte x Confiança
A figura 15 mostra um gráfico de pontos (Scatter Plot), onde cada ponto
representa uma regra, sendo o eixo X a confiança e o eixo Y o suporte daquela regra. A
cor do ponto mostra a quantidade de itens que compões a regra, de acordo com a
legenda. Geralmente as melhores regras são aquelas que apresentam alto suporte e alta
confiança.
74
Figura 16 – Algumas informações estatísticas
A figura 16 mostra uma cópia da tela do SAS contendo estatísticas gerais sobre
as regras produzidas.
Os valores mínimo, máximo e médio para as variaveis:
EXP_CONF – Confiança esperada
CONF – Confiança
SUPPORT – Suporte
LIFT – Razão entre a Confiança e Confiança esperada.
75
Figura 17 – Regras produzidas
A figura 17 mostra a descrição completa de cada regra, junto com as estatísticas
específicas.
Livros Grátis( http://www.livrosgratis.com.br )
Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas
Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo