Folha de rosto - coc.ufrj.br

APLICAÇÕES DE TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL PARA

CLASSIFICAÇÃO GENÉTICA DE AMOSTRAS DE ÓLEO DA PORÇÃO TERRESTRE,

BACIA POTIGUAR, BRASIL

Erica Tavares de Morais

DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS

PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE

FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS

PARA A OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIAS EM ENGENHARIA

CIVIL.

Aprovada por:

_____________________________________________

Prof. Luiz Landau, D.Sc.

_____________________________________________

Dr. Henrique Luiz de Barros Penteado, Ph.D.

_____________________________________________

Prof. Nelson Francisco Favilla Ebecken, D.Sc.

_____________________________________________

Dr. Luiz Antonio Freitas Trindade, Ph.D.

_____________________________________________

Dr. Eugênio Vaz dos Santos Neto, Ph.D.

RIO DE JANEIRO, RJ – BRASIL

JUNHO DE 2007

ii

MORAIS, ERICA TAVARES DE

Aplicações de Técnicas de Inteligência

Artificial para Classificação Genética de

Amostras de Óleo da Porção Terrestre, da

Bacia Potiguar, Brasil [Rio de Janeiro] 2007

XVII, 277 p. 29,7 cm (COPPE/UFRJ,

M.Sc., Engenharia Civil, 2007)

Dissertação – Universidade Federal do Rio

de Janeiro, COPPE

1. Geoquímica Orgânica;

2. Inteligência Artificial;

3. Bacia Potiguar.

I. COPPE/UFRJ II. Título (série).

iii

“O grande segredo dos negócios é

saber aquilo que ninguém mais sabe”. Aristóteles Onassis.

“Dedico esta dissertação ao meu pai”.

(in memorian).

iv

AGRADECIMENTOS:

Agradeço a todos que estiveram ao meu lado e ajudaram de alguma forma

direta ou indiretamente, e especialmente:

A minha mãe por ter me dado durante toda a minha vida um grande exemplo e

ter me incentivado a todo o momento.

Ao meu noivo Thiago, por ter me dado amor e carinho, durante os momentos

de felicidade e tristeza, e por ter me ajudado na confecção de alguns perfis.

A PETROBRAS pela liberação dos dados e incentivo não apenas a seus

funcionários, mas a estudantes na aquisição do conhecimento.

Ao gerente da Gerência de Geoquímica, Luiz Antonio Freitas Trindade, por ter

me dado a oportunidade e apoio na execução deste trabalho mesmo antes,

quando apenas aluna, e depois já como funcionária.

Ao meu orientador Henrique Penteado pelas horas de ensinamento, apoio e

dedicação que fizeram este trabalho ganhar forma, por quem tenho respeito e

admiração.

Ao programa de Eng. Civil da COPPE/UFRJ e todos os seus funcionários.

Ao professor Luiz Landau pela dedicação com seus alunos e por ter

transformado “O Sistemas Petrolíferos” uma referência em qualidade e

formação.

Ao geólogo Jarbas V. P. Guzzo, por ter me apresentado à Bacia Potiguar,

cenário deste estudo. E por ter me cedido, gentilmente, sua tabela de

classificação de óleos, ainda em estudo.

Aos integrantes da banca Luiz Antonio Freitas Trindade, Eugênio Vaz dos

Santos Neto e Nelson Francisco Favilla Ebecken por terem aceitado o convite

e acrescentaram sugestões valiosas ao trabalho.

A todos os técnicos em química da Gerência de Geoquímica pela execução

das análises laboratoriais.

Ao geólogo Mário Duncan Rangel pela eterna orientação e amizade ao longo

destes anos de convivência.

À professora Soraia Gardel Carelli por ter acreditado, e ter se tornado uma

peça chave a minha inserção no setor do petróleo.

As amigas Helen, Aninha e Joelma pela amizade, sugestões e especialmente

os momentos inenarráveis de diversão.

Aos colegas de trabalho da Gerência de Geoquímica.

Deixo aqui registrado o meu MUITO OBRIGADO a todos!

v

Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos

necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)

APLICAÇÕES DE TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL PARA

CLASSIFICAÇÃO GENÉTICA DE AMOSTRAS DE ÓLEO DA PORÇÃO TERRESTRE,

BACIA POTIGUAR, BRASIL


Junho/2007

Orientadores: Henrique Luiz de Barros Penteado

Luiz Landau

Programa: Engenharia Civil

A Geoquímica Orgânica é uma poderosa ferramenta no auxílio à exploração de

petróleo. Com o passar dos anos e o constante desenvolvimento das técnicas

analíticas, tem-se observado uma incalculável proliferação de dados, onde

conhecimento se encontra “escondido”. A busca por novos padrões de informações e

a rapidez nas respostas são variáveis que assombram especialistas na exploração de

petróleo. Neste contexto, este trabalho descreve a aplicação de duas técnicas de

Inteligência Artificial (Árvores de Decisão - AD’s e Redes Neurais Artificiais – RNA’s)

no auxílio à determinação das classes genéticas em amostras de óleo com bases em

parâmetros geoquímicos. Para o desenvolvimento do trabalho, foi escolhida a Bacia

Potiguar (porção terrestre) por possuir mais de um Sistema Petrolífero conhecido e

uma vasta literatura a respeito do assunto. A primeira etapa do estudo consistiu na

amostragem a partir do banco de dados original. Para isto, foi proposta uma

metodologia que agrega a seleção aleatória tradicional com Análise de Cluster, que se

mostrou bastante eficiente. Em um segundo momento, foi realizado um refinamento na

classificação genética pré-existente dos óleos, e estas novas classes foram aplicadas

na terceira etapa do trabalho, onde foram gerados os modelos a partir das técnicas de

AD’s e RNA’s. A última etapa consistiu na avaliação dos resultados obtidos por cada

técnica através de um estudo comparativo. Os resultados obtidos mostram que é

possível desenvolver, com sucesso, algoritmos eficientes para determinar a classe

genética em amostras de óleo, auxiliando assim no processo de tomada de decisões

em Geoquímica Orgânica.

vi

Abstract of Dissertation presented to COPPE/UFRJ as a partial fulfillment of the

requirements for the degree of Master of Science (M.Sc.)

APPLICATION OF ARTIFICIAL INTELLIGENCE TECHNIQUES FOR THE GENETIC

CLASSIFICATION OF OIL SAMPLES FROM ONSHORE POTIGUAR BASIN, BRAZIL


June/2007

Advisors: Henrique Luiz de Barros Penteado

Luiz Landau

Department: Civil Engineering

Organic Geochemistry is a powerful tool for petroleum exploration. As time goes

by, the constant development of the analytical techniques, has produced an impressive

proliferation of data where much information is “hidden”. The search for new patterns of

information and the speed in the answers are variables that astonish specialists in

petroleum exploration. In this context, this work describes the application of two

techniques of Artificial Intelligence (Decision Trees and Neural Networks) as an aid to

the determination of the genetic classes of oil samples based on geochemical

parameters. For the development of this work, the Potiguar Basin (onshore) was

chosen, because it contains more than one Petroleum System and a vast literature

about the subject. The first stage of the study consisted in sampling from the original

database. A methodology was proposed that joins the traditional random selection with

Cluster Analysis. This combination was shown to be quite efficient. In a second step, a

refinement was accomplished in the previous genetic classification of the oils, and

these new classes were applied to the third stage of this work, in which models were

generated using the techniques of Decision Trees and Neural Networks. The last stage

consisted in the evaluation of the results obtained by each technique by a comparative

study. The results show that it is possible to successfully develop, efficient algorithms

to determine the genetic classes in oil samples, thus helping decision making process

in Organic Geochemistry.

vii

Índice:

CAPÍTULO 1: INTRODUÇÃO -------------------------------------------------------------------------1

1.1) Considerações Iniciais -----------------------------------------------------------------------------1 1.2) Motivação ---------------------------------------------------------------------------------------------4

1.3) Objetivos ----------------------------------------------------------------------------------------------6

1.4) Organização do Trabalho -------------------------------------------------------------------------6

CAPÍTULO 2: GEOLOGIA DA ÁREA ESTUDADA -------------------------------------------- 8

2.1) Introdução----------------------------------------------------------------------------------------------8

2.2) Aspectos de Geotectônica ------------------------------------------------------------------------9

2.3) Arcabouço Estrutural -----------------------------------------------------------------------------12

2.4) Estratigrafia da Bacia Potiguar -----------------------------------------------------------------16

CAPÍTULO 3: SISTEMAS PETROLÍFEROS E GEOQUÍMICA DAS ROCHAS GERADORAS E ÓLEOS ------------------------------------------------------------------------------23

3.1) Sistemas Petrolíferos -----------------------------------------------------------------------------23

3.1.1) Introdução -------------------------------------------------------------------------------23

3.1.2) Rochas Geradoras --------------------------------------------------------------------24

3.1.3) Rochas Reservatórios ----------------------------------------------------------------25

3.1.4) Rochas Selantes -----------------------------------------------------------------------25

3.1.5) Modelos de Plays Exploratórios ---------------------------------------------------25

3.1.6) Os Sistemas Petrolíferos na Bacia Potiguar -----------------------------------32

3.2) Propriedades Geoquímicas ---------------------------------------------------------------------33

3.2.1) Rochas Geradoras --------------------------------------------------------------------34

3.2.2) Óleos -------------------------------------------------------------------------------------38

CAPÍTULO 4: PROCEDIMENTOS ANALÍTICOS ----------------------------------------------41 4.1) Introdução -------------------------------------------------------------------------------------------41

4.2) Preparação das Amostras -----------------------------------------------------------------------42

4.3) Cromatografia Líquida (CL) ---------------------------------------------------------------------42

4.4) Cromatografia em Fase Gasosa (CG) -------------------------------------------------------44

4.5) Cromatografia em Fase Gasosa Acoplada à Espectrometria de Massas (CG-

EM) ----------------------------------------------------------------------------------------------------------47

viii

4.6) Isótopos Estáveis de Carbono (δ13C) -------------------------------------------------------50

4.7) Determinação do Grau API (Densidade) ----------------------------------------------------51

4.8) Teor de Enxofre (S) -------------------------------------------------------------------------------52

CAPÍTULO 5: TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL --------------------------------54 5.1) Introdução -------------------------------------------------------------------------------------------54

5.2) Classificação de Dados --------------------------------------------------------------------------55

5.3) Redes Neurais Artificiais (RNA’s) -------------------------------------------------------------56

5.3.1) O Neurônio Biológico -----------------------------------------------------------------58

5.3.2) O Neurônio Artificial -------------------------------------------------------------------60

5.3.3) Funções de Ativação -----------------------------------------------------------------61

5.3.4) Topologia da Rede --------------------------------------------------------------------63

5.3.5) Modelos de Treinamento ------------------------------------------------------------64

5.3.6) Modelos de Redes Neurais Artificiais --------------------------------------------66

5.3.7) Modelo de Multi Layer Perceptron (MLP) ---------------------------------------66

5.3.7.1) Aprendizado das Redes MPL ------------------------------------------68

5.3.7.2) O Termo Momentum -----------------------------------------------------71

5.3.7.3) Atualização dos Pesos ---------------------------------------------------72

5.3.7.4) Fim de Treinamento ------------------------------------------------------72

5.3.7.5) Pesos Iniciais ---------------------------------------------------------------73

5.3.7.6) Escala dos Valores de Entrada ----------------------------------------73

5.4) Árvores de Decisão -------------------------------------------------------------------------------74

5.4.1) Estrutura de uma Árvore de Decisão ---------------------------------------------75

5.4.2) Construção de uma Árvore de Decisão -----------------------------------------77

5.4.3) Entropia ----------------------------------------------------------------------------------80

5.4.4) Ganho de Informação (Critério Gain) ---------------------------------------------81

5.4.5) Poda --------------------------------------------------------------------------------------82 5.5) Vantagens x Desvantagens ---------------------------------------------------------------------83

CAPÍTULO 6: CLASSIFICAÇÃO E SELEÇÃO DAS AMOSTRAS ------------------------85 6.1) Introdução -------------------------------------------------------------------------------------------85

6.2) Classificação Anterior ----------------------------------------------------------------------------86

6.3) Metodologia para Seleção das Amostras --------------------------------------------------105

6.3.1) Análise Exploratória -----------------------------------------------------------------106

6.3.2) Análise de Cluster -------------------------------------------------------------------108

6.4) Características do Conjunto Escolhido -----------------------------------------------------109

ix

6.5) Discussão da Classificação de Óleos ------------------------------------------------------137

CAPÍTULO 7: IMPLEMENTAÇÃO DAS TÉCNICAS ----------------------------------------139 7.1) Introdução ------------------------------------------------------------------------------------------139

7.1.1) O Software WEKA -------------------------------------------------------------------139

7.1.2) Organização dos Dados de Entrada --------------------------------------------141

7.2) Aplicação da Técnica de Árvores de Decisão --------------------------------------------142

7.3) Aplicação da Técnica de Redes Neurais Artificiais -------------------------------------159

CAPÍTULO 8: DISCUSSÃO DOS RESULTADOS -------------------------------------------166 8.1) Introdução ------------------------------------------------------------------------------------------166

8.2) Comparação da Classificação por AD’s com a Original -------------------------------167

8.3) Comparação da Classificação por RNA’s com a Original -----------------------------176

8.4) Discussão Geral dos Resultados ------------------------------------------------------------178

CAPÍTULO 9: CONCLUSÕES E RECOMENDAÇÕES -------------------------------------181 9.1) Conclusões ----------------------------------------------------------------------------------------181

9.2) Recomendações para Trabalhos Futuros -------------------------------------------------185

REFERÊNCIAS BIBLIOGRÁFICAS --------------------------------------------------------------186

ANEXOS -------------------------------------------------------------------------------------------------197

x

Índice de Figuras: CAPÍTULO 1 Figura 1.1: Etapas do KDD, segundo FAYYAD et al. (1996). ---------------------------------5 CAPÍTULO 2 Figura 2.1: Mapa de localização da Bacia Potiguar (modificado de BERTANI et al.,

1991). ---------------------------------------------------------------------------------------------------------8

Figura 2.2: Gráfico mostrando a participação na produção de óleo da Bacia Potiguar

(terra) na produção nacional (terra e mar) (ANP, 2007). ----------------------------------------9

Figura 2.3: Principais feições estruturais da Província Borborema (BRITO NEVES,

1998). -------------------------------------------------------------------------------------------------------10 Figura 2.4: Mapa estrutural com as principais unidades do arcabouço estrutural da

Bacia Potiguar (Modificado de FRANÇOLIN & SZATMARI, 1987). ------------------------14

Figura 2.5: Seção geológica da Bacia Potiguar (terra) da área indicada no mapa da

Fig. 2.4 (modificado de MATOS, 1987). -----------------------------------------------------------15 Figura 2.6: Carta estratigráfica da Bacia Potiguar (modificado de ARARIPE & FEIJÓ

1994). -------------------------------------------------------------------------------------------------------17 CAPÍTULO 3 Figura 3.1: Modelos de acumulação na seqüência rift (modificado de BERTANI et al.

1991). -------------------------------------------------------------------------------------------------------27

Figura 3.2: Modelos de acumulação na seqüência transicional (modificado de

BERTANI et al. 1991). ----------------------------------------------------------------------------------29

Figura 3.3: Modelos de acumulação na seqüência drift transgressiva (modificado de

BERTANI et al., 1991). ---------------------------------------------------------------------------------31

Figura 3.4: Modelo de acumulação na seqüência drift regressiva (modificado de

BERTANI et al., 1991). ---------------------------------------------------------------------------------32 Figura 3.5: Carta de eventos para os sistemas petrolíferos Pendência (!) e Alagamar-

Açu (!) (modificado de ANP, 2002). -----------------------------------------------------------------33 Figura 3.6: Perfil geoquímico do poço 1-UPN-1-RN mostrando os valores de COT, S2,

IH, IO, Ro, Tmax e S1 dos depósitos hipersalinos na Formação Pendência, segundo

(MELLO et al., 1993). -----------------------------------------------------------------------------------36

xi

CAPÍTULO 4 Figura 4.1: Fluxograma mostrando as técnicas analíticas realizadas nos laboratórios

do Centro de Excelência em Geoquímica e na Gerência de Avaliação de Petróleo. --42 Figura 4.2: Diagrama ternário mostrando o comportamento na concentração dos

compostos do petróleo de acordo com o aumento da degradação (modificado de

TISSOT & WELTE, 1984). ----------------------------------------------------------------------------43 Figura 4.3: Equipamento para cromatografia líquida Knauer MPLC. ----------------------44 Figura 4.4: Cromatógrafo a gás Hewlett-Packard, modelo HP 6890A. --------------------45

Figura 4.5: Modelo esquemático do funcionamento de um cromatógrafo a gás

(modificado de COLLINS et al., 1997). -------------------------------------------------------------46 Figura 4.6: Exemplo de cromatograma gasoso e respectivos fragmentogramas dos

íons (m/z) 191 e 217 de uma amostra de óleo lacustre da Bacia Potiguar. --------------48 Figura 4.7: Espectrômetro de massas Micromass acoplado ao cromatógrafo a gás

Hewlett-Packard, modelo HP 6890 Series. -------------------------------------------------------48

Figura 4.8: Modelo esquemático de um cromatógrafo acoplado a um espectrômetro de

massas e suas respectivas funções (modificado de PETERS & MOLDOWAN, 1993).---

----------------------------------------------------------------------------------------------------------------49

Figura 4.9: Espectrômetro e massas MAT 252 da Finnigan utilizado na análise

isotópica de carbono em óleos. ----------------------------------------------------------------------51

Figura 4.10: Densitômetro digital ANTON PARR, modelo DMA-602. ----------------------52 CAPÍTULO 5 Figura 5.1: Exemplo de arquitetura de uma RNA de três camadas. -----------------------57 Figura 5.2: Tipos de neurônios biológicos (SILVA JÚNIOR & SASSON, 1996). --------58 Figura 5.3: Esquema da propagação do impulso nervoso em um neurônio (modificado

de LOPES, 1997). ---------------------------------------------------------------------------------------59 Figura 5.4: Modelo esquemático da unidade fundamental de uma RNA, o neurônio

artificial. ----------------------------------------------------------------------------------------------------60 Figura 5.5: Exemplo de funções de ativação. ----------------------------------------------------61 Figura 5.6: Estrutura unidirecional em uma RNA de quatro camadas. --------------------63 Figura 5.7: Estrutura recorrente em uma das camadas de uma RNA. --------------------64 Figura 5.8: Esquema de aprendizado supervisionado. ----------------------------------------65 Figura 5.9: Esquema de aprendizado não supervisionado. ----------------------------------66 Figura 5.10: Exemplo de arquitetura de uma rede neural artificial de quatro camadas

tipo MLP. ---------------------------------------------------------------------------------------------------67 Figura 5.11: Fluxo do sinal no neurônio de saída k. --------------------------------------------69

xii

Figura 5.12: Panorama do erro quadrático com um mínimo local (modificado de

KOVÁCS, 1996). -----------------------------------------------------------------------------------------71 Figura 5.13: Exemplo de estrutura de uma Árvore de Decisão binária. -------------------75 Figura 5.14: Exemplo de partições de um espaço de objetos que possui apenas duas

classes (modificado de LUCENA & DE PAULA, 2001). ---------------------------------------76 Figura 5.15: Árvore de Decisão obtida para o conjunto de dados apresentados na

tabela 5.1. -------------------------------------------------------------------------------------------------78 Figura 5.16: Gráfico mostrando os valores de entropia em função da probabilidade.--81 CAPÍTULO 6 Figura 6.1: Perfis cromatográficos de óleo total, fragmentogramas de massas e valores

isotópicos de carbono para as três diferentes famílias de óleos encontradas na porção

terrestre da Bacia Potiguar (modificado de RODRIGUES et al., 1983). -------------------87 Figura 6.2: Mapa com a localização dos principais campos da Bacia Potiguar

(modificado de BERTANI et al., 1991). ------------------------------------------------------------88 Figura 6.3: Perfis cromatográficos de óleo total, fragmentogramas de massas e valores

isotópicos para as três diferentes famílias de óleos encontradas na porção terrestre da

Bacia Potiguar (modificado de MELLO et al., 1984). -------------------------------------------90 Figura 6.4: Mapa com a distribuição geográfica dos diferentes tipos de óleos

encontrados na Bacia Potiguar terra (modificado de SANTOS NETO et al., 1990). ---94 Figura 6.5: Cromatogramas gasosos de quatro amostras de óleo mostrando diferentes

níveis de biodegradação. ------------------------------------------------------------------------------95 Figura 6.6: Fluxograma mostrando as etapas seguidas para a seleção das amostras. --

---------------------------------------------------------------------------------------------------------------106 Figura 6.7: Distância Euclidiana entre dois pontos em um espaço bidimensional para

as variáveis X1 e X2. -----------------------------------------------------------------------------------109 Figura 6.8: Diagramas triangulares representando as porcentagens de compostos

saturados, aromáticos e NOS (resinas e asfaltenos) para as 200 amostras de óleo na

Bacia Potiguar terrestre separadas em suas diferentes classes. -------------------------111 Figura 6.9: Gráfico entre o grau API versus porcentagem de enxofre para as amostras

da porção terrestre da Bacia Potiguar utilizadas neste estudo. ----------------------------112 Figura 6.10: Gráfico entre o grau API versus porcentagem de compostos NOS (resinas

e asfaltenos) para as amostras da porção terrestre da Bacia Potiguar utilizadas neste

estudo. ----------------------------------------------------------------------------------------------------112 Figura 6.11: Cromatogramas Gasosos representando as diferentes classes de óleo

recuperados na Bacia Potiguar terra. -------------------------------------------------------------113

xiii

Figura 6.12: Mapa com a distribuição geográfica das diferentes classes de óleos

encontradas na Bacia Potiguar terra, baseadas neste estudo. ----------------------------114

Figura 6.13: Exemplos de fragmentogramas de massas m/z 191, m/z 217 e m/z 259 de

óleos das classes lacustre siliciclástico, subgrupos A e B. Observar a diferença quanto

à concentração dos compostos tricíclicos em relação aos pentacíclicos. ---------------117 Figura 6.14: Gráficos mostrando os principais diferenças observadas nos óleos

classificados como lacustre siliciclástico. --------------------------------------------------------118 Figura 6.15: Gráficos mostrando os principais diferenças observadas nos óleos

classificados como lacustre. ------------------------------------------------------------------------122 Figura 6.16: Exemplos de fragmentogramas de massas m/z 191, m/z 217 e m/z 259 de

óleos das classes lacustre A e B. Observar a presença em maior proporção dos

compostos C29Ts e diahopano na amostra da classe lacustre B. -------------------------123 Figura 6.17: Gráficos mostrando as diferenças de qualidade nos óleos mistos dos

Trends de Carnaubais e Areia Branca. Em (a) parâmetros globais º API x %S, e em (b)

dados de cromatografia líquida. --------------------------------------------------------------------126 Figura 6.18: Gráficos mostrando os principais diferenças observadas nos óleos

classificados como mistos. --------------------------------------------------------------------------127 Figura 6.19: Gráficos mostrando os principais diferenças observadas nos óleos

classificados como mistos. --------------------------------------------------------------------------128 Figura 6.20: Fragmentogramas de massas íons m/z 191, 217 e 259 de um óleo da

classe Misto Trend de Areia Branca e outro Misto Trend de Carnaubais. --------------129 Figura 6.21: Exemplos de resultados de cromatografia líquida e gasosa,

espectrometria de massas e isótopos de carbono total em óleos pertencentes às

Bacias do Ceará e Potiguar, mostrando a alta correlação óleo-óleo entre as duas

amostras e classificados como óleos marinho-evaporíticos. -------------------------------130 Figura 6.22: Gráficos mostrando a menor qualidade dos óleos da classe marinho-

evaporítico em relação aos demais óleos da bacia. Em (a) parâmetros globais º API x

%S, e em (b) dados de cromatografia líquida. -------------------------------------------------131 Figura 6.23: Gráfico entre porcentagem de compostos NSO e somatório de

biomarcadores (hopanos e esteranos) em ppm na fração dos C14+ saturados. -------132 Figura 6.24: Gráficos mostrando as principais diferenças observadas nos óleos da

classe marinho-evaporítico em relação às demais classes da bacia Potiguar, porção

terrestre. --------------------------------------------------------------------------------------------------133 Figura 6.25: Gráficos mostrando a correlação entre os óleos da classe marinho-

evaporítico com os extratos da Formação Alagamar (CES 07 e SO-05) e os óleos

marinho-evaporítico dos poços CES-08 e 14. --------------------------------------------------134

xiv

Figura 6.26: Fragmentogramas de massas íons m/z 191, 217 e 259 de um óleo

marinho-evaporítico e outro misto Trend de Carnaubais mostrando a semelhança

visual entre os perfis. ---------------------------------------------------------------------------------136

Figura 6.27: Gráfico mostrando o aumento na salinidade da água do ambiente da

rocha geradora, dos óleos da porção terrestre da Bacia Potiguar. -----------------------137 CAPÍTULO 7 Figura 7.1: Tela de apresentação do programa WEKA e suas principais

funcionalidades. ----------------------------------------------------------------------------------------140

Figura 7.2: Exemplo de tabela de dados em formato .csv para entrada de dados no

software WEKA, visualizada no editor de texto Word pad®. -------------------------------141 Figura 7.3: Arquitetura da Árvore de Decisão gerada com 60 variáveis e Fator de

Confiança de 0,02. -------------------------------------------------------------------------------------150 Figura 7.4: Arquitetura da AD gerada com 60 variáveis e Fator de Confiança 0,5. --152 Figura 7.5: Arquitetura da AD com 25 variáveis e Fator de Confiança de 0,02. -------157 CAPÍTULO 8 Figura 8.1: Esquema ilustrando o momento em que a Árvore de Decisão foi podada e

acarretou a classificação incorreta de uma amostra da classe Lacustre B como

Lacustre A. Os gráficos apresentam os limites empregados pelo algoritmo na distinção

das classes. Observar a amostra classificada erroneamente destacada com um

quadrado vermelho no gráfico DIA/C27αα versus αββ/(αββ+ααα). -----------------------168 Figura 8.2: Criação da 11ª regra da Árvore de Decisão que permitiu a classificação

correta da amostra da classe Lacustre B. Árvore gerada com 60 variáveis e Fator de

Confiança de 0,5 e 0,9. -------------------------------------------------------------------------------169 Figura 8.3: Árvore de Decisão gerada com 25 variáveis e Fator de Confiança de 0,02,

0,5 e 0,9. -------------------------------------------------------------------------------------------------172 Figura 8.4: Gráfico mostrando a presença de 17 amostras (35%) da classe Lacustre A

que possuem valores da razão Gam/H30 inferior a 0,2151, concordando com a regra

apresentada pela Árvore de Decisão. ------------------------------------------------------------173 Figura 8.5: Gráficos mostrando os limites das razões 21+22/STER e TR23/H30. Em (a)

observar a presença de poucas amostras da classe Misto Trend de Areia Branca na

vizinhança do valor limite calculado. Em (b) observar a grande quantidade de amostras

da classe Misto Trend de Carnaubais próximo ao limite da razão para a classe

marinho-evaporítico. ----------------------------------------------------------------------------------175

xv

Figura 8.6: Fragmentogramas de massas m/z 191 e 217 de um óleo típico da classe

Lacustre A, do óleo classificado incorretamente e de um óleo da classe Lacustre

Siliciclástico B e outro da classe Lacustre B. ---------------------------------------------------177

xvi

Índice de Tabelas: CAPÍTULO 3 Tabela 3.1: Comparação proposta por RODRIGUES (1983) para os óleos de origem

continental e transicional. ------------------------------------------------------------------------------39

CAPÍTULO 5 Tabela 5.1: Exemplo de dados para construção de uma Árvore de Decisão. -----------78 CAPÍTULO 6 Tabela 6.1: Parâmetros geoquímicos diagnósticos adotados para discriminação

genética de óleos na Bacia Potiguar. -------------------------------------------------------102/104 Tabela 6.2: Número de amostras por classe contidas no conjunto amostrado. -------110 Tabela 6.3: Principais parâmetros geoquímicos adotados para discriminação genética

dos óleos presentes no conjunto amostrado da Bacia Potiguar, porção terrestre. ---116 CAPÍTULO 7 Tabela 7.1: Variáveis de entrada empregadas para a construção do modelo “baseado

em todas as variáveis”. ------------------------------------------------------------------------------142 Tabela 7.2: Relatório-padrão do software WEKA com os resultados da classificação

por Árvore de Decisão com 60 variáveis para os dados brutos. ---------------------------144 Tabela 7.3: Relatório-padrão do software WEKA com os resultados da classificação

por Árvore de Decisão com 60 variáveis para os dados padronizados. -----------------145 Tabela 7.4: Relatório-padrão do software WEKA com os resultados da classificação

por Árvore de Decisão com 60 variáveis para os dados organizados aleatoriamente. ---

---------------------------------------------------------------------------------------------------------------146 Tabela 7.5: Relatório-padrão do software WEKA com os resultados da classificação

por Árvore de Decisão com 60 variáveis e Fator de Confiança de 0,02. ----------------149 Tabela 7.6: Relatório-padrão do software WEKA com os resultados da classificação

por Árvore de Decisão com 60 variáveis e com Fator de Confiança de 0,5. -----------151 Tabela 7.7: Variáveis de entrada empregadas para a construção do modelo “baseado

nas variáveis escolhidas durante a classificação”. --------------------------------------------155 Tabela 7.8: Relatório-padrão do software WEKA com os resultados da classificação

por Árvore de Decisão com 25 variáveis com Fator de Confiança de 0,02. ------------156 Tabela 7.9: Relatório-padrão do software WEKA com os resultados da classificação

por Redes Neurais Artificiais para o conjunto com 60 variáveis. --------------------------161

xvii

Tabela 7.10: Relatório-padrão do software WEKA com os resultados da classificação

por Redes Neurais Artificiais para o conjunto com 25 variáveis. --------------------------164

1

CAPÍTULO

1

1. INTRODUÇÃO Este capítulo tem como objetivo introduzir o leitor ao contexto do trabalho através de uma visão geral do assunto abordado. Para isso, este capítulo destacará a importância do tema estudado, a definição do problema, suas justificativas, objetivos e, por fim, a organização do trabalho.

1.1) Considerações Iniciais A Geoquímica Orgânica possui grande importância na exploração de petróleo,

visto o grande desenvolvimento das técnicas analíticas que possibilitaram a aquisição

de dados para apoiar o entendimento do processo de geração-migração-acumulação

do petróleo.

A intensificação dos trabalhos no setor de exploração de petróleo do final da

década de 60 em diante, em especial após a descoberta de acumulações comerciais

na plataforma continental e em terra, tornou disponível cada vez mais uma crescente

proliferação de dados.

Durante os últimos anos, em função não apenas da demanda da exploração,

mas também do desenvolvimento das técnicas analíticas, tem-se verificado um

crescimento substancial da quantidade de dados armazenados de forma digital. Estes

dados, produzidos e armazenados em larga escala, acabam-se tornando inviáveis de

serem lidos ou analisados por especialistas através de métodos manuais tradicionais,

tais como planilhas de cálculo e relatórios informativos operacionais, onde o

especialista testa sua hipótese contra a base de dados.

Desta forma, em meio a esta imensa quantidade de dados, pode-se esconder

informações valiosas. Portanto, não basta apenas simplesmente armazenar dados, é

preciso transformá-los em informação! Um dado se transforma em informação quando

ganha um significado para seu usuário, caso contrário continua sendo simplesmente

um dado.

2

Como explorar um Banco de Dados e extrair deste as informações úteis? O

processo de capaz de descobrir conhecimento em Banco de Dados chama-se KDD

(Knowledge Discovery Database). O processo de KDD foi proposto em 1989 para

referir-se às etapas que produzem conhecimento a partir de dados e, principalmente, à

etapa de mineração de dados, que é a fase que transforma dados em informação

(FAYYAD et al., 1996). Este processo envolve desde encontrar a interpretar padrões

nos dados, de modo iterativo, interativo, cognitivo e exploratório, através da repetição

dos algoritmos e da análise de seus resultados. Este processo apresenta diversas

fases (Figura 1.1) com muitas decisões realizadas pelo analista, conforme descrito

por, FAYYAD et al. (1996):

Criação de um conjunto de dados alvos (SELEÇÃO): consiste em selecionar

um conjunto de dados, ou focar em um subconjunto, onde a descoberta deverá

ser realizada.

Limpeza dos dados e pré-processamento (PRÉ-PROCESSAMENTO): um dos

grandes problemas encontrados quando se trabalha com muitos dados é a

presença de dados de baixa qualidade, o que impõe uma perda na qualidade

dos resultados do aprendizado automático. Buscando-se minimizar estas

perdas, o pré-processamento dos dados é uma fase importante. Operações

básicas devem ser realizadas tais como remoção de ruídos quando necessário,

coleta da informação necessária para modelar ou estimar ruído, escolha de

estratégias para manipular campos de dados ausentes, e formatação de dados

de forma a adequá-los à ferramenta de mineração.

Redução de dados e projeção (TRANSFORMAÇÃO): compreende a

localização de características úteis para representar os dados em função do

objetivo da tarefa, visando a redução do número de variáveis e/ou instâncias a

serem consideradas para o conjunto de dados final, bem como o

enriquecimento semântico das informações.

Busca por padrões e/ou associações (MINERAÇÃO DE DADOS): consiste em

selecionar os métodos a serem utilizados para localizar padrões nos dados,

seguido da efetiva busca por modelos de interesse numa forma particular de

representação ou conjunto de representações; busca pelo melhor ajuste dos

parâmetros do algoritmo para a tarefa em questão.

Interpretação dos padrões minerados (INTERPRETAÇÃO): é a fase onde o(s)

especialista(s) avalia(m) os resultados obtidos e pode(m) retornar aos passos

anteriores para reparar algum equívoco ou falha, ou então incorporar o

conhecimento alcançado à performance do sistema, documentá-lo e reportá-lo

às partes interessadas.

3

Figura 1.1: Etapas do Knowledge Discovery Database (KDD), segundo FAYYAD et al. (1996).

Diferentes modelos podem ser aplicados aos bancos de dados para dar o

suporte necessário aos distintos problemas nas mais diversas áreas que possam

necessitar da busca por informações implícitas e padrões ocultos. Estes modelos são

divididos de acordo com a natureza da atividade, e os principais são:

PREDIÇÃO: realizado a partir de uma modelagem de dados do passado e do

presente, este sistema tem como produto final uma determinada previsão do

futuro. Ele baseia sua solução na análise do comportamento dos dados

recebidos do passado, e possui mecanismos para verificar os vários futuros

possíveis, a partir da análise do comportamento desses dados fazendo uso de

raciocínios hipotéticos e verificando a tendência de acordo com a variação dos

dados de entrada.

AGRUPAMENTO (CLUSTERING): o algoritmo cria classes através da

produção de partições dos dados em conjunto de tuplas. As partições são

realizadas de modo que as tuplas com valores de atributos semelhantes, ou

seja, propriedades de interesse comuns, sejam reunidas em uma mesma

classe.

CLASSIFICAÇÃO: consiste em associar um item a uma classe através do

relacionamento entre os atributos do objeto e os das classes em questão.

Estes modelos podem ser obtidos através de diferentes técnicas baseadas em

conceitos de aprendizado de máquina (Machine Learning), reconhecimento de

padrões e estatística. Alguns exemplos são: Lógica Fuzzy, Descoberta de Regras de

SELEÇÃOSELEÇÃO

Dados

DadosAlvo

DadosPré-processados

DadosTransformados

Padrões

Conhecimento

PRÉPRÉ--PROCESSAMENTOPROCESSAMENTO

TRANSFORMAÇÃOTRANSFORMAÇÃO

MINERAÇÃO DOS DADOSMINERAÇÃO DOS DADOS

INTERPRETAÇÃOINTERPRETAÇÃO

SELEÇÃOSELEÇÃO

Dados

DadosAlvo

DadosPré-processados

DadosTransformados

Padrões

Conhecimento

PRÉPRÉ--PROCESSAMENTOPROCESSAMENTO

TRANSFORMAÇÃOTRANSFORMAÇÃO

MINERAÇÃO DOS DADOSMINERAÇÃO DOS DADOS

INTERPRETAÇÃOINTERPRETAÇÃO

4

Associação, Árvores de Decisão, Algoritmos Genéticos, Redes Neurais Artificiais,

entre outros (DIAS, 2002 e CARVALHO, 2005).

Embora sistemas automáticos e especialistas humanos possam em alguns

casos desempenhar tarefas idênticas, as características de ambos são criticamente

diversas. Ainda que algumas vantagens evidentes associadas aos sistemas

automatizados existam, eles não poderão substituir os especialistas humanos em

todas as situações em virtude de algumas limitações inerentes, como por exemplo a

imparcialidade frente à capacidade discriminatória humana.

A capacidade mais útil de um sistema automático é sua especialidade de alto

nível que auxilia na solução dos mais diversos problemas. Este conhecimento

especializado pode representar a experiência dos melhores peritos no campo

estudado. Desta forma, sua especialização de alto nível, aliada à habilidade de

aplicação, torna seu custo competitivo e apto a ganhar credibilidade nas corporações.

A flexibilidade do sistema também auxilia no seu crescimento e aquisição de mais

informação através da sua atualização à medida que o conhecimento e o volume de

dados na área estudada aumenta e os especialistas humanos resolvem reportá-los ao

sistema.

O corpo de conhecimento que compõe um sistema automatizado representa a

memória institucional. Assim, se a base de informações foi desenvolvida através da

interação das pessoas-chave da organização, então esta compilação vem a ser o

consenso de opiniões de mais alto nível e se tornará um registro permanente das

melhores estratégias utilizadas, representando o conhecimento do grupo. Desta forma,

caso estas pessoas-chave venham a se desligar do grupo, suas experiências

permanecerão.

1.2) Motivação De um modo geral, as pesquisas baseadas em grandes volumes de dados na

área de Geoquímica Orgânica vêm sendo norteadas a partir de uma perspectiva

descritiva e preditiva, onde a Estatística, com toda sua fundamentação matemática é

uma ferramenta bem difundida e aceita. Atualmente, para montar as bases de

conhecimento, são montadas as regras como um primeiro formalismo para expressar

o conhecimento de uma maneira simbólica. As regras têm a vantagem de um

formalismo simples, uniforme, transparente e fácil de se fazer inferências, o que leva a

supor ser esta a melhor maneira de representar o conhecimento do mundo real.

5

A construção de modelos estatísticos costuma ser o método tradicionalmente

utilizado para derivar estas tendências. Entretanto, estatísticas tradicionais são

limitadas se levarmos em conta que a análise se torna trabalhosa o bastante quando o

número de variáveis a serem investigadas cresce seguidamente, os métodos

estatísticos possuem condições que limitam o número de casos a utilizar, fazendo com

que apenas uma pequena parte do universo esteja disponível para análise e, quando

os relacionamentos dos dados não são lineares, torna-se difícil empregar os métodos

estatísticos tradicionais. Além destes pontos, raramente se dispõe de técnicos

especializados para essa tarefa tão específica, que mesmo com ajuda de estatísticos

pode-se levar semanas para compor modelos tão complexos.

As pesquisas envolvendo Inteligência Artificial na Geoquímica Orgânica ainda

têm sua atuação de forma pontual. Na Geologia de uma maneira geral, concentram-se

esforços no desenvolvimento de Sistemas Especialistas para auxílio nas áreas de

mineração e caracterização de fácies reservatório.

Diante deste cenário, buscou-se testar a performance da metodologia de

descoberta de conhecimento no apoio à classificação genética de amostras de óleo a

partir de parâmetros geoquímicos. Para tal, seria necessário uma bacia que reunisse

um vasto e consagrado conhecimento técnico, possuísse pelo menos duas classes de

óleo, e cujo banco de dados fosse suficiente para uma amostragem. De acordo com

tais premissas, foi então escolhida a Bacia Potiguar.

A Bacia Potiguar está localizada na porção nordeste do continente Sul

Americano, nos estados do Rio Grande do Norte e Ceará, Brasil. A bacia ocupa uma

área de aproximadamente 60.000 Km2, dos quais 40% correspondem à porção

emersa, os demais se localizam na porção da plataforma e talude continental

(BERTANI et al, 1991). Estudos de Geoquímica Orgânica ao longo das últimas três

décadas identificaram pelo menos duas seqüências distintas de rochas geradoras

através da correlação óleo-rocha (RODRIGUES, 1983; MELLO et al., 1984;

CERQUEIRA 1985; SANTOS & RODRIGUES, 1986; MELLO, 1988; SANTOS NETO

et al., 1990; TRINDADE, 1992; TRINDADE et al., 1992; MELLO et al., 1993;

PENTEADO, 1995; SANTOS NETO & HAYES, 1999; MAGNIER & PENTEADO,

2000). Porém, os óleos recuperados na bacia correspondem não apenas a

acumulações formadas pela carga individual destes geradores. A bacia apresenta

acumulações constituídas da mistura destes dois end-members de seqüências de

rochas geradoras, o que a torna mais propícia ao escopo proposto por este trabalho.

6

1.3) Objetivos

Este trabalho propõe o desenvolvimento de um classificador automático

baseado no estudo remoto por algoritmos associado ao conhecimento humano. Para

tal, foram escolhidas duas técnicas: a de Árvores de Decisão (AD’s), conhecida por ser

um modelo “caixa branca” que permite o usuário entender a formulação, bem como o

resultado do modelo gerado, e a de Redes Neurais Artificiais (RNA’s), técnica bastante

aceita na comunidade científica por sua capacidade de aprendizado e generalização,

mas que possui uma formulação estilo “caixa preta” que exclui o usuário do

entendimento por trás dos módulos de desenvolvimento e o deixa livre apenas no que

diz respeito à construção da topologia empregada.

A intenção de se utilizar duas técnicas tão diferentes é fazer a comparação dos

resultados obtidos em cada uma delas, verificando-se assim qual oferece a menor

porcentagem de erros e suas vantagens e desvantagens para o contexto do trabalho,

ou seja, a classificação genética de famílias de óleos na Bacia Potiguar em sua porção

terrestre, utilizando parâmetros geoquímicos.

De forma complementar, o trabalho ainda traz uma proposta de metodologia

para amostragem que garante uma maior representatividade do conjunto amostrado.

Este trabalho ainda propõe um refinamento da classificação genética de óleos para a

bacia, e estas novas classes serão utilizadas para a construção e aplicação dos

modelos.

O desenvolvimento apresentado neste trabalho não tratará do pré-

processamento de dados, uma vez que esta etapa foi realizada durante a seleção das

amostras junto ao banco de dados do Centro de Excelência em Geoquímica da

Petrobras (CEGEQ/Gerência de Geoquímica), localizado no Centro de Pesquisas

Leopoldo A. Miguez de Melo (CENPES). Desta forma, as duzentas amostras

apresentadas aqui já possuem um pré-tratamento.

1.4) Organização do Trabalho

O trabalho foi dividido em nove capítulos como se segue, incluindo este

introdutório.

Neste capítulo, destacou-se a importância da Geoquímica Orgânica na

exploração de petróleo e das técnicas de Inteligência Artificial frente às necessidades

modernas que os cientistas encontram em virtude do explosivo crescimento de dados.

7

Abordou-se também o problema que será estudado, bem como as técnicas de

Inteligência Artificial escolhidas para o seu desenvolvimento.

No Capítulo 2, será apresentada a revisão da geologia da Bacia Potiguar,

abordando os aspectos de evolução tectônica, arcabouço estrutural e seqüência

estratigráfica.

No Capítulo 3, o conceito de Sistema Petrolífero, seus elementos e processos

serão apresentados ao leitor, além de uma breve abordagem da caracterização e

classificação das rochas geradoras e óleos recuperados na bacia.

No Capítulo 4, será descrita a metodologia das técnicas analíticas empregadas

para a obtenção dos dados utilizados na caracterização geoquímica das amostras de

óleo no Centro de Excelência em Geoquímica da Petrobras (CEGEQ/Gerência de

Geoquímica).

No Capítulo 5, será feita uma revisão dos principais fundamentos teóricos

relacionados às técnicas de Inteligência Artificial escolhidas para o cumprimento dos

objetivos deste estudo, e serão discutidas suas vantagens e desvantagens.

No Capítulo 6, será apresentada uma revisão literária detalhada dos trabalhos

de Geoquímica Orgânica ao longo dos últimos 25 anos, no que diz respeito à

classificação genética de óleos na Bacia Potiguar. Ainda neste capítulo, será

demonstrada como foi realizada a seleção das amostras apresentando uma

metodologia, aqui proposta, como alternativa à amostragem homogênea em

populações não homogêneas. Ao final deste capítulo, será apresentado e discutido um

refinamento da classificação anterior, obtido já a partir do conjunto de amostras

selecionado.

No Capítulo 7, serão disponibilizados os resultados alcançados a partir da

aplicação das técnicas de Inteligência Artificial no conjunto amostrado.

No Capítulo 8, os resultados obtidos pelas técnicas de Inteligência Artificial

serão discutidos em um estudo comparativo de suas performances, bem como no

contraste com a análise realizada no capítulo anterior.

O Capítulo 9, encerramento do trabalho, conterá as conclusões sobre as

metodologias aplicadas e sugestões para as perspectivas futuras.

8

CAPÍTULO

2

2. GEOLOGIA DA ÁREA ESTUDADA Neste capítulo será realizada a revisão da geologia da Bacia Potiguar. Os tópicos abordados serão a evolução tectônica, o arcabouço estrutural e a seqüência estratigráfica, conceitos os quais são fundamentais para a investigação e aplicação dos conceitos geoquímicos neste estudo.

2.1) Introdução

A Bacia Potiguar está situada no limite entre as margens leste e equatorial

brasileira. Limita-se a oeste pelo Alto de Fortaleza (CE), ao sul pelo embasamento

cristalino e a norte e leste se estende até os limites do talude de plataforma continental

até isóbatas de 2000m (MATOS et al., 1987, BERTANI et al., 1991). Em área, abrange

cerca de 60.000 Km2, sendo aproximadamente 40% na porção emersa e a parte

restante na plataforma e talude continental (Figura 2.1).

Figura 2.1: Mapa de localização da Bacia Potiguar (modificado de BERTANI et al., 1991).

9

A história tectônica da bacia teve início no Neocomiano e pode ser dividida em

três fases distintas, identificadas por BERTANI et al. (1991), quais sejam rift,

transicional e deriva continental (drift). O preenchimento sedimentar da bacia durante

cada uma destas fases tectônicas foi caracterizado, respectivamente, pela deposição

das megasseqüências continental, transicional e marinha (CHANG & KOWSMANN,

1987, CHANG et al., 1992).

A atividade exploratória nesta bacia experimentou dois notáveis incrementos, o

primeiro na década de 70 na porção marítima (Campo de Ubarana em 1973) e o

segundo na década de 80 em terra (Campo de Mossoró em 1979) (BERTANI, et al.,

1991, ARARIPE & FEIJÓ, 1994). Até dezembro de 2005, foram descobertos 58

campos de petróleo com reservas provadas de 66,4 milhões de m3 de óleo e

18.612,47 milhões de m3 de gás, com produção de cerca de 13.752,51 m3 /dia de óleo

e 1.357,62 m3 /dia de gás (Figura 2.2) (ANP, 2007).

96%

4%

Produção nacional anual 2005 Potiguar Terra anual 2005

Figura 2.2: Gráfico mostrando a participação na produção de óleo da Bacia Potiguar (terra) na

produção nacional (terra e mar) (ANP, 2007).

2.2) Aspectos de Geotectônica

A evolução da Bacia Potiguar está diretamente associada às estruturas do

embasamento Pré-Cambriano do paleocontinente Gondwana e ao conjunto de

tensões atuantes durante a sua separação na formação dos continentes Africano e

Sul-Americano. Segundo ALMEIDA et al., (1977) e SÁ (1984), as bacias sedimentares

do nordeste brasileiro implantaram-se na Província Borborema, a qual é constituída de

diversas faixas de rochas supracrustais dispersas através de um terreno gnáissico-

10

migmatítico, com trends estruturais a norte e a sul das grandes Zonas de

Cisalhamento E-W de Patos e Pernambuco (Figura 2.3).

Figura 2.3: Principais feições estruturais da Província Borborema (BRITO NEVES, 1998).

A característica marcante da província é os sistemas de dobramentos,

resultantes da superposição de diversos eventos tectônicos, metamórficos e

magmáticos em sedimentos e rochas vulcânicas acumuladas durante o Proterozóico

médio e superior (ALMEIDA & HASUI, 1984).

Os maciços migmatíticos-graníticos são caracteristicamente policíclicos com

eventos arqueanos (pré-Transamazônicos) e proterozóicos (Transamazônicos e

Brasilianos) (MATOS et al., 1987).

Os lineamentos e geofraturas da província são de grande expressão e marcam

um regime compressional de direção NW de idade Brasiliana com reativações até o

Coberturas fanerozóicas pós-silurianas

Afloramentos de bacias cambro-ordovicianas

Bacias cambro-ordovicianas sob a Bacia do Parnaíba

Cinturões dobrados meso-neoproterozóicos (brasilianos)

Cráton São Francisco

Principais zonas de cisalhamento

Jaibaras

Sairi/Jaguari

Coccoci/Rio Jucá

Catolé/São Julião

São Raimundo Nonato

Correntes

Iara

Barra dos Domingos

Juá

Palmares

Serra do Cágado

Maciços gnaisse-migmatíticos (paleoproterozóicos e Arqueanos retrabalhados no brasiliano

Coberturas fanerozóicas pós-silurianas

Afloramentos de bacias cambro-ordovicianas

Bacias cambro-ordovicianas sob a Bacia do Parnaíba

Cinturões dobrados meso-neoproterozóicos (brasilianos)

Cráton São Francisco

Principais zonas de cisalhamento

Jaibaras

Sairi/Jaguari

Coccoci/Rio Jucá

Catolé/São Julião

São Raimundo Nonato

Correntes

Iara

Barra dos Domingos

Juá

Palmares

Serra do Cágado

Maciços gnaisse-migmatíticos (paleoproterozóicos e Arqueanos retrabalhados no brasiliano

11

Cambriano/Ordoviciano. Estes constituem uma rede de zona de cisalhamento NE e E-

W com transcorrências e empurrões associados com atuação polifásica (SÁ, 1984).

Os três principais estágios tectônicos distinguidos na Bacia Potiguar são: rift,

transicional e drift. Durante o primeiro estágio, a subsidência e a sedimentação foram

controladas por um mecanismo de extensão e afinamento crustal, enquanto nos dois

últimos os controles foram, basicamente, resfriamento da crosta e balanço isostático

(BERTANI et al.,1991).

O estágio rift (Neocomiano-Eoaptiano) é caracterizado por um regime tectônico

rúptil distensivo, com afinamento crustal e formação de grabens assimétricos

controlados por grandes falhas normais e de transferência. Ao longo destes grabens

se implantou uma sedimentação continental constituída de folhelhos lacustres,

arenitos flúvio-deltaicos e depósitos de planície aluvial e inundação. O preenchimento

da bacia durante esta fase é representado pela megasseqüência continental,

constituída pelos depósitos das Formações Pendência e Pescada (MATOS 1987,

1992). Esta fase é síncrona em várias bacias do nordeste brasileiro, caracterizada por

um regime tectônico com altas taxas de subsidência e extensão litosférica (CHANG et

al., 1992).

Ao final deste estágio, um soerguimento generalizado, mais pronunciado na

porção terrestre, acompanhado de basculamento de blocos com o desenvolvimento

mais efetivo dos altos internos, originaram uma discordância regional de caráter

erosional e angular (BERTANI et al.,1991).

A fase transicional (Neoaptiano-Eoalbiano) foi marcada por um regime

tectônico de relativa quietude, caracterizado por subsidência termal devido ao início do

processo de resfriamento da litosfera previamente distendida e aquecida na fase rift.

Durante esta fase foi depositada a Formação Alagamar, que consiste de folhelhos e

carbonatos lagunares restritos com influência marinha (Camadas Ponta do Tubarão),

intercalados com arenitos deltaicos que gradam para fácies mais grosseiras nas áreas

mais proximais. As condições tectônicas entre o estágio de ruptura e o de deriva

afetaram a seqüência sedimentar principalmente por falhas normais e transcorrestes

reativadas (BERTANI et al.,1991).

A fase drift (Albiano-atual) corresponde à fase de deriva continental,

caracterizada por uma sedimentação marinha franca. O regime tectônico controlador

desta fase é o de subsidência termal e compensação isostática e, conseqüentemente,

as modificações estruturais consistiram essencialmente de falhamentos normais, de

preferência ao longo de lineamentos mais antigos (BERTANI et al.,1991, CHANG et

al., 1992). O preenchimento sedimentar na bacia pode ser dividido em duas fases:

transgressiva e regressiva.

12

A fase transgressiva, que se estende do Albiano ao Eocampaniano, é

representada por sistemas fluviais, costeiros, plataformais, até marinho profundo. A

fase regressiva é representada por sistemas deposicionais costeiros, plataforma,

talude e bacia, instalados a partir do Neocampaniano.

A primeira seqüência deposicional é constituída por uma unidade transgressiva

composta de sedimentação fluvial a ambiente marinho profundo, passando por

sistemas carbonáticos de plataforma, implantados entre o Albiano e o Eocampaniano.

Estas seqüências englobam rochas das formações Açu, Ponta do Mel, Jandaíra e

Quebradas cujo máximo transgressivo corresponde aos folhelhos neocenomanianos

do Membro Porto do Mangue da Formação Quebradas (PESSOA NETO, 2003).

A seqüência regressiva consiste de leques costeiros e bancos carbonáticos

progradantes atuantes na bacia a partir do Neocampaniano e que se estendem até os

dias atuais. Além dos folhelhos marinhos rasos a profundos com turbiditos

intercalados. As formações depositadas durante esta fase são: Tibau, Guamaré e

Ubarana (BERTANI et al.,1991, PESSOA NETO, 2003).

As duas seqüências sedimentares foram recorrentemente cortadas por

canyons ativos desde o Albiano e que freqüentemente escavaram a coluna sedimentar

até os níveis da seção neocomiana (BERTANI et al.,1991).

2.3) Arcabouço Estrutural

O arranjo estrutural da Bacia Potiguar é decorrente dos falhamentos normais

ocorridos durante o Cretáceo Inferior, quando se desenvolveu o rift que precedeu a

abertura do Oceano Atlântico Sul (SZATMARI et al., 1987, FRANÇOLIN & SZATMARI,

1987, MATOS, 1987, CONCEIÇÃO et al., 1988 e MATOS, 1992).

Os principais lineamentos estruturais são as Falhas de Areia Branca,

Carnaubais e Ubarana (Figura 2.4). Associados a elas destacam-se o Alto de Touros,

no extremo leste da bacia, o de Quixabá a leste da Falha de Areia Branca e o de

Camponga-Aracati, além do Alto de Macau, no bloco alto da Falha de Ubarana. No

extremo oeste da bacia se encontra o Alto de Fortaleza, possivelmente de origem

vulcânica. Outros elementos estruturais importantes são o Graben de Umbuzeiro e o

bloco baixo da Falha de Ubarana, onde se encontram as maiores espessuras de

rochas sedimentares (SOUZA, 1982).

Segundo BERTANI et al. (1991), a arquitetura da bacia é composta de três

unidades básicas: grabens, altos internos e plataformas do embasamento, que

13

comportam seqüências sedimentares neocomianas a terciárias distintas para cada

compartimento morfo-estrutural conforme descritas abaixo:

GRABENS:

Na porção emersa, os Grabens do Apodi, Umbuzeiro, Guamaré e Boa Vista

constituem feições lineares com eixos orientados na direção NE-SW, levemente

oblíquos em relação aos principais lineamentos do embasamento sul da bacia que se

orientam para NNE-SSW (BERTANI et al.,1991). Os grabens apresentam forma

assimétrica, limitados a sudeste e sudoeste por falhas que ultrapassam 5.000m de

rejeito, e nas direções opostas por linhas de flexura ou charneira com falhas normais

de pequenos rejeitos (MATOS, 1987 e MATOS et al., 1987).

Na porção submersa, a bacia é formada por grabens profundos cujos limites

sul são marcados por falhas NW-SE, aproximadamente paralelas à atual linha de

costa. As principais feições estruturais do segmento leste-oeste coincidem com a

continuação do Sistema de Fraturas de Fernando de Noronha, enquanto o graben

orientado na direção noroeste está confinado entre o sistema de fraturas citado e a

Zona de fratura de Romanche (BERTANI et al.,1991).

Os grabens estão preenchidos por seqüências sedimentares do Cretáceo

inferior.

ALTOS INTERNOS:

Os alto internos consistem de cristas alongadas do embasamento separando

os principais grabens e são compostos por blocos de gnaisses, migmatitos ou xistos

soerguidos por falhas normais (BERTANI et al.,1991).

Em virtude da formação dos grabens através de grandes falhas lístrica, com

rotação de blocos até que as tensões concentradas na placa flexurada fossem

aliviadas por meio de falhas antitéticas obteve-se como conseqüência, o

desenvolvimento dos altos internos. Este mecanismo explica a forma destes altos,

limitados por escarpas abruptas de um lado e mergulhando como uma rampa com

falhas sintéticas secundárias no lado oposto (BERTANI et al.,1991).

Os principais altos internos são os Altos de Quixabá, Serra do Carmo e Macau,

subparalelos aos eixos dos grabens adjacentes.

14

Figura 2.4: Mapa estrutural com as principais unidades do arcabouço estrutural da Bacia Potiguar (Modificado de FRANÇOLIN & SZATMARI, 1987).

15

Intrusões graníticas pré-cambrianas podem também constituir altos internos

formados por erosão diferencial. Entretanto, estes teriam morfologia mais simétrica e,

até o presente, altos desta natureza não foram claramente identificados (BERTANI et

al.,1991).

Normalmente, as seqüências do Cretáceo inferior estão ausentes sobre os

altos internos devido à erosão ou não deposição.

PLATAFORMA DO EMBASAMENTO:

A leste e a oeste, os grabens centrais são flanqueados a leste por plataformas

rasas do embasamento, denominadas, respectivamente Touros (ou Leste) e Aracati

(ou Baraúnas). Nestas plataformas, o embasamento é pouco afetado por falhas, as

quais apresentam rejeitos de dezenas a, no máximo, poucas centenas de metros. O

embasamento mergulha gradualmente, desde os afloramentos a sul, até cerca de

1.500m de profundidade junto às bordas dos grabens da parte submersa (BERTANI et

al.,1991).

As plataformas do embasamento são normalmente recobertas por sedimentos

do Aptiano e Cretáceo superior na parte terrestre, e também por seqüências terciárias

na parte marítima.

Superimpostas a estas feições tectônicas são observadas falhas de direção

aproximada E-W, cortando e deslocando os lineamentos e altos internos orientados na

direção SW-NE (Figura 2.5). Estas falhas E-W apresentam rejeitos significativos, e

freqüentemente exibem feições típicas de transcorrência como estrutura em flor

negativa.

Figura 2.5: Seção geológica da Bacia Potiguar (terra) da área indicada no mapa da Fig. 2.4

(modificado de MATOS, 1987).

16

2.4) Estratigrafia da Bacia Potiguar

A Bacia Potiguar está preenchida por sedimentos depositados desde o

Cretáceo Inferior (Neocomiano) até o recente. A bacia apresenta três discordâncias

regionais em sua coluna estratigráfica: no topo da Formação Pendência, no topo da

Formação Alagamar e no topo da Formação Jandaíra (Figura 2.6).

A litoestratigrafia aqui apresentada foi compilada baseando-se nos trabalhos de

SAMPAIO & SCHALLER (1968), CYPRIANO & NUNES (1968), MAYER (1974),

ARAÚJO et al. (1978), SOUZA (1982), MATOS et al. (1987), MOREIRA (1987),

OJEDA & SANTOS (1982) e ARARIPE & FEIJÓ (1994).

EMBASAMENTO:

O complexo cristalino que forma o embasamento da Bacia Potiguar apresenta-

se predominantemente constituído por uma seqüência de migmatitos e gnaisses

intensamente dobrados, com eixos anticlinais e sinclinais seguindo um alinhamento

geral de direção NNE-SSW. Ocorrências locais de quartzitos e micaxistos também são

conhecidas, além de pequenos maciços graníticos intrusivos. Veios de pegmatitos

(mais abundantes) e anfibolitos (menos abundantes) são freqüentes através da região.

Rochas intrusivas básicas cortam as rochas Pré-Cambrianas sob a forma de

diques distribuídos segundo três alinhamentos gerais de direção E-W, e, ainda, sob a

forma de plugs e necks ocorrentes em distribuição irregular no embasamento.

Seqüência Rift: FORMAÇÃO PENDÊNCIA:

Espessa seção clástica sotoposta em discordância aos clásticos e carbonatos

da Formação Alagamar, e sobreposta também discordantemente ao embasamento

cristalino. Esta unidade ocorre preferencialmente preenchendo os baixos estruturais

de grande porte síncronos a sua deposição, e mostra decréscimo de granulometria

das falhas principais para os depocentros.

Litologia: é caracterizada por intercalações de folhelho cinza esverdeado médio

a escuro, siltito cinza médio a claro e cinza esbranquiçado muito fino a médio,

calcífero.

Ambiente deposicional: leques aluviais associados a falhamentos e sistemas

flúvio-deltaicos progradando sobre pelitos lacustres, com ocorrência de turbiditos.

17

Idade: as datações com base nos palinomorfos e ostracodes não marinhos

indicam idades Neo-Rio da Serra a Jiquiá.

Figura 2.6: Carta estratigráfica da Bacia Potiguar (modificado de ARARIPE & FEIJÓ 1994).

18

FORMAÇÃO PESCADA:

Cunha clástica sintectônica constatada apenas no bloco baixo da Falha de

Pescada, a cuja atividade está geneticamente ligada, adjacente à região onde está

presente o campo produtor de Pescada. Os contatos inferior, com a Formação

Pendência, e superior com a Formação Alagamar são discordantes.

Litologia: esta unidade é caracterizada por arenito médio branco e arenito fino

cinzento, com intercalações de folhelho e siltito cinzento.

Ambiente deposicional: o principal sistema deposicional responsável pela

deposição destes sedimentos é o de leques aluviais coalescentes, mas há também

sistemas flúvio-deltaicos com pelitos lacustres intercalados por depósitos turbidíticos,

em pacotes mais uniformes e espessos que na Formação Pendência.

Idade: datações com palinomorfos e ostracodes não marinhos indicam idade

Eoalagoas para estes sedimentos.

Seqüência Transicional:

FORMAÇÃO ALAGAMAR:

Seção areno-carbonática sotoposta em discordância à Formação Açu. Seu

contato inferior também é discordante sobre as Formações Pescada ou Pendência, ou

sobre o embasamento. Esta unidade é constituída por dois membros separados por

uma seção pelítica denominada de Camadas Ponta do Tubarão.

Litologia: o Membro Upanema, basal, é predominantemente arenoso com

intercalações de calcário e folhelho. As Camadas Ponta do Tubarão são formadas por

calcarenito e calcilutito ostracoidais e folhelho escuro euxínico, e o Membro Galinhos é

predominantemente pelítico, com folhelho cinza-escuro e calcilutito creme-claro.

Ambiente deposicional: os sistemas deposicionais interpretados são flúvio-

deltáico para o Membro Upanema, lagunar para as Camadas Ponta do Tubarão,

marcando o final da deposição lacustrina e nerítico para o Membro Galinhos,

representando um sistema transicional deltaico já com influência marinha.

Idade: Alagoas a Albiano, segundo estudos palinológicos, havendo

possibilidades da porção basal do Membro Upanema ser de idade Jiquiá (ostracodes

não marinhos).

Seqüência Marinha Transgressiva:

FORMAÇÃO AÇU:

19

Formação composta de arenitos que recobrem o embasamento na faixa

aflorante. Seu contato inferior é discordante com a Formação Alagamar, e

lateralmente, interdigita-se com as Formações Ponta do Mel e Quebradas, e está

sotoposta concordantemente à Formação Jandaíra. As rochas da Formação Açu

foram subdivididas em Açu 1, 2, 3 e 4 através de perfis elétricos (VASCONCELOS et

al., 1990).

Litologia: camadas relativamente espessas de arenito médio a muito grosso

esbranquiçado, intercalado com folhelho e argilito verde claro e siltito castanho-

avermelhado.

Ambiente deposicional: nesta formação, são reconhecidos na seção inferior

fácies de leque aluvial e fluvial (anastomosado e meandrante), e na seção superior

fácies deltaico-estuarino, baía e praia.

Idade: de acordo com datações a partir de palinomorfos, os sedimentos da

Formação Açu abrangem idades do Albiano ao Cenomaniano.

FORMAÇÃO PONTA DO MEL:

Esta formação foi depositada como uma plataforma carbonática, não é

aflorante e está restrita praticamente à porção offshore da bacia (TIBANA & TERRA,

1981). A Formação Ponta do Mel interdigita-se lateralmente e recobre

concordantemente a Formação Açu, e está recoberta em discordância pela Formação

Quebradas.

Litologia: contém calcarenito oolítico creme, doloespatito castanho-claro e

calcilutito branco, com camadas de folhelho verde-claro.

Ambiente deposicional: estas rochas foram depositadas predominantemente

em plataforma rasa, associada à planície de maré e mar aberto. Durante a deposição

desta unidade, as áreas mais profundas da bacia eram famintas, o que explicaria a

ausência quase completa de pelitos.

Idade: Neoalbiana obtida a partir de datações com foraminíferos planctônicos,

nanofósseis calcários e palinomorfos.

FORMAÇÃO QUEBRADAS:

Esta formação ocupa uma posição intermediária entre os arenitos do Açu e os

pelitos albocenomanianos da Formação Ubarana, com os quais se interdigita

lateralmente. O contato inferior é discordante com a Formação Ponta do Mel, e o

contato superior é concordante com a Formação Jandaíra. A formação é dividida em

dois membros: Redonda e Porto do Mangue.

20

Litologia: arenito fino cinza-claro, folhelho e siltito cinza-esverdeado. O Membro

Redonda é formado por intercalações de arenito, folhelho e siltito, enquanto que o

Membro Porto do Mangue é representado sobretudo por folhelhos, e arenito

subordinado.

Ambiente deposicional: inclui plataforma e talude, com presença de turbiditos.

Idade: datações bioestratigráficas disponíveis apontam para idade

cenomaniana.

FORMAÇÃO JANDAÍRA:

Seção carbonática de alta energia sobreposta aos arenitos da Formação Açu.

O contato inferior da Formação Jandaíra é concordante com a Formação Açu ou com

a Formação Quebradas. Lateralmente, interdigita-se com a parte inferior da Formação

Ubarana. O contato superior é discordante sob o Grupo Agulha (Formações Ubarana,

Guamaré e Tibau).

Litologia: esta unidade é tipicamente composta por calcarenito bioclástico a

foraminíferos bentônicos, por vezes associados a algas verdes. Também ocorre

calcilutito com marcas de raízes, dismicrito e gretas de contração.

Ambiente deposicional: o modelo deposicional desta unidade apresenta fácies

de planície de maré, laguna rasa, plataforma rasa e mar aberto, em uma bacia

faminta.

Idade: a partir do seu conteúdo fossilífero a formação foi datada como

turoniana a mesocampaniana.

Seqüência Marinha Regressiva:

FORMAÇÃO UBARANA:

Seção pelítica de talude perfurada em quase todos os poços da plataforma

continental das bacias Potiguar e Ceará. Estas rochas estão lateralmente

interdigitadas, em direção ao continente, com as do Grupo Apodi (Formação Açu e

Jandaíra) e as da Formação Guamaré.

Litologia: caracteriza-se por uma espessa seção de folhelho e argilito cinzento,

intercalada por camadas relativamente delgadas de arenito grosso a fino

esbranquiçado, siltito cinza-acastanhado e calcarenito fino creme-claro.

Ambiente deposicional: estes sedimentos foram depositados em ambiente de

talude e bacia.

Idade: os pelitos desta formação foram datados como desde o Albiano ao

Holoceno.

21

FORMAÇÃO GUAMARÉ:

Seqüência carbonática interposta lateralmente aos pelitos da Formação

Ubarana e aos arenitos da Formação Tibau. Esta unidade se apresenta mais espessa

nas áreas próximas à borda da plataforma continental atual e adelgaça-se em direção

à costa. Os seus contatos com as unidades sobre e subjacentes são gradacionais ou

discordantes.

Litologia: calcarenito creme acastanhado, bioclástico, em parte recristalizado e

dolomitizado, com intercalações de calcilutito, folhelho e arenito.

Ambiente deposicional: representa fácies de plataforma carbonática e talude

carbonático na fase marinha regressiva da bacia.

Idade: a partir do seu conteúdo fossilífero a idade determinada varia do

Neocampaniano ao Holoceno.

FORMAÇÃO TIBAU:

Clásticos grossos justapostos aos carbonatos Guamaré. Esta formação possui

contato inferior discordante com a Formação Jandaíra e, na parte submersa, tem

contato lateral transicional com a Formação Guamaré. O contato superior com a

Formação Barreiras é de difícil definição, assim como o superior com os sedimentos

recentes na área sul.

Litologia: arenito grosso a conglomerático hialino e mal selecionado, com

intercalções de calcarenito e argila amarelada.

Ambiente deposicional: dominantemente ambiente de leques costeiros.

Idade: Neocampaniano ao Holoceno.

Além das rochas sedimentares, três episódios vulcânicos, individualizados em

formações, estão presentes na Bacia Potiguar.

FORMAÇÃO RIO CEARÁ-MIRIM:

Esta formação está presente na borda da bacia na forma de diques de diabásio

toleítico orientados na direção E-W. As datações radiométricas obtidas em amostras

de superfície e subsuperfície apontam para idades entre 120 e 140 M.a., o que

equivale às idades Valanginiano a Aptiano. A idade destas manifestações vulcânicas

equivale à da Formação Cabiúnas das bacias de Campos e Espírito Santo.

FORMAÇÃO SERRA DO CUÓ:

22

Estes diques de diabásio de tendência alcalina, com idades radiométricas da

ordem de 83 ± 6 M.a., ou Santoniano-Campaniano, ocorrem na serra do mesmo

nome, no sul da bacia (LIMA NETO, 1985).

FORMAÇÃO MACAU:

Derrames de olivina-basalto afanítico eocênicos e oligocênicos intercalados

com as rochas sedimentares das formações Tibau, Guamaré e Ubarana. As datações

radiométricas pelo método de K-Ar disponíveis apontam para idades entre 29 e 45

M.a.. Esta unidade é correlacionada com a Formação Abrolhos, da Bacia do Espírito

Santo (MIZUSAKI, 1987).

As ocorrências magmáticas da Fm. Macau se deram ao longo de um trend N-S,

iniciando entre as localidades de Pedro Avelino e Lages (RN) prosseguindo em

direção às localidades de Pendências e Macau (RN), na porção emersa da bacia, e

adentrando no mar em direção à reentrância de Ubarana, onde pode atingir 1500 m de

espessura.

23

CAPÍTULO

3

3. SISTEMAS PETROLÍFEROS E GEOQUÍMICA DAS ROCHAS GERADORAS

E ÓLEOS Este capítulo abordará o conceito de “Sistemas Petrolíferos”, seus elementos e processos na Bacia Potiguar, além de revisar brevemente a caracterização e classificação das rochas geradoras e óleos.

3.1) Sistemas Petrolíferos

3.1.1) Introdução O termo “oil system” foi apresentado por DOW (1974) e baseou-se no conceito

de correlação óleo-rocha. O termo “Petroleum System” foi utilizado primeiramente por

PERRODON (1980). Independentemente, DEMAISON (1984) concebeu o termo

“Generative Basin” e MEISSNER et al. (1984) descreveram o “Hydrocarbon Machine”.

Todos estes conceitos são similares ao proposto por DOW (1974). Após anos de

pesquisas e detalhamento dos trabalhos anteriores, estes autores, entre outros, como

Leslie Magoon, formalizaram um critério para identificação, mapeamento, e

denominação do “Sistema Petrolífero” de uma bacia.

Em 1994, MAGOON e DOW definiram o “Sistema Petrolífero” como um

sistema natural que compreende um pod de rocha geradora ativa, que inclui todos os

elementos geológicos e processos que são necessários para que uma acumulação de

petróleo exista. O conceito de sistema petrolífero implica que os caminhos de

migração devem existir, atualmente ou no passado, ligando a rocha geradora com as

acumulações. Através do uso dos princípios da geologia do petróleo e da geoquímica,

este sistema pode ser mapeado e melhor entendido com o passar do tempo

(MAGOON & DOW, 2000).

Para MAGOON e DOW (1994), o termo “Sistema” descreve a interdependência

entre os elementos e os processos que constituem a unidade funcional e compõem as

24

acumulações de petróleo. Os elementos essenciais incluem a rocha geradora, a rocha

reservatório, a rocha selo e a sobrecarga (soterramento). Os processos são a

formação da trapa e o trinômio geração-migração-acumulação de petróleo. Estes

elementos essenciais e processos devem ocorrer em um tempo e espaço suficientes

para que a matéria orgânica contida na rocha geradora possa ser convertida em

petróleo e acumulada em um reservatório. Por conseguinte, é denominado de

momento crítico o ponto, no tempo, que o pesquisador entende como melhor

representante do trinômio geração-migração-acumulação da maior parte do petróleo

encontrado.

3.1.2) Rochas Geradoras

A Bacia Potiguar apresenta duas seqüências de rochas geradoras, os folhelhos

lacustres neocomianos da Formação Pendência e os folhelhos e margas aptianos da

Formação Alagamar, depositados em ambiente lacustre a marinho restrito

(RODRIGUES et al., 1983).

Os folhelhos pretos e cinza escuros da Formação Pendência estão intercalados

com finas camadas de arenitos. Valores de carbono orgânico total (COT) alcançam até

7%, com intervalos de centenas de metros apresentando valores médios entre 2% e

3%. Dados de pirólise Rock-Eval indicam um potencial gerador (S2) bom a muito bom,

em média de 25 Kg HC/ton rocha nos intervalos mais ricos. O querogênio é

essencialmente tipo I/II, como observado através do índice de hidrogênio (IH) que

apresenta valores de 600 a 900 mg HC/g COT. Nestes folhelhos COT, IH e S2

reduzem sistematicamente com o aumento do índice de produção e a Tmax, refletindo

altos níveis de evolução térmica e conseqüente geração e expulsão de

hidrocarbonetos (TRINDADE et al., 1992).

Os folhelhos e margas da Formação Alagamar foram depositados sob

condições lacustres, hipersalinas restritas e deltaicas. O teor de carbono orgânico total

pode alcançar valores de até 8%, com uma média de 5%. Dados de pirólise Rock-Eval

mostram um potencial gerador (S2) bom a muito bom, em média de 45 Kg HC/ton

rocha nos intervalos mais ricos. O querogênio é tipo II/I, como observado nos valores

de IH que variam de 500 a 800 mg HC/g TOC (TRINDADE et al., 1992).

No item 3.2.1, deste capítulo estes valores serão mais detalhados e

confrontados com os obtidos por outros autores.

25

3.1.3) Rochas Reservatórios

Os principais reservatórios da Bacia Potiguar são os arenitos das formações

Pendência, Alagamar e Açu. Dados obtidos por perfis elétricos nos poços perfurados

nesta bacia indicam que os arenitos da Formação Açu possuem características permo-

porosas mais favoráveis para reservatórios de petróleo (ARARIPE & FEIJÓ, 1994).

Os arenitos da Formação Pendência foram depositados em ambiente

continental sob a forma de leques aluviais e sistemas flúvio-deltaicos progradando

sobre pelitos lacustres, e por vezes turbiditos. As melhores características de

reservatório observadas estão associadas aos depósitos flúvio-deltaicos que possuem

porosidade média de 24% e permeabilidade variando entre 100 e 4000 mD (MATOS et

al., 1987).

Os arenitos reservatório da Formação Alagamar foram depositados em

ambiente continental a transicional e representam depósitos flúvio-deltaicos. Estes

arenitos, quando deltaicos, possuem granulometria fina a média e, intensamente

diagenizados, apresentam porosidades variando de 12 a 14%. Arenitos finos a médios

flúvio-deltaicos apresentam porosidades entre 14 e 16% (BERTANI et al.,1991).

Os arenitos da Formação Açu constituem o principal reservatório da bacia,

atingindo 85% do petróleo descoberto. Estes arenitos foram reconhecidos na seção

inferior como fácies de leque aluvial e fluvial, e na seção superior como fácies deltaico-

estuarino, de baía e praia. As características permo-porosas são excelentes, atingindo

até 33% de porosidade e permeabilidade de 5 a 10 D (BERTANI et al.,1991).

3.1.4) Rochas Selantes

As rochas selantes são os folhelhos das Formações Pendência, Alagamar e

Ubarana sobrepostos e/ou intercalados às acumulações além dos intervalos de baixa

permeabilidade na Formação Açu.

3.1.5) Modelos de Plays Exploratórios

A produção de petróleo na bacia é oriunda principalmente de reservatórios

siliciclásticos que foram depositados ao longo da sua evolução tectônica. Os

condicionantes tectônicos influenciaram decisivamente na estruturação, qualidade do

26

reservatório e rotas de migração, resultando em diferentes tipos de plays exploratórios

de acordo com a fase tectônica em questão.

Os modelos de trapas encontrados nesta bacia são estratigráficas, estruturais

ou mistas. A migração do óleo se dá por planos de falhas ou contato direto gerador-

reservatório.

Em relação à migração, estruturação e acumulação de petróleo nas diferentes

seqüências tectônicas da Bacia Potiguar, BERTANI et al. (1991) descreveram os

seguintes modelos:

SEQÜÊNCIA RIFT

As acumulações de petróleo na seqüência rift possuem trapas do tipo

estruturais ou combinadas estrutural-estratigráficas. Os principais prospectos

mapeados estão associados à falhas normais com rotação de blocos, falhas normais

antitéticas, falhas normais reativadas com rejeito lateral, falhas de transferência e

deslizamento gravitacionais. Em todos os casos, o óleo foi gerado nos folhelhos

estratigraficamente associados aos reservatórios.

Os prospectos associados a falhas normais ocorrem ao longo das principais

falhas de borda dos grabens, podendo ser exemplificados pelos Campos de Upanema

e Janduí (Figura 3.1 A-A’). Normalmente, o fechamento é essencialmente estrutural,

dado pela rotação dos blocos e pelo arrasto associado à falha.

O principal controle na estruturação dos campos tipo Lorena e Rio Mossoró são

as falhas normais antitéticas (Figura 3.1 B-B’). O fechamento mergulho acima é dado

pelas próprias falhas, pela justaposição dos reservatórios contra folhelhos do bloco

baixo ou pelo truncamento erosional dos mesmos, seguido de capeamento por

folhelhos da seqüência sedimentar subseqüente.

Falhas de transferência e normais com rejeito lateral foram responsáveis pela

formação de complexas estruturas em flor, que são portadoras de óleo nos Campos

de Pescada, Livramento e Cachoeirinha.

Os prospectos associados a deslizamentos gravitacionais são observados no

Campo de Serraria, onde o colapso sin- e pós-sedimentar de seqüências deltaicas

originou estruturas anticlinais (Figura 3.1 C-C’).

27

Figura 3.1: Modelos de acumulação na seqüência rift (modificado de BERTANI et al. 1991).

28

SEQÜÊNCIA TRANSICIONAL

Os principais tipos de prospecto da seqüência transicional consistem em

homoclinais truncados por canyons erosionais e estruturas dômicas associadas a

falhas transcorrentes.

Normalmente, o óleo acumulado foi gerado em folhelhos da mesma seqüência

estratigráfica. Entretanto, também é significativa a contribuição de hidrocarbonetos

gerados na seqüência rift mais antiga.

Os prospectos do tipo homoclinal truncado ocorrem ao longo das bordas dos

canyons que cortam a seção cretácea e são preenchidos por folhelhos como no caso

do Campo de Ubarana. Desta forma, os arenitos da Formação Alagamar têm

fechamento contra a seção argilosa, que funciona como um selante superposto às

paredes dos canyons (Figura 3.2 D-D’).

Os prospectos associados à falhas transcorrentes ocorrem ao longo das falhas

da fase rift reativadas a partir do Eoalbiano com componente de rejeito direcional,

gerando uma série de pequenas estruturas em flor negativa arranjadas en échelon.

Normalmente possuem forma dômica e o fechamento é puramente estrutural (Figura

3.2 E-E’).

29

Figura 3.2: Modelos de acumulação na seqüência transicional (modificado de BERTANI et al.

1991).

30

SEQÜÊNCIA DRIFT

As acumulações de petróleo mais importantes da seqüência drift estão

localizadas nos reservatórios da Formação Açu. Estas acumulações em reservatórios

de alta continuidade lateral são essencialmente estruturais, sendo o fechamento pelo

mergulho regional numa direção e por arrasto associado a plano de falhas reativadas

nas demais. Os principais exemplos de prospecto deste tipo são os campos do

alinhamento Estreito-Guamaré, Macau e Aratum (Figura 3.3 F-F’).

O segundo tipo de prospecto é exemplificado pelos Campos de Baixa do

Algodão, Mossoró, Alto da Pedra e Canto do Amaro, onde, além da componente

estrutural, as variações laterais de fácies condicionam a acumulação. Estes

prospectos ocorrem principalmente ao longo das linhas de flexura, onde as

reativações de falhas foram insuficientes para gerar fechamentos estruturais para uma

acumulação eficiente de petróleo (Figura 3.3 G-G’).

O prospecto tipo paleogeomórfico constitui o modelo de acumulação do Campo

de Fazenda Belém. Neste caso, os reservatórios são arenitos grosseiros depositados

por leques aluviais encaixados nos flancos de paleoaltos do embasamento (Figura 3.3

H-H’).

O Campo de Agulha é uma acumulação na unidade cretáceo-terciária

progradacional. O fechamento é essencialmente estratigráfico, e a migração a partir

dos geradores das seqüências mais antigas se dá por fraturas induzidas por diques de

diabásio que cortam a seção (Figura 3.4).

31

Figura 3.3: Modelos de acumulação na seqüência drift transgressiva (modificado de BERTANI et al., 1991).

32

Figura 3.4: Modelo de acumulação na seqüência drift regressiva (modificado de BERTANI et

al., 1991).

3.1.6) Os Sistemas Petrolíferos na Bacia Potiguar

A Bacia Potiguar possui dois sistemas petrolíferos conhecidos: Pendência (!) e

Alagamar-Açu (!). Estes estão representados na carta de eventos que integra os

elementos essenciais e os processos envolvidos no sistema, além do tempo de

preservação e o momento crítico para cada um deles (Figura 3.5).

Os hidrocarbonetos gerados pelos folhelhos lacustres da Formação Pendência

migraram verticalmente ou lateralmente através de planos de falhas ou pelos próprios

arenitos estratigraficamente associados, onde são capeados pelos folhelhos da

mesma formação ou da seqüência sedimentar subseqüente. As rochas do

Barremiano ainda da fase rift e as rochas do Aptiano até o recente pertencentes à fase

pós-rift constituem a coluna sedimentar responsável pelo soterramento. As trapas

foram formadas durante o Cretáceo ainda na deposição do gerador e prosseguiu até

depois de cessada a deposição lacustre geradora.

33

Os hidrocarbonetos gerados pelos folhelhos e margas da Formação Alagamar

foram gerados na porção da plataforma continental e migram em direção a terra,

seguindo alinhamentos estruturais (SANTOS NETO et al., 1990) ou camadas com

permo-porosidades favoráveis (SOUTO FILHO et al., 2000) até atingirem seus

reservatórios na Formação Açu. As rochas do Albiano até o recente pertencentes à

fase pós-rift constituem a coluna sedimentar responsável pelo soterramento. As trapas

foram formadas no final do Cretáceo posterior à deposição do gerador e prosseguiu

até o Paleógeno.

MELLO (1987), TRINDADE (1992) e PENTEADO et al. (2007) através de

modelagem da reconstrução do soterramento e história termal da bacia, observaram

que a geração para o topo da Formação Pendência iniciou-se no Coniaciano e atingiu

o pico de geração de óleo no Campaniano. Para o topo da Formação Alagamar, estes

autores obtiveram valores de início de geração no Campaniano e pico de geração de

óleo no Mioceno-Holoceno.

Figura 3.5: Carta de eventos para os sistemas petrolíferos Pendência (!) e Alagamar-Açu (!)

(modificado de ANP, 2002).

3.2) Propriedades Geoquímicas

As características geoquímicas dos extratos orgânicos obtidos a partir de

rochas geradoras e o petróleo gerado são em boa parte reflexo do seu ambiente

deposicional. A presença e/ou ausência, distribuição e concentração de determinados

Triássico Jurássico Cretáceo Paleógeno Neo.

Formação das trapas

Geração e Migração

Preservação

Momento Critico

RochasGeradoras

RochasReservatório

RochasSelante

Soterramento

Cenoz.Mesosóico Tempo Geológico

Elementos e

Processos

200 100 M.a.

Pendência Alagamar-Açu

Triássico Jurássico Cretáceo Paleógeno Neo.

Formação das trapas

Geração e Migração

Preservação

Momento Critico

RochasGeradoras

RochasReservatório

RochasSelante

Soterramento

Cenoz.Mesosóico Tempo Geológico

Elementos e

Processos

200 100 M.a.

Pendência Alagamar-Açu

34

biomarcadores permitem a correlação de amostras de óleo com suas possíveis rochas

geradoras através da correlação óleo-rocha.

A correlação óleo-rocha é baseada no conceito de que determinados

parâmetros composicionais de um óleo migrado não diferem significantemente do seu

betume precursor ainda na rocha geradora. Correlações óleo-rocha detalhadas

oferecem importantes informações da origem e possíveis rotas de migração e

possibilitam a descoberta de novas acumulações (PETERS & MOLDOWAN, 1993).

Ambientes lacustres e hipersalinos apresentam biomarcadores específicos e

diagnósticos que permitem sua diferenciação através do emprego de diferentes grupos

de parâmetros (MOLDOWAN et al.,1985). A caracterização geoquímica de betumes e

óleos da Bacia Potiguar foi proposta e aperfeiçoada por diversos pesquisadores ao

longo dos anos, dentre os quais cabe ressaltar os trabalhos de: RODRIGUES (1983);

MELLO et al. (1984); CERQUEIRA (1985); SANTOS & RODRIGUES (1986); MELLO

(1988); SANTOS NETO et al. (1990); TRINDADE (1992); TRINDADE et al. (1992);

MELLO et al. (1993); PENTEADO (1995) e SANTOS NETO & HAYES (1999).

3.2.1) Rochas Geradoras

Dois principais grupos de rochas geradoras, baseados em características

geológicas, geoquímicas e paleontológicas, foram reconhecidos na Bacia Potiguar: as

rochas geradoras da seqüência rift continental, representadas pela Formação

Pendência (Neocomiano), e as rochas geradoras da seqüência transicional,

representadas pela Formação Alagamar (Aptiano) (RODRIGUES et al., 1983;

SANTOS & RODRIGUES, 1986 e MELLO, 1988).

RODRIGUES et al. (1983) estudaram os folhelhos da Formação Pendência e

obtiveram valores de carbono orgânico total (COT) entre 1,3 e 7%, índice de

hidrogênio (IH) na ordem de 350 a 846 mg HC/g COT.

No estudo de avaliação geoquímica da Bacia Potiguar, MELLO et al. (1984)

analisaram os folhelhos geradores da Formação Pendência e obtiveram valores de

COT em torno de 2%, IH variando de 100 a 300 mg HC/g COT e potencial gerador

com valores médios a bons, sendo constituídos predominantemente por matéria

orgânica do tipo II.

A Formação Pendência, segundo MATOS et al. (1987), foi dividida analisando

atributos bio-, sismo-, crono- e litoestratigráficos, além de dados geoquímicos, em

cinco unidades.

35

A Unidade I representa os sedimentos Neocomianos mais antigos perfurados

na bacia e é constituída de sedimentos lacustres com contribuição flúvio-deltáica

provenientes do Graben de Guamaré. Esta unidade apresenta teor médio de carbono

orgânico total (COT) entre 1,1% e 4,5%, com enriquecimento na direção NE. A matéria

orgânica presente é derivada essencialmente de restos vegetais terrestres, sendo

classificada como dos tipos II e III, conforme indicado pelo índice de hidrogênio (IH) e

potencial gerador (S2), capacitada para gerar em grande parte hidrocarbonetos

gasosos.

A Unidade II é composta de folhelhos, siltitos e arenitos finos a muito finos de

idade Rio da Serra com indicação de deposição subaquosa. Aparentemente, toda a

bacia foi tomada por depósitos lacustres com contribuição de sedimentos proximais

em Apodi e Umbuzeiro Nordeste. Nesta unidade, é encontrada uma das principais

seções geradoras de petróleo da Formação Pendência, apresentando teores médios

de COT entre 1,2% e 5%, IH e S2 propícios à geração de hidrocarbonetos líquidos e

gasosos. A matéria orgânica é de tipos I e II.

A Unidade III é caracterizada por folhelhos, siltitos e arenitos interlaminados na

base, e pacotes expressivos de arenitos intercalados a folhelhos em geral radioativos

e ricos em matéria orgânica no topo. A exemplo da unidade anterior, é uma

importantíssima seção geradora de hidrocarbonetos líquidos e gasosos, caracterizada

pela presença de matéria orgânica de tipos I e II e valores de COT entre 1,3% e 4,8%.

A Unidade IV apresenta pacotes de folhelhos e arenitos bem definidos

marcando a ampliação e implantação definitiva da deposição deltaico-lacustrina por

toda a bacia. Os pelitos desta unidade estão em condições de geração de

hidrocarbonetos apenas em parte da bacia, com COT geralmente superiores a 1% e

matéria orgânica de tipo II e secundariamente de tipo III.

A Unidade V completa o assoreamento da porção emersa com fácies fluvial a

flúvio-lacustre. Corpos bem desenvolvidos de arenitos porosos e espessos ocorrem

com intercalações menores de folhelho. Esta unidade se encontra imatura, porém

apresenta teores médios de COT de até 8,5% com matéria orgânica dos tipos I, II e III.

CERQUEIRA (1985) e MELLO et al. (1988) discutem características

geoquímicas dos folhelhos cinza escuros e negros da Formação Pendência e

apresentam como característica para esta seção geradora: COT acima de 4%, com

bom S2, alcançando 35 Kg HC/ton rocha. Por toda a bacia, o IH está entre 100 e 700

mg HC/g COT combinado com índice de oxigênio (IO) dominantemente inferior a 100

mg CO2/g COT, indicando predominância de querogênio dos tipos I e II.

MELLO et al. (1993) reconheceram um ambiente hipersalino na Formação

Pendência e os folhelhos carbonáticos geradores estudados apresentaram COT

36

superior a 6%, com moderada concentração de enxofre (> 0,6%), IH superior a 700

mg HC/g COT e S2 superior a 50 Kg HC/ton rocha. Dados de petrografia orgânica

sugerem matéria orgânica do tipo I (Figura 3.6).

Figura 3.6: Perfil geoquímico do poço 1-UPN-1-RN mostrando os valores de COT, S2, IH, IO,

Ro, Tmax e S1 dos depósitos hipersalinos na Formação Pendência, segundo (MELLO et al., 1993).

Os dados composicionais e de biomarcadores dos extratos da Formação

Pendência (fácies hipersalino) apresentam dominância de C27 esteranos sobre C28 e

C29 esteranos, presença de 28, 30-bisnorhopano e ausência de C30 esteranos (24-n-

propilcolestano), ausência de dinosteranos (4, 23, 24-trimetil colestano), escassez de

diasteranos, alta abundância de fitano, gamacerano e isoprenóides acíclicos (i-C25 e i-

37

C30) e, δ13C em torno de –30‰. Tais dados sugerem a presença de um clima árido a

semi-árido durante a deposição destes sedimentos (MELLO et al., 1993).

Em 1983, RODRIGUES et al. analisaram os folhelhos e margas da Formação

Alagamar e obtiveram valores de COT entre 1,2 e 7,8% (com valores médios entre 2 e

3%), IH entre 300 e 900 mg HC/g COT. Os intervalos geradores mais atrativos estão

associados às Camadas Ponta do Tubarão, nestes níveis os teores de COT são

superiores a 3% e o IH apresenta valores entre 500 e 900 mg HC/g COT,

predominando matéria orgânica dos tipos I e II.

No estudo de avaliação geoquímica da Bacia Potiguar MELLO et al. (1984)

analisaram além dos folhelhos geradores da Formação Pendência, avaliaram os

folhelhos e margas da Formação Alagamar e obtiveram valores de COT na ordem de

2% a 4%, IH variando de 400 a 600 mg HC/g COT e potencial gerador com valores

bons a muito bons, sendo constituídos predominantemente por matéria orgânica do

tipo II.

A Formação Alagamar para CERQUEIRA (1985) e MELLO et al. (1988) se

constitui dos folhelhos e margas depositados a partir do Aptiano em ambiente

transicional hipersalino. Estas rochas apresentam excelentes características para

rochas geradoras de petróleo, para as quais estes autores citaram COT superior a 6%,

querogênio dos tipos I e II, valores de S2 superiores a 40 Kg HC/ton rocha, IH superior

a 500 mg HC/g COT e IO inferior a 50 mg CO2/g COT.

A Formação Alagamar estudada por PENTEADO (1995) apresentou para as

Camadas Ponta do Tubarão valores de COT variáveis, atingindo um máximo de

24,50% e mesmo nos intervalos mais pobres correspondentes a níveis calcários, o

autor destaca que teores de COT são superiores a 2%. Os valores de S2 são acima de

4 Kg HC/ton rocha, chegando a 188 Kg HC/ton rocha para a amostra de maior valor de

COT.

PENTEADO (1995) descreveu além das características das rochas da

Formação Alagamar, as características dos extratos obtidos a partir destas rochas. Os

extratos mostram cromatograma gasoso com predominância de pristano e fitano sobre

as n-parafinas, razão pristano/fitano<1, relativa abundância de n-parafinas no intervalo

de n-C16 a n-C20 e presença de compostos tais como i-C25, i-C30 e β-carotano. Dados

de cromatografia gasosa acoplada a espectrometria de massas (CG-EM) em

compostos saturados apresentam razão hopanos/esteranos<2, baixos valores para a

razão tricíclicos/pentacíclicos, alta abundância de C24 tetracíclicos quando comparados

com tricíclicos, alta razão bisnorhopano/C30 hopano, Ts/Tm e C29Ts/norhopano<1,

metilesteranos/esteranos entre 0,3 e 1, e baixa abundância relativa de diasteranos.

38

3.2.2) Óleos

RODRIGUES (1983) elaborou um estudo de caracterização e correlação dos

óleos recuperados na Bacia Potiguar emersa a partir de técnicas de cromatografia

gasosa, análise de biomarcadores e de isótopos estáveis de carbono, concluindo pela

existência de três tipos, os quais seriam provenientes da seqüência continental

eocretácica, da seqüência transicional e aqueles representativos da mistura dos dois

tipos anteriores.

Dentre as características moleculares observadas por RODRIGUES (1983), os

óleos da seqüência continental possuem distribuição simétrica das parafinas normais;

relação pristano/fitano superior a dois (2,0); valores de δ13C mais negativos que - 28‰;

ausência ou baixa proporção de gamacerano. Na porção terrestre da bacia Potiguar,

os óleos foram gerados e acumulados na seqüência continental (Formação

Pendência), além de exemplos de acumulações que tiveram óleos com sua origem

nessa seqüência, mas que migraram e se acumularam em formações sobrepostas.

Por outro lado, em relação aos óleos de origem marinha ou transicional,

possuem os óleos da seqüência continental uma proporção maior de parafinas, menor

viscosidade, teores de enxofre mais baixos e pontos de fluidez mais elevados. Essas e

outras diferenças entre os dois grupos de óleos estão sumarizadas na tabela 3.1.

Para os óleos gerados na seqüência transicional (Formação Alagamar),

RODRIGUES (1983) destacou: a distribuição assimétrica das parafinas normais, com

predominância de compostos ao redor de n-C17, relação pristano/fitano inferior a um

(1,0), valores de δ13C variando entre –25,7‰ e –26,7‰, presença marcante de

esteranos e proporção semelhante de gamacerano e hopano entre os terpanos. Na

parte emersa da bacia, a maior parte dos óleos gerados na seqüência transicional

migrou e se acumulou em diferentes níveis da Formação Açu sobreposta. A

proximidade da faixa de afloramentos no caso dos campos de Fazenda Belém,

Estreito, Alto do Rodrigues, Monte Alegre, São Luiz e Fazenda Pocinhos tornou

favorável a atuação de processos secundários de alteração desses óleos pela

infiltração da água meteórica. Apesar da biodegradação ter eliminado praticamente

todas as parafinas normais e isoparafinas, não foi observada qualquer desmetilação

dos terpanos.

Ainda na parte emersa da bacia, o autor identificou um grupo de óleos que

corresponderia a uma mistura dos dois anteriormente descritos. Estes possuem dados

cromatográficos (relação pristano/fitano), isotópicos e de terpanos e esteranos

intermediários, quando comparados com os de origem continental e transicional.

39

Tabela 3.1: Comparação proposta por RODRIGUES (1983) para os óleos de origem continental e transicional.

Em 1990, SANTOS NETO et al. discutiram as características dos óleos

recuperados na Bacia Potiguar, suas principais feições geoquímicas estão resumidas

a seguir.

Os óleos Pendência apresentam elevada porcentagem de hidrocarbonetos

saturados (>60%), baixo teor de enxofre (0,1%) e valores isotópicos de carbono <-

28‰. Cromatograficamente, estes óleos apresentam presença conspícua ou

predominância de alcanos normais de alto peso molecular (>n-C23), elevada razão

pristano/fitano (> 1) e predominância dos alcanos normais ímpares sobre os pares.

Dentre os terpanos, observa-se a ausência ou baixa razão bisnorhopano/hopano,

elevada razão entre os isômeros dos hopanos em C34/C35, razão Ts/Tm>1 e baixa

proporção relativa do gamacerano em relação ao hopano. Com relação aos esteranos,

foi observada a predominância dos compostos em C29, sobre aqueles de 27 e 28

átomos de carbono, sendo a abundância relativa dos diasteranos elevada.

Estes óleos apresentam baixo índice preferencial de carbono, baixas razões

pristano/n-C17 e fitano/n-C18. Os esteranos estão presentes em baixas abundâncias e,

as razões αββ/(ααα+αββ) e S/(S+R) dos compostos em C29 já atingiram seu equilíbrio.

A partir das características observadas estes autores consideram estes óleos como de

elevada evolução térmica (SANTOS NETO et al., 1990).

Continental Transicional

HC parafínicos (%)Teores elevados65-77%

Teores baixos 38-49%

HC aromáticos (%) 13-23% 16-39%

Res. + Asfaltenos (%)Teores baixos 8-18%

Teores elevados35-36%

Pristano/Fitano > 1 (1,62-2,83) < 1 (0,37-0,70)

Pristano/n -C17

Valores muitos baixos0,20-0,56

Valores variávis, mais altos0,61-1,23

Fitano/n -C18

Valores muitos baixos(<1)=0,10-0,30

Valores elevados(>1)=1,11-3,75

δ 13C‰Depleção em 13C-31,5 a -28,3

-26,3 a -26,7

ºAPI Óleos leves (39-40º) Óleos pesados(11-26º)

Enxofre total (%)Teores muito baixos(0,11-0,12%)

Teores regulares(0,54-1,69%)

40

Os óleos marinho evaporíticos da Formação Alagamar apresentam

hidrocarbonetos saturados em torno de 55%, teor de enxofre considerado elevado

para os óleos brasileiros (>0,5%) e valores de δ13C >-26,6‰. Suas características

cromatográficas também são muito particulares, com predominância dos alcanos

normais de baixo peso molecular (<n-C19), razão pristano/fitano <1, presença

conspícua dos iso-alcanos em C25 e em C30. Entre os terpanos, é típica a elevada

proporção relativa do gamacerano em relação ao hopano, a presença de

bisnorhopano, a baixa razão entre os isômeros dos homopanos em C34 e C35, e a

predominância do Tm (22,29,30-trisnorhopano) sobre o Ts (22,29,30-trisnorneopano).

Entre os esteranos, os compostos em C27 predominam sobre aqueles em C28 e C29 e

os esteranos de baixo peso molecular ocorrem em baixa proporção relativa.

Os óleos mistos são resultantes da mistura dos óleos marinho evaporítico com

óleos gerados a partir dos folhelhos lacustres de água doce, desta forma, apresentam

para SANTOS NETO et al., 1990 e SANTOS NETO et al., 2003 predominância de

características geoquímicas ora relacionadas a ambiente lacustre de água doce, ora a

ambiente marinho hipersalino. É comum óleos Alagamar e mistos apresentarem

biodegradação, em alguns incipiente notando apenas um decréscimo relativo dos

alcanos normais de baixo peso molecular. Já em outros a biodegradação agiu

severamente eliminando quase que todos os alcanos normais e desmetilando os

hopanos.

41

CAPÍTULO

4

4. PROCEDIMENTOS ANALÍTICOS Neste capítulo serão descritos e discutidos sucintamente os métodos das técnicas analíticas empregados para a caracterização geoquímica de petróleo utilizados na realização deste estudo. Os métodos analíticos seguem a rotina dos laboratórios do Centro de Excelência em Geoquímica (CEGEQ) e da Gerência de Avaliação de Petróleo, ambos do Centro de Pesquisas e Desenvolvimento da Petrobras.

4.1) Introdução

Um dos interesses da exploração petrolífera consiste em estabelecer

correlações entre acumulações de petróleo de diferentes campos em uma mesma

bacia sedimentar com intuito de avaliar a origem, o grau de evolução térmica, a

qualidade de óleo, as rotas de migração, entre outros, permitindo com a integração

destas informações entender melhor o contexto de sistema petrolífero e subsidiar o

destino da exploração. A utilização das técnicas geoquímicas permite correlacionar os óleos entre si e

com as rochas geradoras caracterizadas, correlações essas que podem levar a

conclusões a respeito dos tipos de petróleo presentes em uma província produtora, e

seus graus de evolução térmica (MELLO & MAGOON, 1996).

Para cumprir o objetivo deste trabalho, foram selecionadas a partir do banco de

dados do Centro de Excelência em Geoquímica da Petrobras (CEGEQ/Gerência de

Geoquímica), localizado no Centro de Pesquisas Leopoldo A. Miguez de Melo

(CENPES), duzentas amostras de óleo da Bacia Potiguar (porção emersa).

A preparação das amostras e os métodos analíticos empregados seguem a

rotina dos laboratórios do Centro de Excelência em Geoquímica da Petrobras, e a

determinação das propriedades físico-químicas dos óleos foi realizada pelos

laboratórios da Gerência de Avaliação de Petróleo também no CENPES.

42

A seguir são descritas sucintamente as diferentes técnicas analíticas utilizadas

no presente estudo. A Figura 4.1 mostra o fluxograma da rotina de uma amostra de

óleo nos laboratórios da Geoquímica no CENPES.

Figura 4.1: Fluxograma mostrando as técnicas analíticas realizadas nos laboratórios do Centro

de Excelência em Geoquímica e na Gerência de Avaliação de Petróleo.

4.2) Preparação das Amostras

As amostras de óleo, à medida que foram coletadas ao longo dos anos de

exploração na bacia, foram encaminhadas primeiramente ao Laboratório de

Preparação de Amostras (LPA), onde foi feito o registro, e em seguida encaminhadas

aos diferentes laboratórios.

4.3) Cromatografia Líquida (CL)

A cromatografia líquida é uma técnica que permite separar dos óleos e extratos

obtidos das rochas geradoras suas frações constituintes básicas: hidrocarbonetos

saturados (parafinas lineares, ramificadas e cíclicas), aromáticos e compostos polares

ou heteroatômicos (resinas e asfaltenos). O princípio desta técnica consiste em um

Amostra de ÓleoRegistro

Determinação deGrau API e Enxofre.

Análise de Isótoposde Carbono δ13C.

Cromatografia Líquida

Cromatografia GasosaÓleo Total (Whole oil).

Aromáticos Resinas e Asfaltenos(NSO)

Saturados

Cromatografia Gasosaacoplada à Espectrometriade Massas.

Amostra de ÓleoRegistro

Determinação deGrau API e Enxofre.

Análise de Isótoposde Carbono δ13C.

Cromatografia Líquida

Cromatografia GasosaÓleo Total (Whole oil).

Aromáticos Resinas e Asfaltenos(NSO)

Saturados

Cromatografia Gasosaacoplada à Espectrometriade Massas.

43

meio inorgânico mineral (fase estacionária), por onde percolam compostos orgânicos

diluídos em solventes de diferentes polaridades (fase móvel). De acordo com as

propriedades do solvente e da fase estacionária, compostos químicos pertencentes a

diferentes classes eluem seletivamente pela coluna cromatográfica. As amostras com

as frações separadas são encaminhadas para as análises de biomarcadores e, caso

desejado, para a cromatografia gasosa.

A determinação da quantidade e das porcentagens das três frações pode

auxiliar nas interpretações sobre a origem da matéria orgânica, ambiente deposicional,

estágio de evolução térmica, processos de migração, biodegradação, geração e

expulsão (Figura 4.2).

Figura 4.2: Diagrama ternário mostrando o comportamento na concentração dos compostos do petróleo de acordo com o aumento da degradação (modificado de TISSOT & WELTE, 1984).

A separação é realizada através do sistema Medium Pressure Liquid

Cromatography (MPLC), em um equipamento Knauer MPLC com coluna de vidro

preparada utilizando uma combinação de sílica termicamente ativada e n-hexano

como eluente para a separação das frações (Figura 4.3). O sistema comporta 15

amostras com processo de injeção automática das mesmas, possui uma bomba para

fornecimento da fase líquida, um detector UV (ultravioleta) e um IR (índice de refração)

para monitoramento da eluição das frações, um coletor automático para recuperação

das frações e um controlador.

As amostras são diluídas em aproximadamente 1mL de n-hexano e acrescidas

de 50μL de solução padrão de 4-colestano. Após a injeção automática, as amostras

% Aromáticos

% Saturados % NSO

80 20

60 40

40 60

20 80Aumento dadegradação

Óleos mais pesados

Óleos mais leves

% Aromáticos

% Saturados % NSO

80 20

60 40

40 60


Óleos mais pesados

Óleos mais leves

% Aromáticos

% Saturados % NSO

80 20

60 40

40 60


Óleos mais pesados

Óleos mais leves

44

sofrem um bombeio em direção às pré-colunas preenchidas com sílica (70% sílica fina

e 30% sílica mais grossa) e umedecidas previamente por n-hexano pelo aparelho.

Nesta etapa, os compostos polares ficam retidos nas pré-colunas seguindo apenas

para a coluna principal os hidrocarbonetos. Estes compostos polares são retirados

manualmente, offline, pressurizados com etanol, extraídos, concentrados e

armazenados em frascos separados para posterior cálculo composicional. Na coluna

principal, os compostos aromáticos e as parafinas são separados. As parafinas

passam com maior facilidade e menor tempo de retenção e são encaminhadas para os

frascos coletores. As duas frações são posteriormente concentradas no

rotoevaporador Turbovap 500. As parafinas que são carreadas pelo n-hexano são

registradas através de um pico no detector de IR e acondicionadas em um recipiente

próprio. Após a queda na intensidade do registro o que indica a saída completa das

parafinas, o fluxo de n-hexano pela coluna principal é invertido e o tubo para coleta é

trocado. Os hidrocarbonetos aromáticos são então arrastados para fora da coluna e

coletados, sendo acusados por ambos os detectores (IR e UV) e registrados sob a

forma de dois picos concomitantes.

Figura 4.3: Equipamento para cromatografia líquida Knauer MPLC.

4.4) Cromatografia em Fase Gasosa (CG)

A cromatografia em fase gasosa permite uma separação mais refinada dos

compostos orgânicos presentes em óleos ou extrato de rocha do que a cromatografia

líquida. Seus resultados são apresentados sob a forma de gráfico (cromatograma)

onde é observada a distribuição dos compostos orgânicos presentes. No eixo das

45

ordenadas é registrada a abundância relativa de cada composto, e no das abscissas é

representado o tempo de análise. Ambos os eixos estão em escala linear e com

valores crescentes.

No cromatograma as parafinas normais ou lineares são geralmente os picos

predominantes. As isoparafinas ou parafinas ramificadas ocorrem como numerosos

picos entre as parafinas normais, sendo o pristano e fitano as mais importantes do

ponto de vista geoquímico. As cicloparafinas também podem ocorrer como picos entre

as parafinas normais, tais como os esteranos e terpanos na região do C25. Algumas

amostras de óleo apresentam um deslocamento acentuado da linha base em função

da presença elevada de compostos não resolvidos pelo método cromatográfico. Esta

feição é conhecida como UCM (Unresolved Complex Mixture) ou “hump”

cromatográfico.

A análise de óleo total (Whole oil) é realizada em um cromatógrafo a gás

Hewlett-Packard, modelo HP 6890A (Figura 4.4), equipado com injetor split-splitless,

DIC (Detector de Ionização de Chama), coluna capilar de metilsilicone J&W DB5 de

30m de comprimento com 0,25mm de diâmetro interno e 0,25μm de fase estacionária.

A programação de temperatura abrange o intervalo de 40ºC a 320ºC, numa taxa de

aquecimento de 4ºC/min. O injetor é mantido a uma temperatura de 300ºC e o detector

a 340ºC. O tempo médio para a análise de cada amostra é de 130 minutos.

Figura 4.4: Cromatográfo a gás Hewlett-Packard, modelo HP 6890A.

Uma amostra de 1μL de óleo diluída em diclorometano é injetada no aparelho,

onde suas moléculas são vaporizadas e misturadas com um gás de arraste inerte

(hélio), num fluxo de 50 cm/s a 40ºC. Esta mistura gasosa percola um tubo com

espessura capilar constituído de sílica fundida e superfície interna revestida por uma

46

película de um líquido não volátil (fase estacionária). À medida que as moléculas

orgânicas se movem pelo tubo capilar são repetidamente retidas e liberadas pela fase

estacionária com diferentes eficiências. As moléculas com maior massa molecular são

retidas por mais tempo, por serem menos voláteis. Assim, a temperatura do tubo

capilar precisa ser gradualmente aumentada para permitir a retirada das moléculas

maiores. Na saída da coluna capilar, as moléculas são detectadas por um detector por

ionização em chama de hidrogênio. O sinal analógico gerado pelo cromatógrafo é

então processado pelo sistema Agilent Chemstation (Figura 4.5).

Figura 4.5: Modelo esquemático do funcionamento de um cromatógrafo a gás (modificado de

COLLINS et al., 1997).

A magnitude da corrente iônica resultante é representada num gráfico

denominado cromatograma, onde cada pico indica a proporção de moléculas com

determinado número de átomos de carbono (OURISSON et al., 1984).

O aspecto do cromatograma, ou seja, a distribuição das parafinas normais

fornece indicações sobre a origem da matéria orgânica. Óleos de origem continental

normalmente apresentam predominância nas parafinas mais pesadas (n-C15 a n-C25) e

os de origem marinha, nas de peso molecular mais baixo (n-C12 a n-C17). A

predominância de parafinas ímpares em relação às pares, a razão pristano/fitano e a

presença de isoprenóides como i-C25, i-C30 e β-carotano também são utilizados como

indicadores ambientais.

A evolução térmica também pode ser caracterizada pela distribuição das

parafinas. À medida que a evolução térmica se acentua, a distribuição das n-parafinas

é deslocada em direção aos homólogos de menor peso molecular. A quantidade de

parafinas pares e ímpares pode também ser empregada para avaliar evolução térmica,

47

de forma que amostras com predominância em parafinas ímpares são menos

evoluídas termicamente, e provavelmente, provenientes de sedimentos clásticos,

enquanto que amostras que possuem predominância em parafinas pares devem estar

mais evoluídas termicamente e provavelmente são provenientes de ambiente com

fácies carbonáticas (PETERS & MOLDOWAN, 1993).

A biodegradação também pode ser observada pelo cromatograma gasoso.

Neste caso, a biodegradação resulta na depleção das n-parafinas prioritariamente em

relação às outras classes de compostos como os isoprenóides e as parafinas cíclicas

(PETERS & MOLDOWAN, 1993).

4.5) Cromatografia em Fase Gasosa Acoplada à

Espectrometria de Massas (CG-EM)

A cromatografia em fase gasosa (CG) isoladamente não revela detalhes sobre

a estrutura ou massa de uma molécula, sendo então necessário recorrer ao seu

acoplamento com a espectrometria de massas (EM) para se obter a identificação de

compostos específicos de interesse (biomarcadores).

Biomarcadores são componentes traços no petróleo. Foram definidos por

PHILP (1985) como compostos orgânicos presentes na geosfera, cujas estruturas

podem ser indubitavelmente relacionadas aos constituintes de organismos atuais.

Qualquer alteração que possa ocorrer ao esqueleto carbônico do biomarcador, durante

a deposição e soterramento do material orgânico dentro do registro sedimentar, deve

ser mínima e limitada apenas às mudanças estereoquímicas. Assim, relações precisas

entre precursor/produto têm sido estabelecidas para muitas classes de biomarcadores.

Cada composto separado no cromatógrafo mostra uma distribuição específica

de fragmentos de massas, ou seja, um espectro de massa característico. Os espectros

de massa são utilizados para a identificação dos compostos orgânicos porque estes

possuem fragmentações típicas, rompendo-se em ligações químicas mais fracas.

Assim, pode-se monitorar seletivamente os compostos, obtendo-se os perfis de

distribuição para o íon de uma determinada razão massa/carga (m/z) característica de

uma certa classe. Na Geoquímica de Petróleo, as classes de biomarcadores mais

estudadas são: os esteranos, os hopanos, os esteróides monoaromáticos e os

esteróides triaromáticos, utilizando-se os fragmentogramas m/z 217, 191, 253 e 231,

respectivamente (Figura 4.6) (PETERS & MOLDOWAN, 1993).

Embora a técnica permita a identificação de compostos aromáticos, neste

estudo serão utilizados apenas os compostos identificados a partir da fração de

48

saturados obtida pelo método de cromatografia líquida conforme descrito

anteriormente.

Figura 4.6: Exemplo de cromatograma gasoso e respectivos fragmentogramas dos íons (m/z)

191 e 217 de uma amostra de óleo lacustre da Bacia Potiguar.

As análises de CG-EM são realizadas em um conjunto de aparelhos que

consiste de um cromatógrafo a gás modelo HP 6890 Series acoplado a um

espectrômetro de massas Micromass (Figura 4.7).

Figura 4.7: Espectrômetro de massas Micromass acoplado ao cromatógrafo a gás Hewlett-

Packard, modelo HP 6890 Series.

49

Cerca de 1μL de amostra (fração de hidrocarbonetos saturados) diluído em n-

hexano é injetado automaticamente no cromatógrafo, sendo os compostos arrastados

por um gás inerte (hélio) com um fluxo de 33 cm/s através de uma coluna capilar J&W

composta de sílica fundida com 60m de comprimento, 0,25mm de diâmetro interno,

contendo uma fina película (0,25μm) de fase estacionária. A rampa de temperatura

programada é de 55º a 320ºC, sendo de 55º a 150º com gradiente de 20ºC/mim e de

150º a 320º, com gradiente de 1,5ºC/min. Os compostos vão saindo do cromatógrafo

segundo seus tempos de retenção que são função da sua massa e sua interação com

a coluna capilar, ou seja, compostos mais leves saem primeiro e com o aumento da

temperatura os compostos mais pesados e polares começam a sair. Após saírem do

cromatógrafo, estes compostos atingem uma zona de interface

cromatógrafo/espectrômetro de massas que deve ser mantida a uma temperatura de

310ºC. No espectrômetro de massas, a amostra sofre um “bombardeio” de elétrons

com energia de 70eV, ocorrendo a fragmentação dos compostos e a formação dos

íons moleculares. Estes íons seguem para um analisador quadrupolo, onde são

separados os íons específicos ou conjunto de íons através de suas razões

massa/carga (m/z). As moléculas produzem uma variedade de íons fragmentados,

com diferentes massas. Esta mistura de íons passa através de um campo magnético

que separa os íons de diferentes razões massa/carga pré-selecionados passando em

seguida por um detector. O registro dos íons presentes, e suas concentrações

relativas correspondem, ao que se denomina fragmentograma, que é obtido pelo

sistema Agilent Chemistation através da comparação do tempo de retenção dos

compostos e um padrão conhecido (Figura 4.8).

Figura 4.8: Modelo esquemático de um cromatógrafo acoplado a um espectrômetro de massas

e suas respectivas funções (modificado de PETERS & MOLDOWAN, 1993).

Separação dos compostos Interface Fonte de Íons

Análise deMassas

Detecçãode Íons Processamento de Dados

Cromatógrafo a Gás Espectrômetro de Massas

Seringa

Coluna Cromatográfica

Fonte de Íons

Linha detransferência Analisador de massas

(quadrupolos magnéticos)

Multiplicador de elétrons

Gravadormagnético

Impressora

Terminal

Separação dos compostos Interface Fonte de Íons

Análise deMassas

Detecçãode Íons Processamento de Dados

Cromatógrafo a Gás Espectrômetro de Massas

Seringa

Coluna Cromatográfica

Fonte de Íons

Linha detransferência Analisador de massas

(quadrupolos magnéticos)

Multiplicador de elétrons

Gravadormagnético

Impressora

Terminal

50

4.6) Isótopos Estáveis de Carbono (δ13C)

A razão isotópica 13C/12C de hidrocarbonetos é utilizada para a caracterização e

interpretação do paleoambiente de deposição. Ela reflete a composição isotópica

original do CO2 utilizado na fotossíntese, e é dependente do tipo de organismo

fotossintetizador, da produtividade e preservação da matéria orgânica, assim como

dos processos sin- e pós-deposionais. O processo de fotossíntese concentra

preferencialmente 12C na matéria orgânica, pois é o isótopo mais leve, de modo que a

sua razão 13C/12C é menor do que do CO2 empregado em suas reações.

A razão isotópica de carbono é expressa na notação delta em partes por mil

(‰) utilizando como referência um padrão secundário ajustado ao padrão internacional

PDB (carbonatos da Formação Pee Dee Belemnites no Estado da Carolina do Sul).

Esta notação é expressa pela relação:

[ ( )( ) ] 313 10×−= Rp

RpRaCδ ( )1.4

Onde Ra e Rp se referem às relações 13C/12C da amostra e do padrão,

respectivamente. Portanto, os valores medidos representam o desvio em relação ao

padrão secundário calibrado ao padrão internacional PDB.

Para se obter a composição isotópica do carbono (óleo total) é realizada uma

combustão em uma atmosfera oxidante temporária. Esta reação promove a

combustão e a oxidação completa de todas as substâncias orgânicas e algumas

inorgânicas presentes na amostra que serão posteriormente separados em uma

coluna cromatográfica e finalmente, detectados por espectrômetro de massas. Pesa-se cerca de 200μg de amostra em uma cápsula de estanho. Esta cápsula

é levada a um amostrador automático onde é purificada em fluxo contínuo de gás

hélio. A amostra é transferida para um tubo vertical constituído de quartzo onde será

realizada a combustão. A uma temperatura de 900ºC o gás hélio é enriquecido

temporariamente com oxigênio puro para formar uma atmosfera oxidante, onde ocorre

a oxidação da amostra pela reação “flash combustion”. Nesta fase, são formados CO2,

H2O e compostos nitrogenados. Os compostos nitrogenados, por possuírem massa

próxima do CO2, devem ser retirados para não interferirem nos resultados. Então a

amostra passa por um forno de redução a 680ºC contendo Cu e Cu2O, onde os

compostos nitrogenados são retirados. A água formada na reação fica retida em um

trap de percolato de magnésio. O CO2 e o N2 são separados em uma coluna

51

cromatográfica e transferidos para uma interface. Nesta interface, o CO2 é diluído com

hélio e transferido para um espectrômetro de massas MAT 252 da Finnigan (Figura

4.9). No espectrômetro as moléculas de CO2 são bombardeadas por um feixe de

elétrons, formando CO2+. O íon CO2

+ pode apresentar massas 44, 45 ou 46,

dependendo da combinação dos isótopos (13C/12C e 16O/18O). Cada íon formado segue

a um coletor pré-determinado, através de campos magnéticos específicos. O resultado

é então ampliado e comparado com o gás padrão de referência, e então é obtido o

valor de δ.

Figura 4.9: Espectrômetro e massas MAT 252 da Finnigan utilizado na análise isotópica de

carbono em óleos.

4.7) Determinação do Grau API (Densidade)

A densidade dos óleos apresenta valores entre 0,73-1,0. Óleos parafínicos são

comumente leves, enquanto os asfálticos são pesados. A densidade é por convenção

expressa pela letra grega ρ (rho). O American Petroleum Institute (API) desenvolveu

uma escala padrão de medida da densidade do óleo segundo a seguinte equação

(4.2).

5,1315,141−=

ρAPI ( )2.4

onde ρ é a densidade do óleo a 60ºF comparada com a da água na mesma

temperatura expressa em g/cm3.

Segundo HUNT (1996), as designações “leve” e “pesado” são comumente

empregadas na indústria do petróleo. O termo “leve” é aplicado a óleos com API

52

maiores que 31,1ºAPI, “médio” entre 22,3 e 31,1ºAPI, e “pesado” entre 10 e 22,3ºAPI.

Óleos com densidades menores que 10ºAPI são tidos como extrapesados. Logo, este

parâmetro é um indicador direto da evolução térmica a que esteve submetida à rocha

geradora do petróleo e da biodegradação após a expulsão do petróleo da mesma. O grau API é determinado nos laboratórios da Gerência de Avaliação de

Petróleo em um densitômetro digital ANTON PARR, modelo DMA-602 (Figura 4.10),

onde é introduzida uma pequena quantidade de amostra (cerca de 1mL) em um tubo

oco em forma de “U”. O equipamento mede as modificações na oscilação do tubo

causadas pelas modificações de massa forçadas por uma oscilação harmônica. A

norma utilizada é a ISO 12185 e os resultados obtidos em Kg/m3, a uma temperatura

de referência de 15º ou 20ºC. A densidade medida a 15ºC (60ºF) é convertida em grau

API através da equação 4.2.

Figura 4.10: Densitômetro digital ANTON PARR, modelo DMA-602.

4.8) Teor de Enxofre (S)

O conteúdo de enxofre é considerado como um parâmetro bulk e é comumente

aplicado para subsidiar relações entre amostras de petróleo. Por exemplo, gráficos

binários de ºAPI ou isótopos estáveis de carbono (δ13C) versus % de enxofre podem

ser aplicados para agrupar famílias de óleos e ajudar na sua caracterização (PETERS

& MOLDOWAN, 1993).

O teor de enxofre em óleos e betumes varia de 0,1 a 14%, porém a maioria

está entre 0,1 a 3% sendo poucos os petróleos com valores superiores a 4%. A maior

parte dos componentes sulfurados encontrados no petróleo está ligada a átomos de

carbono e ocorrem em maior proporção nas frações com alto ponto de ebulição ou nas

residuais (que não são destiláveis). Óleos pesados são geralmente ricos em

compostos sulfurados. Esta tendência geral de aumento de enxofre com o decréscimo

53

do grau API resulta da combinação de fatores ligados a alteração do óleo, onde por

eliminação das frações mais leves e concentração das mais pesadas ocorre o

enriquecimento de enxofre (FREITAS & SANTOS, 1982).

Além dos processos de alteração secundária, que podem aumentar

relativamente a concentração de enxofre no óleo, a origem da matéria orgânica

também influencia. Considerando que a maioria dos compostos orgânicos sulfurados é

formada a partir do querogênio, logo querogênios com altos teores de enxofre

produzem óleos com altos valores de enxofre e vice-versa. Segundo FREITAS &

SANTOS (1982), a solubilidade do enxofre na água salgada (Eh elevado) é bastante

superior a solubilidade desse elemento em água doce (Eh baixo), e devido a este fato

a concentração de enxofre na matéria orgânica de ambiente marinho, de uma maneira

geral, apresenta maior concentração de enxofre do que a matéria orgânica de origem

continental, o que acarreta na geração de óleos com teores variáveis de enxofre em

função do ambiente deposicional de sua matéria orgânica. A determinação da porcentagem de enxofre é realizada pela combustão da

amostra a uma temperatura de 1371ºC em uma atmosfera de oxigênio. Desta forma, o

enxofre contido na amostra é oxidado a dióxido de enxofre (SO2), que é medido em

um detector de infravermelho. Um microprocessador acoplado ao equipamento calcula

a porcentagem de enxofre em massa, com relação ao peso da amostra. O sinal obtido

no detector é integrado a um fator de calibração pré-determinado.

54

CAPÍTULO

5

5. TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL

Serão apresentados neste capítulo alguns fundamentos teóricos relacionados aos modelos e às técnicas de inteligência artificial empregadas neste trabalho para classificação, bem como suas vantagens e desvantagens.

5.1) Introdução

A curiosidade, a busca e a descoberta de novos conhecimentos surgiram

desde que o homem veio ao mundo. Esta inquietação permanente provocada pelo

exercício contínuo do pensamento é reflexo daquilo que só os seres humanos têm de

forma plena: a inteligência (LEAL & MARTINS, 2003).

As áreas governamentais, corporativas e científicas têm promovido um

crescimento explosivo em seus bancos de dados, superando em muito a usual

capacidade de interpretar e examinar estes dados, gerando a necessidade de novas

ferramentas e técnicas para análise automática e inteligente de bancos de dados. Na

geoquímica orgânica não ocorre de forma diferente. O desenvolvimento de novas

metodologias analíticas e o aperfeiçoamento das mais antigas permitem a cada dia um

aumento no número de compostos orgânicos que podem ser identificados e

quantificados. Esta capacidade permite os especialistas atacar problemas cada vez

mais complexos, mas por outro lado, o número de amostras e de constituintes gerados

por amostra analisada tornam o conjunto de dados extenso e complexo.

Neste contexto, um dos grandes problemas dos especialistas em análise de

informação é a transformação de dados em informação. Então, como fazer isso de

uma forma automatizada e no menor tempo possível? Uma saída para esta questão

seria a combinação de técnicas de estatística clássica e técnicas de inteligência

artificial, o que resultaria em uma técnica muito comentada atualmente, a Mineração

de Dados (Data Mining).

55

As técnicas de mineração de dados são aplicadas em sistemas de descoberta

de conhecimento em bancos de dados com o objetivo de extrair informações

estratégicas escondidas em grandes bancos de dados, por meio da pesquisa dessas

informações e da determinação de padrões, classificações e associações entre elas.

5.2) Classificação de Dados

A mineração de dados pode ser aplicada de duas formas: como processo de

verificação e como processo de descoberta. No processo de verificação, o usuário

sugere uma hipótese acerca da relação entre os dados e tenta prová-la aplicando

técnicas como análises estatísticas e multidimensionais sobre um banco de dados

contendo informações passadas. No processo de descoberta não é feita nenhuma

suposição antecipada. Este processo usa técnicas tais como: descoberta de regras de

associação, árvores de decisão, algoritmos genéticos e redes neurais. Dentre as

diferentes aplicações da mineração de dados, destacam-se a classificação, estimativa,

associação, segmentação e sumarização (DIAS, 2002).

Os modelos de classificação de dados são preditivos, pois desempenham

inferências nos dados com o objetivo de predizer a que classe de objetos pertence

uma nova observação. O problema a ser tratado por este estudo é do tipo

classificação; abaixo estão citados alguns exemplos de aplicações práticas para os

modelos de classificação:

MARKETING DIRETO: determinar se um cliente responderá “sim” ou “não” à

determinada oferta de produto ou serviço, com base nos dados demográficos,

consumo e na utilização de serviços. A partir de uma amostra de clientes que

já responderam questionários de pesquisa de opinião, pode-se criar um modelo

para a antecipação da resposta dos demais clientes.

SEGUROS E PLANOS DE SAÚDE: predição de quais clientes ou grupos de

clientes comprariam novas apólices de seguro, ou planos de saúde,

identificação de clientes/pacientes de risco, verificação de quais procedimentos

médicos e/ou odontológicos são utilizados conjuntamente.

SETOR BANCÁRIO: detectar padrões de uso de cartão de crédito fraudulento,

identificar clientes “leais”, determinar gastos com cartão de crédito por grupos

de clientes.

CIÊNCIA: podem ajudar cientistas em suas pesquisas, como encontrar

padrões em estruturas moleculares, dados genéticos, dar suporte à decisão na

escolha de áreas propícias a minérios, entre outras.

56

Diversas técnicas foram desenvolvidas para a criação de modelos de

classificação, entre elas: Árvores de Decisão, K-Vizinhos Mais Próximos, Naive Bayes,

Support Vector Machine e Redes Neurais Artificiais (DIAS, 2002).

Estas técnicas criam automaticamente um modelo a partir de um conjunto

inicial de registros. Este conjunto que serve de exemplo é chamado de conjunto de

treinamento. Os registros do conjunto de treinamento devem pertencer a um pequeno

grupo de classes predefinidas. O modelo é composto de padrões, essencialmente

generalizações em relação aos registros, os quais são utilizados para diferenciar as

classes. Uma vez obtido o modelo, este é usado para classificar automaticamente os

demais registros.

O modo como as classes são criadas oferece vantagens em relação a métodos

estatísticos clássicos. Os padrões podem ser produzidos a partir de um conjunto

localizado de fenômenos, ao passo que métodos estatísticos devem agir sobre

populações inteiras e de distribuição bem conhecida. Desta forma, é possível prever

características de um pequeno percentual de conjunto de registros, o que não seria

alcançado estatisticamente dada a inexpressividade dos registros sendo avaliados.

5.3) Redes Neurais Artificiais (RNA’s)

As redes neurais artificiais (RNA’s) começaram a ser desenvolvidas na década

de 40. No entanto, passaram a ser empregadas em larga escala apenas a partir da

década de 80, com o desenvolvimento das redes tipo “Perceptron” de múltiplas

camadas (“Multi Layer Perceptron”, ou simplesmente MLP).

As redes neurais artificiais são definidas como sistemas paralelos e distribuídos

por unidades de processamento simples (nós ou neurônios), que calculam

determinadas funções matemáticas (normalmente não lineares). Tais unidades são

dispostas em uma ou mais camadas e interligadas por um grande número de

conexões (sinapses), geralmente unidirecionais. Na maioria dos modelos, essas

conexões estão associadas a pesos, os quais armazenam o conhecimento

representado no modelo e servem para ponderar a entrada recebida por cada

neurônio da rede (BRAGA et al., 2000).

As redes neurais artificiais consistem em um método para solucionar

problemas na área de inteligência artificial através da construção de um sistema que

tenha circuitos que simulem o cérebro humano, inclusive seu comportamento, ou seja,

aprendendo, errando e fazendo descobertas. São mais que isso; são técnicas

computacionais que apresentam um modelo inspirado na estrutura neural dos

57

organismos inteligentes, que adquirem conhecimento através da experiência. Uma

rede neural pode ter centenas ou até milhares de unidades de processamento,

enquanto que o cérebro de um mamífero pode ter muitos bilhões de neurônios.

Estruturalmente, uma rede neural artificial é semelhante ao sistema biológico,

consistindo em um número de elementos interconectados (neurônios) organizados em

camadas que aprendem pela modificação da conexão (pesos). Por convenção, a

camada que recebe os dados é chamada de camada de entrada e a camada que

mostra o resultado é chamada de camada de saída. Em redes com mais de duas

camadas, as que se encontram entre as de entrada e de saída desempenham o

processamento interno e são denominadas camadas escondidas ou ocultas. Uma rede

neural artificial pode conter uma ou várias camadas ocultas, de acordo com a

complexidade do problema (Figura 5.1).

Figura 5.1: Exemplo de arquitetura de uma RNA de três camadas.

As variantes de uma rede neural são muitas, e são alteradas de acordo com a

aplicação e com o tipo de problema a ser resolvido. O que permite a diferenciação

entre as redes neurais artificiais são os tipos de conexões e formas de treinamento.

Basicamente, os itens que compõem uma rede neural artificial e estão sujeitos a

modificações são: a forma de conexões entre as camadas, o número de camadas

escondidas, a quantidade de neurônios em cada camada, a função de transferência e

o algoritmo de aprendizado.

Camadade Entrada

CamadaEscondida

Camadade Saída

Camadade Entrada

CamadaEscondida

Camadade Saída

58

5.3.1) O Neurônio Biológico

No sistema nervoso, a unidade morfológica e funcional é a célula nervosa ou

neurônio, que recebe e transmite o impulso nervoso. O cérebro humano é composto

por mais ou menos 1011 neurônios de diversos tipos diferentes, com distintas funções

dependendo da sua localização e estrutura morfológica, mas que em geral,

constituem-se dos mesmos componentes básicos (SILVA JÚNIOR & SASSON, 1996)

(Figura 5.2) :

CORPO DO NEURÔNIO: também chamado de soma, é onde está contido o

núcleo e pericário, que dá suporte metabólico a toda célula.

AXÔNIO: fibra nervosa sob a forma de um fino filamento que é responsável

pela condução do impulso nervoso para o próximo neurônio. Pode ser

revestido ou não por mielina (bainha axonial, que desempenha o papel de

isolante e facilita a transmissão do impulso nervoso).

DENDRITOS: são prolongamentos menores em forma de ramificações

(dendron = árvore) que emergem do pericário e do final do axônio, sendo, na

maioria das vezes, responsáveis pela comunicação entre os neurônios

através das sinapses. De uma forma geral, os dendritos têm por função

receber os estímulos transmitidos pelos outros neurônios.

Figura 5.2: Tipos de neurônios biológicos (SILVA JÚNIOR & SASSON, 1996).

59

O percurso do impulso nervoso no neurônio é sempre no sentido

dendrito axônio. Quando em repouso, a membrana celular do axônio está polarizada,

isto é possui carga elétrica positiva do lado externo e carga elétrica negativa do lado

interno. Ao receber um estímulo, ela se despolariza, isto é, sofre modificações,

havendo inversão das cargas elétricas: externamente, ficam as cargas negativas, e

internamente, as positivas (Figura 5.3). A inversão vai sendo transmitida ao longo do

axônio, e todo esse processo é considerado impulso nervoso (LOPES, 1997).

Figura 5.3: Esquema da propagação do impulso nervoso em um neurônio (modificado de

LOPES, 1997).

A transmissão do impulso nervoso entre o axônio de um neurônio e o corpo

celular ou os dendritos do neurônio receptor (ou entre o neurônio e uma célula de

outro órgão) é feita através de uma junção especializada chamada sinapse (= fenda).

Quando o estímulo nervoso chega à extremidade do axônio, este libera para a fenda

sináptica um mediador químico conhecido por neurotransmissor. O neurotransmissor

liberado na fenda sináptica atua sobre a membrana plasmática do neurônio receptor,

causando a despolarização da membrana, isto é, passa o impulso nervoso para o

outro neurônio. Esse processo se repete até chegar ao órgão alvo, onde o impulso

nervoso provoca uma resposta que pode ser de contração ou relaxamento (LOPES,

1997).

Portanto, a transmissão do sinal de uma célula para a outra é um complexo

processo químico, no qual substâncias específicas são liberadas pelo neurônio

transmissor. O efeito é um aumento ou uma queda no potencial elétrico no corpo da

célula receptora. Se este potencial alcançar o limite de ativação da célula, um pulso ou

uma ação potencial de potência e duração fixa é enviado através do axônio. Diz-se

então que o neurônio está ativo.

- - - - - - - - - - + + + - - - - - - -

- - + + + - - - - - - - + + +

+ + + + + + + - - - + + + + +

+ + + + - - -+ + - - - + + + Axônio em repouso Impulso nervoso (I.N.)

(I.N.) (I.N.)

Estímulo

SENTIDO DE PROPAGAÇÃO DO IMPULSO

RECEPÇÃO DO IMPULSO

(I) (II)

(III) (IV)

- - - - - - - - - - + + + - - - - - - -

- - + + + - - - - - - - + + +

+ + + + + + + - - - + + + + +

+ + + + - - -+ + - - - + + + Axônio em repouso Impulso nervoso (I.N.)

(I.N.) (I.N.)

Estímulo

SENTIDO DE PROPAGAÇÃO DO IMPULSO

RECEPÇÃO DO IMPULSO

(I) (II)

(III) (IV)

60

Um neurônio pode receber ou enviar impulsos através de 1.000 a 100.000

conexões sinápticas em relação a outros neurônios, dependendo do seu tipo e

localização no sistema nervoso. O número e a qualidade das sinapses em um

neurônio pode variar, entre outros fatores, pela experiência e aprendizagem,

demonstrando a capacidade plástica do sistema nervoso.

5.3.2) O Neurônio Artificial

O neurônio artificial foi projetado para “imitar” as características primárias do

neurônio biológico. Desta forma, neurônio artificial é uma estrutura lógico-matemática

que procura simular o comportamento e as funções de um neurônio biológico, onde os

dendritos foram substituídos por entradas cujas ligações com o corpo celular artificial

são realizadas através de elementos chamados de peso (simulando as sinapses). Os

estímulos captados pelas entradas são processados pela função de soma, e o

lançamento do estímulo do neurônio biológico foi substituído pela função de

transferência (KOVÁCS, 1996) (Figura 5.4).

Figura 5.4: Modelo esquemático da unidade fundamental de uma RNA, o neurônio artificial.

A função básica de um neurônio artificial frente a um tratamento

supervisionado, por exemplo, é depois de acumular o valor somado dos produtos

ocorridos entre as entradas e os pesos, processar esse valor através de uma função

de ativação e passá-lo adiante através da saída (tal processo é conhecido como

Função de Transferência).

ƒ

Σ

Função de transferência

Função de soma W1

W2

W3

ENTRADAS

Pesos

SAÍDA

ƒ

Σ

Função de transferência

Função de soma W1

W2

W3

ENTRADAS

Pesos

SAÍDA

61

Segundo KRÖSE e SMAGT (1993), o vetor de entrada “u” que representa um

conjunto de “n” entradas, é multiplicado por um vetor de pesos “w” e o produto, p=u.w,

é aplicado aos canais de entrada do neurônio. A soma de todas as entradas

ponderadas é então processada por uma função de ativação, φ(.), que vai produzir o

sinal de saída “yk” do neurônio “k”, este modelo representa o neurônio de McCulloch-

Pitt (Equação 5.1).

( )θϕ += ∑ ii ik wuy ( )1.5

O parâmetro θ é um valor de limiar (threshold) adicionado a soma ponderada,

que às vezes é omitido, mas constitui uma polarização externa (unidade bias) com o

intuito de aumentar o número de graus de liberdade disponíveis no modelo, permitindo

que a rede neural tenha maior capacidade de se ajustar ao conhecimento fornecido.

5.3.3) Funções de Ativação

A função de ativação define as propriedades computacionais de um neurônio.

É através da função de ativação que são calculadas as respostas geradas pelas

unidades. De acordo com HAYKIN (1994), esta função pode ter várias formas

conforme a figura 5.5 e as equações 5.2 a 5.5.

Figura 5.5: Exemplo de funções de ativação.

ƒ(x)

x

ƒ(x)

xβ

1

1

ƒ(x)

x

ƒ(x)

x

1

-1

(a) Linear (b) Degrau (lógica)

(c) Logística Sigmoidal (d) Tangente Hiperbólica

ƒ(x)

x

ƒ(x)

x

ƒ(x)

xβ

1ƒ(x)

xβ

1

1

ƒ(x)

x

1

ƒ(x)

x

ƒ(x)

x

1

-1

ƒ(x)

x

1

-1

(a) Linear (b) Degrau (lógica)

(c) Logística Sigmoidal (d) Tangente Hiperbólica

62

O exemplo mais simples de função de ativação é o da função linear, que não é

limitada e os neurônios com este tipo de função de propagação podem ser utilizados

como aproximadores lineares sendo, ela é definida segundo a equação 5.2:

( ) ii ik wuxxy ∑===ϕ ( )2.5

Outra função de ativação é a função degrau (lógica), que limita a saída do

neurônio a apenas dois valores (binário: 0 ou 1, ou bipolar: -1 ou 1). Normalmente é

utilizada para criar neurônios que tomem decisões binárias, como nos classificadores.

Este tipo de função não é contínua em x=β, o que dificulta a utilização de algoritmos

eficientes de treinamento.

A versão contínua da função de ativação degrau é a função logística sigmoidal,

encontrada em diversas aplicações de redes neurais artificiais, e definida pela

equação 5.3:

( ) xk exy αϕ −+== 11 ( )3.5

onde o parâmetro α modifica a derivada da função sigmóide nas vizinhanças do ponto

x=0 e serve para ajustar a “velocidade” da transição. Este tipo de função limita a saída

de um neurônio no intervalo [0,1], ou seja, independente do valor de entrada (-∞ e +∞),

a função comprimirá os valores em um intervalo fixo entre zero e um. É a função

geralmente adotada em redes neurais em virtude de ser contínua, monotônica, não

linear e facilmente diferenciável em qualquer ponto como demonstrado na equação

5.4:

( ) ( )yyxdxdy

−== 1'ϕ ( )4.5

Em algumas aplicações, um melhor desempenho é obtido no treinamento da

rede com saídas no intervalo [-1,+1], obtido a partir da função de ativação tangente

hiperbólica, tendo as mesmas características da função logística sigmoidal, porém

possibilitando que as saídas sejam simétricas (Equação 5.5).

( ) xx

k eexxy −

−

+−=⎟

⎠⎞

⎜⎝⎛== 1

12

tanhϕ ( )5.5

63

5.3.4) Topologia da Rede

Topologia (do grego topos=forma, e logos=estudo) é o ramo da matemática

que estuda as formas, ou seja, os espaços topológicos. Em termos de informática, a

topologia de uma rede descreve como será o layout dos dispositivos conectados e

meio pelo qual haverá a propagação das informações. No estudo de redes neurais, a

topologia da rede confere a arquitetura a ser empregada na construção para um

determinado problema.

A capacidade de resolução do problema, o desempenho do treinamento e a

fidelidade dos resultados estão intimamente ligados à qualidade da representação

adotada (THOMÉ, 2003). Dependendo do algoritmo empregado para treinar a rede, a

maneira pela qual os neurônios da rede são estruturados sofre influência. Duas

classes fundamentais de arquitetura de redes são mais conhecidas: as redes

progressivas e as redes recorrentes.

REDES PROGRESSIVAS:

Nesta arquitetura de rede, os neurônios são organizados em forma de

camadas, com a primeira camada de vetores de entrada ligada às camadas

intermediárias e estas, por conseguinte, ligadas a uma camada de saída.

Todas as conexões entre neurônios diferentes obedecem necessariamente à

direção entrada saída, não havendo conexões entre neurônios de uma mesma

camada. Esta estrutura é totalmente conectada, uma vez que todas as saídas dos

neurônios de uma camada são conectadas com as entradas de todos os neurônios da

camada seguinte imediatamente à direita (Figura 5.6). Os neurônios da camada de

entrada diferem de todos os demais, operando apenas como ponto de ligação, uma

vez que desempenham a função de conectar o mundo exterior com o mundo interior

da rede neural artificial (THOMÉ, 2003).

Figura 5.6: Estrutura unidirecional em uma RNA de quatro camadas.

64

REDES RECORRENTES:

Uma rede neural artificial recorrente difere de uma rede neural artificial

progressiva por possuir pelo menos um “loop” de realimentação (feedback loop).

Nesta topologia, as redes possuem realimentação, onde um neurônio pode ser

direta ou indiretamente retroalimentado pela sua saída. Cada camada pode conter

conexões entre os elementos de processamento da mesma camada, como se fossem

estímulos laterais, das camadas anteriores e das camadas posteriores (Figura 5.7). Na

topologia recorrente, não existe um sentido único para o fluxo dos sinais entre

neurônios ou entre camadas (THOMÉ, 2003). A rede mais conhecida é a rede de

Hopfield.

Figura 5.7: Estrutura recorrente em uma das camadas de uma RNA.

5.3.5) Modelos de Treinamento

É durante a fase de treinamento que uma rede neural artificial “aprende” o

problema e vai tentar resolvê-lo auto-ajustando seus parâmetros internos. Ao

aprender, isto é, ter adquirido condições de onde o erro obtido seja satisfatório ao

especialista avaliador, seus parâmetros são congelados e ela, a partir de então, está

pronta para ser utilizada com os dados do problema corrente. Como as redes neurais artificiais aprendem por “experiência” através de

exemplos e eventos de tentativas e erros, são conhecidos dois modelos de

treinamento de redes neurais:

SUPERVISIONADO:

Neste tipo de aprendizado, os padrões de entrada e as saídas (também

conhecidas como targets, respostas desejadas ou classes) são apresentados à rede,

ou seja, é fornecida a classe de cada amostra durante a fase de treinamento.

65

O ciclo de treinamento começa com a entrada de um primeiro vetor, a partir do

qual a saída da rede é calculada e comparada com o vetor de saída correspondente.

O erro encontrado é realimentado através da rede e os pesos são atualizados de

acordo com um algoritmo determinado para minimizar este erro. Este ciclo é repetido

até que o erro para os vetores de treinamento tenha alcançado níveis mínimos (Figura

5.8).

Figura 5.8: Esquema de aprendizado supervisionado.

NÃO SUPERVISIONADO:

Neste tipo de aprendizado, o rótulo da classe de cada amostra de treinamento

não é apresentado, e a rede irá analisar o conjunto de dados apresentado a ela sem a

necessidade de um conjunto de pares de entrada e saída como no caso do

treinamento supervisionado, ou seja, são empregados no aprendizado apenas os

valores de entrada (Figura 5.9).

A rede irá analisar os vetores de entrada e organizá-los de modo a classificá-

los mediante algum critério de semelhança. Este tipo de rede utiliza os neurônios

como classificadores e os dados de entrada como elementos de classificação

(THOMÉ, 2003).

PesosAjustáveis

(W)

Cálculo do erro(e)

SAÍDA(s)

Valor desejado(t)

PADRÃO DEENTRADA

(X)

e (t,s)

PesosAjustáveis

(W)

Cálculo do erro(e)

SAÍDA(s)

Valor desejado(t)

PADRÃO DEENTRADA

(X)

e (t,s)

66

Figura 5.9: Esquema de aprendizado não supervisionado.

5.3.6) Modelos de Redes Neurais Artificiais

Na literatura, podem ser encontrados diversos modelos de redes neurais

artificiais, cada qual advindo de uma linha de pesquisa diferente, e sempre visando um

melhor desempenho na solução de um determinado problema. Estes modelos são

classificados de acordo com suas características como, por exemplo, forma de

treinamento, topologia e finalidade de aplicação.

Para as tarefas de classificação e predição de dados, os modelos mais

empregados são: Perceptron, Redes Lineares, Multi Layer Perceptron (MLP) e Radial

Basis Function (RBF). Já nos problemas de agrupamento, as redes mais empregadas

são os Mapas Auto-Organizáveis de Kohonen, as Redes de Hopfield e Memória

Associativa Bidirecional (SIMEÃO, 1999).

Dentre estes, o modelo que mais difundido e que se considera mais para

solucionar o problema, não linearmente separável, proposto neste estudo foi o de Multi

Layer Perceptron, o qual será mais detalhado no próximo item.

5.3.7) Modelo de Multi Layer Perceptron (MLP)

As redes Perceptron Multicamadas (Multi Layer Perceptron) são conhecidas

pela sua capacidade de generalização. É o tipo de rede mais adotado para previsão

de dados, pois pode aproximar muito bem funções não lineares (KOVÁCS, 1996).

Estas redes apresentam uma ou mais camadas entre as camadas de entrada e de

saída. Seu treinamento é do tipo supervisionado através do algoritmo de

retropropagação (backpropagation) (Figura 5.10).

PesosAjustáveis

(W)

SAÍDA(s)

PADRÃO DEENTRADA

(X)

PesosAjustáveis

(W)

SAÍDA(s)

PADRÃO DEENTRADA

(X)

PesosAjustáveis

(W)

SAÍDA(s)

PADRÃO DEENTRADA

(X)

67

Figura 5.10: Exemplo de arquitetura de uma rede neural artificial de quatro camadas tipo MLP.

As redes neurais artificiais de múltiplas camadas são de redes progressivas,

onde as saídas dos neurônios se conectam exclusivamente às entradas dos neurônios

da camada seguinte, sem a presença de ciclos de realimentação. Ou seja, o sinal de

entrada se propaga através da rede, camada a camada, em um sentido progressivo.

A configuração de uma rede neural artificial de múltiplas camadas é variável e

dependente do problema analisado. A quantidade de nós na camada de entrada e de

saída é determinada, respectivamente, pela quantidade de sinais de entrada e pela

quantidade de respostas desejadas, sendo por isso dados inerentes do problema em

questão. Desta forma, na etapa de construção de um projeto de uma rede neural

artificial de múltiplas camadas, os aspectos que precisam ser determinados

prioritariamente são:

Número de camadas escondidas;

Números de neurônios para cada camada escondida; e

Pesos sinápticos que conectam os neurônios.

O número de camadas escondidas não pode ser determinado por regras pré-

estabelecidas, visto que estas não existem! O que se encontra na literatura é a

menção a não utilização de um grande número de camadas.

SILVA & CANÊDO (2001) destacam que a última camada (camada de saída) é

a única camada que tem uma noção precisa do erro cometido pela rede, visto que a

última camada escondida recebe uma estimativa sobre o erro e a penúltima camada

escondida recebe uma estimativa da estimativa, e assim por diante. Testes empíricos

com rede neural artificial de múltiplas camadas backpropagation não demonstram

vantagem significativa no uso de duas camadas escondidas ao invés de uma para

problemas menores. Por isso, para a grande maioria dos problemas, utiliza apenas

uma camada escondida, quando muito duas, não mais que isso.

Camadade Entrada

1ªCamada

Escondida

Camadade Saída

Entr

adas

2ªCamada

Escondida

Saídas

Camadade Entrada

1ªCamada

Escondida

Camadade Saída

Entr

adas

2ªCamada

Escondida

Saídas

68

O algoritmo de retropropagação para redes neurais artificiais de múltiplas

camadas foi essencialmente inventado e popularizado por Rummerlhart, Hinton e

Williams, resolvendo uma das limitações fundamentais para o treinamento de redes

complexas. O algoritmo foi desenvolvido originalmente para redes de neurônios com

funções de ativação semilineares (KOVÁCS, 1996).

O algoritmo de retropropagação é o método empregado no treinamento de

redes neurais artificiais de múltiplas camadas. Durante o treinamento a rede atua em

uma seqüência de dois passos. No primeiro, um padrão é apresentado à camada de

entrada da rede. A atividade resultante flui através da rede, camada após camada, até

que atinja a camada de saída e a resposta seja produzida. No segundo passo, a saída

obtida é comparada à saída desejada. Caso esta não esteja correta, o erro é

calculado. O erro é então retropropagado desde a camada de saída até a camada de

entrada, e os pesos das conexões das unidades das camadas escondidas vão sendo

modificados conforme o erro é retropropagado (CARVALHO, 2000).

O ajuste dos pesos é realizado através do cálculo do gradiente descendente da

função de erro nos neurônios de saída, denominado de Regra de Delta Generalizada.

Esta regra opera na tomada do valor obtido na saída e calcula a diferença entre este e

o valor esperado. Este erro é retropropagado pela rede, de forma que se faça o cálculo

da diferença a aplicar nos pesos e sua posterior atualização. Em uma de rede neural

artificial de múltiplas camadas, o conhecimento aprendido sobre o ambiente é

representado pelos valores assumidos pelos pesos sinápticos da rede. Como estes

valores não são apresentados para o usuário, esta técnica é considerada por muitos

como “modelo caixa preta”.

5.3.7.1) Aprendizado das Redes MPL

A capacidade limitada de representação das redes neurais artificiais com uma

única camada foi superada na década de 60, a partir do perfeito entendimento do

problema de separabilidade linear. Contudo, apesar de se ter descoberto como

aumentar a capacidade de representação da rede com o acréscimo de novas

camadas, faltava ainda uma forma de treinar a rede. Esta forma só foi descoberta em

meados da década de 70, com a criação de vários algoritmos, entre eles o de

retropropagação (backpropagation). O backpropagation se tornou um dos algoritmos

mais populares para treinamento, sendo em parte responsável pelo ressurgimento do

interesse da área de redes neurais artificiais (AURÉLIO et al., 1999).

69

O algoritmo de retropropagação pode ser modelado por funções matemáticas

simples. Considere uma unidade de saída, o neurônio yk, sendo alimentado por um

conjunto de sinais resultante dos neurônios da sua camada à esquerda, segundo a

figura 5.11.

Figura 5.11: Fluxo do sinal no neurônio de saída k.

O potencial de ativação xk aplicado na entrada do neurônio k é definido pela

equação 5.6:

∑=

+=m

iikik ywx

0.θ ( )6.5

onde m é o número total de entradas aplicadas ao neurônio k. O peso sináptico θ,

corresponde à entrada fixa y0=-1, e define a unidade bias aplicada ao neurônio k. wki é

o peso sináptico conectado à saída do neurônio i ao neurônio k e yk é o sinal de saída

do neurônio i. O sinal yj resultante na saída do neurônio k é igual a:

( )kkk xy ϕ= ( )7.5

onde φk(.) representa a função de ativação associada ao neurônio k.

A diferença entre a saída esperada em k, representada por tk, apresentada pelo

padrão de treinamento, e o valor da saída calculado, yk, é o valor no qual a rede está

buscando minimizar, este erro (Ε) é dado por:

kkk yt −=Ε ( )8.5

O valor do erro quadrático para o neurônio k é definido como:

ykwkiyi Σ

Neurônio k

y0=-1

θ

xk

ϕ(.)ykwkiyi Σ

Neurônio k

y0=-1

θ

xk

ϕ(.)

70

2

21

kk Ε=Ε ( )9.5

A soma de todos os erros quadráticos para todos os neurônios da camada de

saída de uma rede neural artificial de múltiplas camadas é igual a:

∑∈

Ε=ΕCk

k2

21 ( )10.5

Onde o conjunto C inclui todos os neurônios da camada de saída. Como a

técnica utiliza para o ajuste de pesos o gradiente decrescente da função de erro nos

neurônios de saída, o erro quadrático médio é calculado nos neurônios de saída e a

atualização do peso do neurônio i para o k é dada por:

( ) ( ) ( )11 +Δ+=+ nwnwnw kikiki ( )11.5

O termo ∆wki é a alteração do peso desta conexão em cargo da apresentação

de um par padrão de entrada (t) e saída (y), definido da seguinte forma:

ikki yw δη.=Δ ( )12.5

onde η é a taxa de aprendizado (constante de proporcionalidade), δk é o gradiente

local do neurônio k e yi é a i-ésima entrada da unidade k.

Já o gradiente local em cada unidade, δ ou delta, é calculado para os

neurônios da camada de saída por um calculo direto:

( )kkk x'.ϕδ Ε= ( )13.5

onde φ’k(xk) á a derivada parcial da função de ativação em relação à entrada total no

neurônio k, e Εk é o erro na saída do neurônio k.

Nos neurônios das camadas escondidas, os valores alvos (ou padrões) não

são fornecidos. Desta forma, é necessário um cálculo indireto a partir do erro

calculado nos neurônios de saída, da seguinte forma:

( ) zk

m

zzkkk wx ..'

0∑=

= δϕδ ( )14.5

71

5.3.7.2) O Termo Momentum

A taxa de aprendizado, η, determina a velocidade de treinamento. Este

parâmetro tem grande influência durante o processo de treinamento da rede neural

artificial. Uma taxa de aprendizado muito baixa torna o aprendizado da rede muito

lento, ao passo que uma taxa de aprendizado muito alta provoca oscilações no

treinamento e impede a convergência do processo de aprendizado (SILVA &

CANÊDO, 2001).

Com isso, uma alternativa para reduzir o tempo de treinamento, assegurando

um maior grau de estabilidade da rede e visando aumentar o desempenho do cálculo

pelo método do gradiente descendente, foi proposto por Rummerlhart, Hinton e

Williams em 1986, a adição de um parâmetro denominado de Termo “Momentum” ou

Momento (AURÉLIO et al., 1999).

Desta forma, o termo momentum leva em consideração o efeito de mudanças

anteriores de pesos na direção do movimento atual no espaço de pesos. Então, se

durante o treinamento for encontrado um mínimo local, o erro para o conjunto de

treinamento irá estabilizar, ou seja, o cálculo vai estacionar em um valor maior que o

aceitável (Figura 5.12). Com o emprego deste parâmetro, a taxa de aprendizado pode

ser maior e o método converge mais rápido. O cálculo da diferença de peso, a cada

passo, então passa a ser:

( ) ( )nwynw kikkki Δ+=+Δ ...1 αδη ( )15.5

onde α é o termo momentum.

Figura 5.12: Panorama do erro quadrático com um mínimo local (modificado de KOVÁCS,

1996).

Mínimo GlobalMínimo Local

Mínimo GlobalMínimo Local

72

5.3.7.3) Atualização dos Pesos

O processo de aprendizado é a fase em que a rede neural artificial adapta seus

parâmetros (em geral, os pesos das conexões entre os neurônios) de forma a garantir

os resultados esperados pelo especialista. A dinâmica de treinamento representa a

freqüência com que estes parâmetros (os pesos) são atualizados. A atualização dos

pesos pode ser processada de duas formas: a cada padrão ou por ciclo.

No treinamento por padrão (incremental), os pesos são atualizados a cada

exemplo de treinamento, ou seja, os pesos da rede neural artificial são ajustados ao

final do processamento de cada observação (THOMÉ, 2003). Neste caso, a

apresentação de cada exemplo é importante para a velocidade de aprendizado da

rede neural artificial e, em alguns casos, deve-se reorganizar esta ordem de forma a

acelerar treinamento. A dinâmica de treinamento por padrão é estável se a taxa de

aprendizado for pequena. Quando taxas de aprendizado elevadas são utilizadas, a

rede neural artificial geralmente se torna instável. A abordagem por padrão é

geralmente mais rápida, principalmente se o conjunto de treinamento for grande e

redundante. Uma outra vantagem desta técnica é que ela requer menos memória

(SILVA & CANÊDO, 2001).

No treinamento por ciclo (Batch ou Epoch), os pesos são atualizados ao final

de cada ciclo - processamento de todo o conjunto de observações -, ou seja, os

parâmetros da rede são ajustados somente ao final e cada ciclo. Esta técnica é

geralmente mais estável e o treinamento é menos influenciado pela ordem de

apresentação dos padrões, mas ela pode ser lenta se o conjunto de treinamento for

grande e redundante. Uma outra desvantagem é que ela requer mais memória (SILVA

& CANÊDO, 2001).

Comparativamente com o treinamento incremental, o treinamento por ciclos é

considerado mais estável, embora demande mais tempo computacional.

5.3.7.4) Fim de Treinamento

Alguns critérios podem ser adotados para determinação do fim do treinamento

de uma rede neural artificial. Normalmente, o próprio erro médio quadrático é

estipulado como indicador de parada, ou outro erro que o especialista entenda como

interessante de calcular. Neste caso, a parada ocorre quando o erro calculado pelo

algoritmo de treinamento converge para um erro menor que o mínimo estipulado como

critério de término.

73

Um outro critério de fim de treinamento é a quantidade de ciclos percorridos,

porém neste caso o processo de aprendizado pára independentemente do nível de

aprendizado alcançado pela rede neural artificial. Este tipo de parada é útil nos casos

onde a convergência está difícil de ser alcançada e o processo de treinamento é

interminável.

Segundo SILVA & CANÊDO (2001), um número excessivo de ciclos pode levar

a rede neural artificial à perda do poder de generalização e ocorrer um super-ajuste da

mesma aos dados do conjunto de treinamento (“overfitting”). Por outro lado, com um

pequeno número de ciclos, um bom desempenho pode não ser atingido

(“underfitting”). Sugere-se então, um valor entre 500 e 3000 ciclos de treinamento.

Para os treinamentos realizados a partir do valor do erro médio quadrático, não é

aconselhável valores muito baixos, visto que estes não garantem boa generalização.

Este valor depende muito do problema, então é válido estabelecer um valor de 0,01 no

primeiro treinamento e posteriormente ajustá-lo em função do resultado.

5.3.7.5) Pesos Iniciais

Na literatura, são encontradas sugestões a respeito dos valores empregados

nos pesos iniciais. Geralmente, apontam-se para valores pequenos, aleatoriamente

escolhidos, positivos e negativos, e totalmente diferentes entre si.

Segundo GALLANT (1994), os valores dos pesos iniciais devem estar entre o

intervalo [-2/k,2/k], onde k é a quantidade de entradas de uma unidade. Já HERTZ et

al. (1990) recomendam o uso de valores em torno de 1/k.

5.3.7.6) Escala dos Valores de Entrada

A representação dos dados é uma variável muito importante. Caso as decisões

sobre a representação dos dados sejam feitas erroneamente, pode-se tornar

impossível que a rede neural artificial aprenda o relacionamento que está sendo

apresentado a ela. De uma forma geral, quanto mais explícita a representação dos

dados, mais fácil será para a rede neural artificial aprender.

O pré-processamento dos dados pode ser realizado através de normalizações,

escalonamentos e conversões de formato para torná-los mais apropriados a sua

utilização na rede neural artificial.

74

5.4) Árvores de Decisão

O aprendizado de máquina é uma área de pesquisa da Inteligência Artificial

cujo objetivo é extrair regras heurísticas que porventura existam embutidas em

grandes massas de dados. Estes algoritmos permitem uma boa modelagem dos

dados, permitindo previsões e classificações (CARVALHO, 2005).

Um dos muitos algoritmos de aprendizado de máquina, e dos mais utilizados,

são os chamados algoritmos de particionamento sucessivo. Estes algoritmos partem

da massa de dados original e a particionam gerando subgrupos que são, por sua vez,

também particionados até que se atinja o nível de detalhe desejado para extrair regras

heurísticas precisas sobre os padrões encontrados nos dados. Normalmente, estes

subgrupos são gerados a partir de um grupo através de uma regra heurística que

classifica os dados do grupo em um outro subgrupo. Sendo assim, uma boa

representação para o particionamento sucessivo é uma árvore binária chamada de

Árvore de Decisão (CARVALHO, 2005).

Quinlan e Breitman são considerados os personagens mais conhecidos no que

diz respeito ao desenvolvimento de algoritmos de indução de árvores de decisão. Os

seus softwares ID3 e CHART, respectivamente, se tornaram famosos no final da

década de 80/início 90 (OSÓRIO, 2001).

Proposto em QUINLAN (1986), o algoritmo ID3 pode ser aplicado para

conjuntos de instâncias com atributos discretos ou discretizados. Este algoritmo possui

uma implementação simples e desempenho razoável, o que o levou a ser um dos mais

populares. Sua estrutura é a mesma de um algoritmo básico de construção de árvores

de decisão, porém Quinlan inovou com a inserção de um critério de seleção de

atributos para o particionamento, que é o critério de entropia. Já em 1993, o mesmo

autor estendeu a capacidade do ID3, que só tratava dados discretos, para um novo

algoritmo, o C4.5, que tem a capacidade de lidar com dados contínuos.

De uma forma simplória, as árvores de decisão são amplamente utilizadas em

algoritmos de classificação, e consistem em representações simples do conhecimento

e um meio eficiente de construir classificadores que predizem classes baseadas nos

valores de atributos de um conjunto de dados (GARCIA, 2000).

Uma Árvore de Decisão utiliza a estratégia chamada “dividir para conquistar”,

de forma que um problema complexo é decomposto em sub-problemas mais simples,

e de uma forma recursiva a mesma estratégia é aplicada a cada próximo sub-

problema (GAMA, 2000).

75

As árvores de decisão são estudadas em vários campos de pesquisa como

ciências sociais, estatística, engenharia, entre muitas outras. Atualmente, elas têm

sido aplicadas, com sucesso, em um enorme campo de tarefas, desde diagnóstico de

casos médicos até avaliação de risco de crédito de requerentes de empréstimo.

5.4.1) Estrutura de uma Árvore de Decisão

As árvores de decisão consistem em uma estrutura composta de nós que

representam os atributos, de arcos (ramos) os quais são provenientes destes nós e

que recebem os valores possíveis para estes atributos, ou seja, cada ramo

descendente corresponde a um possível valor deste atributo, e de folhas, que

representam as diferentes classes apresentadas no conjunto de treinamento (Figura

5.13).

Figura 5.13: Exemplo de estrutura de uma Árvore de Decisão binária.

Na figura 5.13, os círculos representam os nós internos, os quadrados

representam os nós-folhas, as linhas representam os ramos que interligam os dois

nós, X1 e X2 representam as variáveis decisórias. Chama-se de variável decisória a

variável que levará a uma nova divisão, em relação a um possível valor.

A interpretação da representação gráfica da Árvore de Decisão ilustrada na

figura anterior é descrita da seguinte forma: quando a condição é satisfeita (por

exemplo, X1≤0,7), os dados seguem para o nó esquerdo (SIM) e , caso contrário, os

dados seguem para o nó direito (NÃO), e assim sucessivamente até que seja atingido

o fim da árvore, ou seja, a amostra seja classificada.

Segundo BRAGA (2003), as árvores de decisão consistem em uma estrutura

de dados do tipo Árvore n-ária, usada para a dedução da classe de uma tupla de

atributos (objetos não classificados), que possui as seguintes propriedades:

t1

t3t2

t4 t5

Sim Não

Sim Não

X1<=0,7

X2<=0,5

t1

t3t2

t4 t5

Sim Não

Sim Não

X1<=0,7

X2<=0,5

76

Um nó-folha representa uma única classe, mas uma classe pode estar

representada em mais de um nó-folha.

Um nó interno é chamado de nó-decisão, pois representa um teste sobre o

valor de um atributo da tupla.

Cada aresta que sai de um nó decisão até um de seus nós filhos representa

um dos possíveis resultados do teste sobre o valor do atributo.

Se considerarmos um conjunto com todos os objetos (n atributos) possíveis

como pontos em um espaço n-dimensional, existirá um eixo para cada atributo,

enumerando todos os valores possíveis para os mesmos. Assim, nota-se que cada nó-

decisão particiona o espaço de objetos em k-partições, onde k é o número de arestas

que partem do nó. A interseção entre os particionamentos efetuados por cada nó

decisão da árvore resulta em um espaço totalmente dividido em partições ainda

menores, para os quais é atribuída uma única classe (Figura 5.14). Através desta

analogia, em outras palavras, verifica-se que um nó da árvore representa um sub-

espaço. O nó-raiz representa então o próprio espaço de objetos. Os nós-filho de um

nó representam as partições da partição do espaço representada pelo nó-pai. Os nós-

folha representam partições em que, pelo menos teoricamente, só estão contidos

elementos de uma mesma classe (LUCENA & DE PAULA, 2001).

Figura 5.14: Exemplo de partições de um espaço de objetos que possui apenas duas classes

(modificado de LUCENA & DE PAULA, 2001).

Desta forma, portanto, a classificação de um objeto por uma Árvore de Decisão

é aproximada. Para problemas reais, haverá um pequeno subconjunto de objetos, em

geral localizados próximo às arestas que separam duas partições, que serão

5 10

8

X2

X1

X1

X2

X1

<=10 >10

<=8 >8

<=5 >5

5 10

8

X2

X1

X1

X2

X1

<=10 >10

<=8 >8

<=5 >5

77

erroneamente classificados. O problema é o quão pequeno este subconjunto deve ser

para efetivamente minimizar a relação entre erros e acertos (BRAGA, 2003).

5.4.2) Construção de uma Árvore de Decisão

O processo de construção de uma Árvore de Decisão é considerado como

aprendizado supervisionado, ou seja, o método irá partir de um conjunto de

treinamento composto de casos conhecidos (que já possuam classes), e gerar regras

que representem cada uma destas classes e as separem das demais. Para avaliar o

desempenho das regras geradas, um conjunto de validação e/ou teste que contenha

exemplos das classes empregadas no treinamento será analisado.

Segundo QUINLAN (1993), seja T o conjunto de treinamento, composto pelas

classes {c1, c2, ... , cn}. A idéia básica do algoritmo é dividir T em subconjuntos que

contenham os casos, todos pertencendo a uma mesma classe cj. Essa divisão é feita

baseada em um atributo que possua valores mutuamente exclusivos {v1, v2, v3, ... , vn}.

O conjunto T é particionado em subconjuntos T1, T2, ... , Tn, onde Ti contém todos os

casos com valores vi. A Árvore de Decisão T consiste de um nó de decisão

identificando o teste para o atributo e um galho para cada valor do atributo.

Recursivamente, cada subconjunto Ti é visto como T até que todos os elementos de Ti

pertençam a uma mesma classe cj.

Considerando a tabela 5.1, o algoritmo acima descrito será aplicado em um

pequeno o número de casos. Estes dados representam um problema de um

determinado jogador de tênis que, a partir de uma amostragem de fatos históricos (14

dias), irá decidir se joga ou não joga tênis, utilizando para esta classificação quatro

atributos (condição do céu, temperatura, umidade e vento).

Inicialmente, T é composto por todos os casos. Como todos os casos que

pertencem a T não fazem parte da mesma classe, o algoritmo irá escolher um atributo

que tenha grande participação na subdivisão do conjunto T em subconjuntos Tn. Neste

caso, o atributo escolhido como teste foi a “Condição do Céu”, na divisão dos casos, já

que ainda não foi determinada a condição final proposta pelo problema. O conjunto T

será dividido em três subconjuntos: T1 para os casos com resultado “Sol”, T2 para os

casos com “Nuvens” e T3 para os com “Chuva”. Como os grupos T1 e T2 não possuem

ainda classificação, eles serão novamente avaliados como no passo anteriormente

descrito, sendo então escolhidos os atributos “Umidade” e “Vento”, respectivamente,

para subdividir e alcançar o resultado. Para o grupo T3, o atributo “Condição do céu” =

78

”Nuvens” seleciona casos de uma mesma classe, e cessando desta forma o algoritmo

(Figura 5.15).

Tabela 5.1: Exemplo de dados para construção de uma Árvore de Decisão.

Figura 5.15: Árvore de Decisão obtida para o conjunto de dados apresentados na tabela 5.1.

Após a construção de uma Árvore de Decisão, é possível derivar regras. Esta

transformação da Árvore de Decisão em regras geralmente é feita com intuito de

facilitar a leitura humana. Desta forma, as árvores de decisão podem ser

representadas como conjunto de regras do tipo “SE-ENTÃO” (IF-THEN). Estas regras

são descritas considerando o percurso da amostra ao longo da árvore, em outras

Cond. Céu

Sol Nuvens Chuva

Umidade Vento

Elevada Normal Fraco Forte

Não Sim

Sim

NãoSim

Cond. Céu

Sol Nuvens Chuva

Umidade Vento

Elevada Normal Fraco Forte

Não Sim

Sim

NãoSim

Dia Cond. Céu Temperatura Umidade Vento Jogar Tênis

1 Sol Quente Elevada Fraco Não2 Sol Quente Elevada Forte Não3 Nuvens Quente Elevada Fraco Sim4 Chuva Ameno Elevada Fraco Sim5 Chuva Fresco Normal Fraco Sim6 Chuva Fresco Normal Forte Não7 Nuvens Fresco Normal Fraco Sim8 Sol Ameno Elevada Fraco Não9 Sol Fresco Normal Fraco Sim

10 Chuva Ameno Normal Forte Não11 Sol Ameno Normal Forte Sim12 Nuvens Ameno Elevada Forte Sim13 Nuvens Quente Normal Fraco Sim14 Chuva Ameno Elevada Forte Não

79

palavras, o trajeto do nó-raiz até uma folha da árvore. Em determinados casos, as

árvores de decisão tendem a crescer muito e então elas são muitas das vezes

substituídas apenas por suas regras e então modularizadas em softwares para

classificação.

Tomando como base a Árvore de Decisão obtida com os dados da tabela 5.1, a

derivação de regras pode ser demonstrada pelos seguintes exemplos:

SE “Condição do Céu” = “Nuvens” ENTÃO classe = “Sim”

SE “Condição do Céu” = “Sol” e “Umidade” = “Elevada” ENTÃO classe = “Não”

Para gerar uma Árvore de Decisão com alta taxa de predição, é necessário

fazer a escolha correta dos atributos que serão usados como teste no agrupamento

dos casos. Estes testes devem gerar uma árvore com o menor número possível de

subconjuntos, fazendo com que cada folha da árvore contenha um número

significativo dos casos. O ideal é escolher os testes de modo que a árvore final seja a

menor possível.

Se a seleção de atributos for aleatória, o fato empírico da maioria dos atributos

ter baixo poder de predição levará a árvores maiores e com baixo poder de

generalização e predição.

Segundo BRAGA (2003,), vários são os problemas a serem superados em

qualquer algoritmo de construção de árvores de decisão para que as mesmas sejam

ótimas em quesitos como altura, eficiência de classificação, tempo de construção,

entre outros. Alguns destes, que ainda hoje são temas de pesquisas são listados a

seguir:

Escolha da melhor partição para um nó, em geral por escolha do atributo;

Estratégias para limitação no crescimento da árvore;

Tratamento de valores desconhecidos no conjunto de objetos empregados

para treino e para teste;

Partições baseadas em características discretas x contínuas.

Como analisar todas as possíveis possibilidades de árvores geradas seria algo,

no mínimo, absurdo, foram desenvolvidos vários métodos aplicados na escolha dos

atributos e dos testes a serem utilizados. Dentre estes, são mais conhecidos os

critérios de entropia e ganho de informação.

80

5.4.3) Entropia

Para medir a homogeneidade dos grupos, os algoritmos se utilizam do conceito

de variância ou entropia. Na Física, especialmente na Termodinâmica, o conceito de

entropia está associado à desordem, sendo definido pela equação diferencial:

TdQdS rev= ( )16.5

onde dS é a variação de entropia, dQrev é a variação de calor e T a temperatura. Desta

equação, segue que a entropia é uma função unívoca e uma propriedade extensiva do

sistema, onde a diferencial dS é uma diferencial exata. Para uma transformação finita,

do estado 1 ao estado 2, teríamos (CASTELLAN, 1986):

∫=−=Δ2

121 TdQSSS rev ( )17.5

Em outras palavras, sempre é preciso uma diferença de temperatura entre as

quais possa fluir energia (calor) de uma fonte quente para uma fonte fria, sendo parte

desta energia em fluxo transformada no trabalho útil realizado pela máquina.

Na ciência da computação, a entropia, chamada de entropia da informação,

indica a quantidade de informação adicional necessária para se entender um

fenômeno ou sistema. A entropia mede o grau de aleatoriedade dos valores que uma

variável aleatória X pode assumir.

Segundo CARVALHO (2005), a quantidade de informação Q sobre um

fenômeno é medida pela sua probabilidade de ocorrência p. Quanto mais improvável o

fenômeno (baixa probabilidade de ocorrência), maior o valor da informação capaz de

prevê-lo. A relação entre a quantidade da informação Q e a probabilidade p é inversa:

( )pQ 2log−= ( )18.5

Se, por exemplo, a probabilidade do Sol nascer amanhã é 1 (total certeza do

fato), a quantidade Q desta informação é nula, pois o logaritmo de 1 é zero. Porém, se

for levada em conta a previsão de que horas o Sol nascerá amanhã, a probabilidade

de acerto será pequena e, conseqüentemente, o valor Q será grande. Desta forma, a

quantidade de informação necessária para ser entendido que o Sol nascerá amanhã é

81

zero, pois isso já é sabido. No entanto, a quantidade de informação necessária para

saber a que horas exatamente o Sol nascerá amanhã é grande, pois o fenômeno não

é facilmente previsível.

Assim, a entropia da informação é a quantidade média de informações

necessárias para que um fenômeno seja entendido. Se um fenômeno depende de n

fatores ou eventos i = 1, 2, 3,...n, a entropia da informação sobre o fenômeno é a

média da quantidade de informação que se necessita para prever cada evento, e pode

ser sumarizada com a equação 5.19 e visualizada no gráfico da figura 5.16:

( ) ii ppSEntropia ∑= 2log ( )19.5

Figura 5.16: Gráfico mostrando os valores de entropia em função da probabilidade.

A entropia (S) tem máximo valor para (log2Pi) se Pi = Pj para qualquer i ≠ j e a

entropia seria igual a zero, se existe um i tal que pi = 1, ou seja, todos os elementos da

mesma classe. Por exemplo, se P for dado por (0,5; 0,5), então a entropia de P será

igual a 1; se P for dada por (0,67; 0,33) então a entropia de P será 0,92, e se P for

dada por (1) então a entropia será 0.

5.4.4) Ganho de Informação (Critério Gain)

O ganho de informação é definido por OSÓRIO (2001) como a redução

esperada na entropia de S causada pelo particionamento dos exemplos em relação a

um atributo escolhido A, e é dado pela equação 5.20:

0

0,5

1

0,5 10

p

Entr

opia (S)

0

0,5

1

0,5 10

p

Entr

opia (S)

82

( ) ( ) ( )v

N

v

v SEntropiaSS

SEntropiaASGanho .||||

,1∑=

−= ( )20.5

onde A é o atributo considerado, N é o número de valores possíveis que este atributo

pode assumir, e Sv é o subconjunto onde o atributo A possui o valor v. Esta equação

deve ser maximizada no domínio de atributo das classes, obtendo-se o atributo para o

qual se tem o maior ganho de informação, a fim de escolher a melhor configuração de

particionamento de um nó-pai.

Algumas pesquisas levaram à conclusão de que o critério da entropia favorece

a escolha dos atributos que levam a um maior número m de partições, sendo m a

quantidade de valores assumíveis pelo atributo A. A solução que BRAGA (2003)

apresentou para este problema considera, no momento da escolha do atributo

maximizador, o ganho da informação proporcional pela entropia das partições dos nós

filho de t (gain ratio), ou seja:

( )( )AH

SEntropiaMax ( )21.5

tal que:

( ) ( ) ( )i

N

ii tptpAH 2

1log.∑

=

−= ( )22.5

onde A é a variável aleatória para atributos das classes e p(ti) é a proporção da i-

ésima partição decorrente da divisão de t pelo atributo A em relação à partição do nó

pai. A medida H(A) denominada de Split Information é um normalizador que funciona

ajustando o ganho e a entropia S em relação ao atributo A, enquanto que a única

entropia considerada anteriormente era em relação ao atributo de classificação e

indicava o quanto melhor o atributo divide o conjunto de treino.

5.4.5) Poda

O sistema de geração de Árvores de Decisão adotado pode gerar árvores

complexas que acabam perdendo seu valor de predição. Ou seja, após construir a

Árvore de Decisão, é possível que ela esteja muito específica para o conjunto de

treinamento empregado e não classifique bem os objetos do conjunto de teste. Desta

83

forma, faz-se necessário adotar algumas medidas para tornar árvores complexas em

árvores mais simples.

Para contornar este problema e aumentar o poder de generalização da árvore

gerada, o particionamento recursivo empregado na construção das Árvores de

Decisão pode ser interrompido, permitindo a obtenção de árvores mais simples ao

decidir-se não continuar a dividir o conjunto de dados de treinamento ou removendo

retrospectivamente alguma estrutura já construída pelo método. Estas alternativas são

conhecidas como pré-poda e pós-poda, respectivamente.

Na pré-poda o procedimento é realizado durante o processo de indução da

árvore e impõe um limiar (threshold) para a proporção da classe mais freqüente na

qual o nó é forçado a ser folha, não prosseguindo o particionamento por este ramo.

Por exemplo, se a classe mais freqüente responde por mais de 80% dos objetos em

uma partição, este nó não será mais particionado.

Na pós-poda, a árvore é gerada até seu tamanho máximo e somente então

métodos de evolução confiáveis são utilizados para selecionar a árvore podada de

tamanho certo desde o modelo inicial. Isto é, se a taxa de erros de classificação for

reduzida perante uma substituição da sub-árvore por um único nó terminal, então a

árvore é podada nesta parte.

Ambos os métodos apresentam seus pontos negativos. No caso da pré-poda, o

risco seria de selecionar uma árvore sub-ótima ao interromper o crescimento da

árvore. Já na pós-poda, a ineficiência computacional em virtude de se achar domínios

onde uma árvore excessivamente grande (de milhares de nós) possa ser podada em

centenas de nós demandaria um tempo computacional grande e sem necessidade.

Desta forma, uma alternativa de parada no procedimento de crescimento da árvore é

interromper o crescimento tão logo a divisão seja considerada não-confiável.

5.5) Vantagens x Desvantagens

Muitos são os algoritmos que se propõem a extrair conhecimento de bases de

dados, e não há uma forma de determinar qual deles é o melhor, visto que um

algoritmo pode ter melhor desempenho em determinada situação e outro pode ser

mais eficiente em outro tipo. O processo de descoberta de conhecimento em grandes

bases de dados é complexo e, ainda hoje, muito dependente da experiência e do

trabalho do analista, que vai desde a formulação do problema, preparação dos dados,

análises e interpretação dos resultados, sendo o mesmo indispensável.

84

Neste estudo, foram escolhidas técnicas de inteligência artificial para avaliar o

problema de classificação proposto, em detrimento da utilização de modelos mais

tradicionais como os estatísticos, que são limitados se for levado em conta que:

A análise se torna trabalhosa devido ao grande número de variáveis a serem

investigadas.

As condições oferecidas pelos métodos estatísticos tradicionais limitam o

número de casos a utilizar, fazendo com que apenas uma pequena parte do

universo esteja disponível para a análise.

O problema envolve relacionamentos não linearmente separáveis, o que torna

difícil a aplicação de métodos tradicionais.

Porém, no universo das técnicas de inteligência artificial, cada uma delas

apresenta suas vantagens e desvantagens. Dos métodos escolhidos para este estudo,

as árvores de decisão, por exemplo, são fáceis de entender e interpretar e lidam com

variáveis sem a necessidade de um pré-processamento refinado, enquanto que as

redes neurais artificiais, apesar de serem consideradas a mais poderosa arma de

mineração de dados, possuem uma taxação de modelo “caixa-preta” devido ao seu

difícil entendimento.

De uma maneira geral, as principais vantagens da aplicação de técnicas de

inteligência artificial são:

Maior velocidade na resolução dos problemas;

A decisão é fundamentada em uma base de conhecimento;

Segurança;

Custo x Benefício;

Estabilidade;

Possibilidade de integração de ferramentas.

Dentre as desvantagens poderiam ser citadas:

A fragilidade: os sistemas gerados por estas técnicas possuem acesso a um

conhecimento altamente específico do seu domínio, não possuindo

conhecimentos mais genéricos quando a necessidade surge.

Falta de metaconhecimento, ou seja, não conseguem raciocinar sobre seu

próprio escopo. A dificuldade para generalização e para a aquisição de

conhecimento continua sendo um dos maiores obstáculos.

Validação: a medição do desempenho é difícil porque a quantificação do uso

de conhecimento em casos novos se torna muito complicada.

85

CAPÍTULO

6

6. CLASSIFICAÇÃO E SELEÇÃO DAS

AMOSTRAS Neste capítulo será descrita a metodologia empregada na seleção do conjunto de amostras utilizadas neste estudo. Ainda neste capítulo, será apresentada a classificação geoquímica mais detalhada das amostras de óleo encontradas na literatura, bem como a classificação adotada para a implementação das técnicas de inteligência artificial a serem realizadas no próximo capítulo.

6.1) Introdução

No Capítulo 3 foi apresentada uma breve revisão da classificação das rochas

geradoras e óleos recuperados na Bacia Potiguar. Neste capítulo será realizada uma

revisão mais detalhada a respeito da classificação dos óleos descobertos na bacia.

A classificação anterior teve um papel fundamental na fase inicial deste

trabalho, onde foi realizada a seleção das amostras. O sub-grupo de 200 amostras

recuperadas através da análise de cluster associada a sua distribuição geográfica, e

finalmente a uma amostragem aleatória simples, será apresentada neste trabalho

como uma alternativa à amostragem para casos onde a população apresenta

heterogeneidade no número de casos por classe, além da presença de sub-classes

contidas nas classes maiores. Desta forma, a associação destas técnicas teve como

objetivo garantir de uma forma mais concisa uma amostragem que refletisse as

características guardadas no banco de dados de amostras de óleo da bacia.

Além de subsídio à fase de seleção das amostras, o conhecimento prévio das

classes atua diretamente no resultado obtido por algoritmos que utilizam tratamento

supervisionado como forma de aprendizado, ou seja, a classe é fornecida a cada

amostra durante a etapa de treinamento. Logo, é necessário que seus pares

amostra/classe estejam devidamente elucidados de forma a não comprometer o

modelo gerado.

86

6.2) Classificação Anterior

A Bacia Potiguar teve duas principais fases exploratórias, uma na década de

70 (descoberta do Campo de Ubarana na porção offshore) e outra na década de 80

(descoberta do Campo de Mossoró na porção onshore). Foi durante a década de 80

que os trabalhos de geoquímica se tornaram rotineiros na caracterização das

amostras de óleo recuperadas na bacia em virtude da necessidade de entender

melhor o contexto geração-migração-acumulação.

O primeiro destes foi o realizado por RODRIGUES et al. (1983) em um relatório

interno do CENPES/PETROBRAS, que posteriormente foi publicado por RODRIGUES

(1983) no Boletim Técnico da Petrobras. Neste estudo, os autores utilizaram as

técnicas de cromatografia gasosa, espectrometria de massas e isótopos estáveis de

carbono para distinguir as diferentes características dos óleos até então recuperados

na bacia. Segundo estes autores, foram reconhecidas três classes de óleos (Figura

6.1). A classe de origem continental que apresentava como características principais:

valores de δ13C mais negativos que –28,0‰, ausência de esteranos (não detectados

na época, por estarem em ↓[]) e ausência ou pequena proporção de gamacerano entre

os terpanos, e distribuição simétrica das parafinas normais com valores da relação

pristano/fitano superior a dois (2,0). De uma maneira geral, estes corresponderiam aos

óleos gerados a partir de folhelhos lacustres da Formação Pendência acumulados na

própria seqüência geradora ou em seqüências geneticamente diferentes sobrepostas.

Para os óleos gerados de seqüências sujeitas a influências marinhas (seqüência

transicional) da Formação Alagamar, são destacadas como características básicas

valores de δ13C menos negativos que –26,7‰, quantidades substanciais de esteranos

e proporção de gamacerano elevada, que ao ser comparada ao composto C30 hopano

se encontra idêntica ou superior, distribuição assimétrica das parafinas normais e

relação pristano/fitano inferior a um (1,0). São exemplos para estes tipos de óleos os

produzidos pelos campos de Fazenda Belém, Rio Panon, Estreito, Alto do Rodrigues,

São Luiz, Monte Alegre, Fazenda Pocinho e Macau (Figura 6.2). Aquelas amostras de

óleo que apresentam características geoquímicas intermediárias entre os dois tipos

descritos acima seriam classificadas como uma mistura destes. Os campos de

Mossoró e Fazenda São João produzem óleos com estas características.

Os óleos recuperados na porção offshore e estudados por MELLO et al. (1984),

assim como os recuperados na porção onshore e estudados por RODRIGUES et al.

(1983), foram divididos em três grupos (Figura 6.3). Os óleos de origem continental

representados pelos Campos de Agulha 1 e 2, e pelo poço 1-RNS-27

87

Figura 6.1: Perfis cromatográficos de óleo total, fragmentogramas de massas e valores isotópicos de carbono para as três diferentes famílias de óleos encontradas na porção terrestre da Bacia Potiguar (modificado de RODRIGUES et al., 1983). Para identificação dos compostos consultar Anexo I.

Cromatograma Gasoso (Óleo Total) Hopanos (m/z 191) δ13C(‰)Esteranos (m/z 217)

NC

13

NC

14

NC

15 NC

16 NC

17PR

IN

C18

PHY

NC

19N

C20 NC

21N

C22 NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

1-SE-0001-RNLACUSTRE

40 50 60 70 80 90 100 110 120

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B TR

29A

TR29

BTS

TMTR

30A

TR30

BH

28N

OR

25H

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R G

AMH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

AUSENTES-30,7

NC

11 NC

12

NC

13

NC

14

NC

15

NC

16

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

NC

35N

C36

NC

37N

C38

9-MO-0013-RN

-27,0

40 50 60 70 80 90 100 110 120

TR19

TR20 TR

21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

70 75 80 85 90

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

S

C29

R

MISTO

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22 NC

23N

C24 NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

NC

35N

C36

1-FP-0002-RN

40 50 60 70 80 90 100 110

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

-26,1

70 75 80 85 90 95

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

S C29

R

MARINHO


NC

13

NC

14

NC

15 NC

16 NC

17PR

IN

C18

PHY

NC

19N

C20 NC

21N

C22 NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

1-SE-0001-RNLACUSTRE

40 50 60 70 80 90 100 110 120

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B TR

29A

TR29

BTS

TMTR

30A

TR30

BH

28N

OR

25H

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R G

AMH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

AUSENTES-30,7

NC

11 NC

12

NC

13

NC

14

NC

15

NC

16

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

NC

35N

C36

NC

37N

C38

9-MO-0013-RN

-27,0

40 50 60 70 80 90 100 110 120

TR19

TR20 TR

21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

70 75 80 85 90

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

S

C29

R

MISTO

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22 NC

23N

C24 NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

NC

35N

C36

1-FP-0002-RN

40 50 60 70 80 90 100 110

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

-26,1

70 75 80 85 90 95

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

S C29

R

MARINHO

88

Figura 6.2: Mapa com a localização dos principais campos da Bacia Potiguar (modificado de BERTANI et al., 1991).

89

possuem características típicas de matéria orgânica depositada em ambiente lacustre,

ou seja, cromatogramas gasosos com parafinas normais na faixa de n-C19-n-C25,

razão média pristano/n-C17 igual a 0,32, fitano/n-C18 igual a 0,11 e pristano/fitano igual

a 1,8. A distribuição dos biomarcadores nestes óleos de origem lacustre mostrou

ausência ou baixa concentração de esteranos, pequenas quantidades de gamacerano,

concentração elevada de C29 (norhopanos), razões Ts/Tm C27 (trisnorhopanos)

maiores que um (1,0) e presença de diterpanos. Para as definições das razões de

biomarcadores consultar o Anexo II. O óleo do poço 1-RNS-27 apresentou

características que o diferenciaram dos demais óleos continentais. Seu cromatograma

gasoso reflete uma tendência ao enriquecimento nas parafinas normais de menor

peso molecular, enquanto o perfil de biomarcadores mostra um empobrecimento ou

ausência dos triterpanos. Estes fatores, associados ao elevado grau API (42º API),

sugerem para este óleo um elevado grau de evolução térmica, e a presença de duas

geradoras continentais distintas na bacia, uma responsável pelo óleo do 1-RNS-27 e

outra pelo óleo recuperado no poço 1-RNS-7 no Campo de Agulha. Dos óleos

analisados no estudo de MELLO et al. (1984), apenas o recuperado no poço 1-RNS-

10A apresentou características geoquímicas que permitiram classificá-lo como de

origem marinha. Ao contrário dos óleos continentais, esta amostra apresentou

predominância de parafinas normais na faixa de n-C15-n-C17, razão pristano/ n-C17 igual

a 0,41, fitano/n-C18 igual a 0,32, razão pristano/fitano igual a 1,5 e razão isotópica de

carbono de –25,0‰. O perfil de biomarcadores apresenta presença de esteranos,

particularmente do C27 (colestano), altas concentrações de gamacerano, razão Ts/Tm

C27 inferiores a um (1,0) e a presença de diterpanos não foi constatada devido a baixa

evolução térmica do óleo. Os óleos mistos, assim como aqueles encontrados na

porção on-shore da bacia são resultado da mistura de óleos continentais e marinhos, o

que resulta em características geoquímicas intermediárias entre estes dois tipos.

MELLO et al. (op. cit.) analisaram os óleos produzidos pelos poços 1-RNS-33, 4-RNS-

35 e 1-RNS-36 e os do Campo de Ubarana, e as características principais observadas

foram razões isotópicas entre –26,0‰ e –27,5‰, cromatogramas gasosos com

distribuição bimodal das parafinas normais com predominância nas faixas de n-C13-n-

C17 e n-C25- n-C28, razão pristano/ n-C17 igual a 0,41, fitano/ n-C18 igual a 0,26 e

pristano/fitano igual a 1,72. Em relação ao perfil de biomarcadores, foi observado que

os teores de esteranos e diterpanos apresentam valores intermediários entre os óleos

marinhos e continentais. Os triterpanos, de um modo geral, não sofrem grandes

variações, pois se encontram presentes em proporções semelhantes as dos tipos

continental e marinho.

90

Figura 6.3: Perfis cromatográficos de óleo total, fragmentogramas de massas e valores isotópicos para as três diferentes famílias de óleos encontradas na porção terrestre da Bacia Potiguar (modificado de MELLO et al., 1984). Para identificação dos compostos consultar Anexo I.


LACUSTRE

-29,4

7-UB-0016-RNS

-26,3

MISTO

-25,2

MARINHO

30 40 50 60 70 80 90 100 110

NC

12

NC

13

NC

14

NC

15 NC

16

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

NC

35N

C36

NC

37N

C38

40 50 60 70 80 90 100 110

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28 NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

S

70 75 80 85 90 95

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

SC

29R

0 30 40 50 60 70 80 90 1

NC

12

NC

13

NC

14 NC

15

NC

16

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

40 50 60 70 80 90 100 110

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

70 75 80 85 90 9

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

SC

29R

1-RNS-010A-RN

20 30 40 50 60 70 80 90 100

NC

13

NC

14

NC

15 NC

16 NC

17PR

IN

C18

PHY

NC

19N

C20 NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

40 50 60 70 80 90 100 110

TR19 TR

20 TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TS TMTR

30A

TR30

BH

28N

OR

25H

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AMH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

AUSENTES

1-RNS-0013-RN


LACUSTRE

-29,4

7-UB-0016-RNS

-26,3

MISTO

-25,2

MARINHO

30 40 50 60 70 80 90 100 110

NC

12

NC

13

NC

14

NC

15 NC

16

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

NC

35N

C36

NC

37N

C38

40 50 60 70 80 90 100 110

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28 NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

S

70 75 80 85 90 95

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

SC

29R

0 30 40 50 60 70 80 90 1

NC

12

NC

13

NC

14 NC

15

NC

16

NC

17PR

IN

C18

PHY

NC

19N

C20

NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

40 50 60 70 80 90 100 110

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GAM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

70 75 80 85 90 9

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27BB

SC

27R

C28

SC

28BB

RC

28BB

SC

28R

C29

SC

29BB

RC

29BB

SC

29R

1-RNS-010A-RN

20 30 40 50 60 70 80 90 100

NC

13

NC

14

NC

15 NC

16 NC

17PR

IN

C18

PHY

NC

19N

C20 NC

21N

C22

NC

23N

C24

NC

25N

C26

NC

27N

C28

NC

29N

C30

NC

31N

C32

NC

33N

C34

40 50 60 70 80 90 100 110

TR19 TR

20 TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TS TMTR

30A

TR30

BH

28N

OR

25H

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AMH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

AUSENTES

1-RNS-0013-RN

91

Neste estudo de caracterização geoquímica de óleos da plataforma continental,

MELLO et al. (1984) concluíram também que as variações nos óleos considerados

mistos deveriam ser reflexo da diferente contribuição de óleos de origem continental e

marinha na mistura, além dos efeitos de evolução térmica.

Em CERQUEIRA (1985), os óleos recuperados na plataforma continental da

Bacia Potiguar foram agrupados, quanto a sua origem em três famílias distintas:

lacustres, marinho-evaporítico e mistos. Os óleos lacustres gerados pela seqüência

continental (folhelhos da Fm. Pendência e Mb. Upanema da F. Alagamar) possuem

teores de relativos de hidrocarbonetos saturados, aromáticos e NSO em torno de 70,

20 e 10%, respectivamente. Os valores isotópicos de carbono total variam de –28 a

30‰, teor de enxofre baixo, em torno de 0,1% e grau API ao redor de 30º. Os

resultados de cromatografia gasosa revelaram cromatogramas com predominância de

parafinas normais na faixa n-C19-n-C25, razões médias entre pristano/n-C17 iguais a

0,32, de fitano/n-C18 igual a 0,11 e pristano/fitano igual a 1,8. O autor ainda observou

que alguns cromatogramas de óleos continentais apresentam bimodalidade na

predominância das parafinas, e associa esta feição à mistura de óleos gerados por

folhelhos de duas seqüências de idade e maturação distintas (Formação Pendência do

Barremiano-Neocomiano e Membro Upanema da Formação Alagamar de idade

aptiana). No que diz respeito aos biomarcadores observou-se que os esteranos estão

ausentes ou presentes em baixas concentrações. Dentre os hopanos, o gamacerano

está presente em menor quantidade quando comparados com os óleos gerados pela

seqüência proto-oceânica, o composto C29 apresenta-se com elevadas concentrações,

a razão Ts/Tm dos trisnorhopanos em C27 é superior a 1,0.

Os óleos caracterizados como gerados pela seqüência proto-oceânica por

CERQUEIRA (1985) apresentam em seus cromatogramas gasosos predominância de

parafinas normais na faixa n-C15-n-C17, razões pristano/n-C17 igual a 0,41, fitano/n-C18

igual 0,32 e pristano/fitano igual a 1,5. A cromatografia líquida mostrou teores relativos

de hidrocarbonetos saturados, aromáticos e NSO de 51, 22 e 27%. A razão isotópica

de carbono total é de -25‰. Dentre os biomarcadores, os esteranos foi observada a

presença marcante dos C27 esteranos em maior proporção aos esteranos em C28 e

C29, já os hopanos apresentaram alta concentração de gamacerano, razão Ts/Tm em

C27 inferior a 1,0 e não foi constatada a presença dos diterpanos devido a baixa

evolução térmica das amostras estudadas por este autor.

CERQUEIRA (1985) identificou os óleos mistos da bacia segundo as seguintes

características geoquímicas, nos cromatogramas gasosos foi observada bimodalidade

na distribuição das parafinas normais, com predominância das faixas n-C13-n-C17, e n-

C25-n-C28, razões médias de pristano/n-C17 igual a 0,41, fitano/n-C18 igual a 0,26 e

92

pristano/fitano igual a 1,72. Os dados de cromatografia líquida apresentaram, em

média, teores relativos de hidrocarbonetos saturados, aromáticos e NSO de 65, 16,

19%, respectivamente. As amostras desta classe apresentaram valores de grau API

em torno de 33º, razões isotópicas de carbono em óleo total entre –25,9 e –28,1‰.

Com relação aos biomarcadores, as concentrações entre os esteranos e os hopanos

são intermediárias em relação as dos óleos caracterizados como lacustres e marinho-

evaporíticos. Os esteranos estão presentes em pequenas quantidades ou ausentes,

quando a predominância na mistura é de óleo de origem continental (Formação

Pendência e Membro Upanema da Formação Alagamar). Os hopanos, segundo o

autor, de um modo geral, não sofreram grandes variações, pois se encontram

presentes em proporções semelhantes em ambos os óleos da mistura, sendo o

gamacerano, algumas vezes, ausente ou presente em concentrações variadas.

No estudo geoquímico dos óleos do Campo de Canto do Amaro, RODRIGUES

(1989) caracterizou além da origem, a evolução térmica e a direção de biodegradação

nos óleos acumulados no Arenito Mossoró considerados como mistura de óleos

lacustres e marinhos. A comparação dos óleos dos diferentes reservatórios permitiu ao

autor observar uma série de gradativas mudanças composicionais dos mesmos, a

partir dos reservatórios mais rasos para os mais profundos. De uma forma geral, os

óleos mistos do campo de Canto do Amaro tornam-se mais leves, isotopicamente mais

negativos, apresentam uma redução nos valores de pristano/ n-C17 e fitano/ n-C18 a

medida em que se caminha em direção ao continente. Essa associação de parâmetros

foi apontada como indicativa de óleos gerados em níveis de evolução térmica

crescente, ou seja, os óleos acumulados nos reservatórios mais rasos teriam sido

gerados e representariam os óleos menos evoluídos da área do Campo de Canto do

Amaro. Os dados referentes aos biomarcadores mostram uma tendência similar

observada nas informações cromatográficas e isotópicas. Das relações utilizadas,

principalmente terpanos tricíclicos/terpanos pentacíclicos e hopanos C27 Ts/Tm podem

ser interpretadas em termos de evolução térmica e origem. Como estes óleos foram

considerados originados em uma mesma seqüência geradora (Formação Alagamar)

localizada no Graben de Boa Vista, logo a diferença composicional entre eles foi

atribuída a variações entre os níveis de evolução térmica.

MELLO (1988) e MELLO et al. (1988) através do estudo de integração de

parâmetros geoquímicos em amostras de óleo de diferentes bacias sedimentares

brasileiras separaram os óleos pertencentes a Bacia Potiguar em dois grupos

principais. O primeiro grupo é composto pelas amostras de óleo que possuem

predominância de n-alcanos de alto peso molecular (>n-C23), razão pristano/fitano

elevadas (>1,0) e valores de δ13C menores que –28,0‰. A distribuição dos

93

biomarcadores baseada na presença ou ausência de compostos específicos sugere

aos óleos deste grupo uma origem lacustre associada a folhelhos típicos do

Neocomiano ao Aptiano. Em geral, as amostras deste grupo possuem baixa

concentração de esteranos e ausência de C30 esteranos, predominância de C27 sobre

C29 esteranos. Os terpanos possuem alta abundância do composto C24 tetracíclico

terpano, o pico dominante no fragmentograma de massas m/z 191 (terpanos) é o C30

hopano na faixa C27 a C35, estando o C28 ausente, o C27 Ts domina sobre o seu

isômero Tm determinado a razão Ts/Tm superior a 1,0. O segundo grupo são

representados pelos óleos gerados pelos folhelhos e margas marinho-evaporíticos,

estas amostras apresentam razão pristano/fitano menor que 0,6, valores de δ13C entre

–25,4 e -26,6‰. Os esteranos ocorrem em altas concentrações, sendo os diasteranos

em menores proporções, principalmente em C27, dentre os esteranos regulares ocorre

a dominância do C27 sobre o C28 e C29. O composto C30 esterano é detectado nas

amostras deste grupo. Os terpanos apresentam abundância de gamacerano,

predominância de H35 sobre H34 homopanos, presença de C28 (bisnorhopano), altas

abundâncias dos hopanos entre C29 e C35, e razão Ts/Tm (<1,0).

No trabalho de caracterização geoquímica dos óleos da Bacia Potiguar,

SANTOS NETO et al. (1990) observaram que os óleos acumulados na bacia

apresentavam características peculiares herdadas do ambiente deposicional das

rochas geradoras, ou seja, marinho evaporítico (Fm. Alagamar) e continental (Fm.

Pendência).

Os óleos gerados na seção continental apresentam as seguintes

características principais: em seus cromatogramas gasosos dominam o baixo índice

preferencial de carbono, razões pristano/n-C17 e fitano/ n-C18 com valores

relativamente baixos e presença marcante das parafinas normais de alto peso

molecular (>n-C23); dentre as características nos fragmentogramas de massas do íon

m/z 191(terpanos), observa-se nos óleos continentais a ausência ou baixa razão

bisnorhopano/hopano, elevada razão C34/C35 homopanos, razão Ts/Tm>1, e baixa

proporção relativa do composto gamacerano em relação ao composto hopano. No

fragmentograma de massas m/z 217 (esteranos), estes óleos apresentam predomínio

de C29 sobre C27 e C28 esteranos e abundância de diasteranos. Os esteranos, de uma

forma geral, se encontram praticamente ausentes, e quando presentes em

abundâncias mensuráveis, as razões ααβ/(ααα+αββ) e S/(S+R) dos compostos em C29

já atingiram o seu equilíbrio, sugerindo óleos com elevada evolução térmica; em

termos isotópicos, os valores de isótopos estáveis de carbono dos óleos contientais

apresentam valores <-28,0‰. Estes óleos estão concentrados na parte terrestre da

bacia, ao sul do alinhamento estrutural que passa a norte dos Campos de Fazenda

94

Curral, Serraria e Janduí, sendo o óleo de Nordeste do Morro do Rosado no Graben

de Boa Vista a única exceção (Figura 6.4). Estes óleos foram gerados pelos folhelhos

da Fm. Pendência, seqüência continental geradora na bacia (SANTOS NETO et al.,

1990).

Figura 6.4: Mapa com a distribuição geográfica dos diferentes tipos de óleos encontrados na Bacia Potiguar terra (modificado de SANTOS NETO et al., 1990).

Os óleos classificados como marinho-evaporíticos por SANTOS NETO et al.

(1990) apresentam alto teor de enxofre (>0,5%) quando comparados com outros óleos

brasileiros, seus valores isotópicos de carbono são relativamente pesados (>-26,6‰) e

os cromatogramas gasosos apresentam predominância de alcanos de baixo peso

molecular (<n-C19) e de isoalcanos i-C25 e i-C30. O fragmentograma de massas do íon

m/z 191 mostra presença marcante dos compostos gamacerano e bisnorhopano em

relação ao hopano, baixas razões entre os compostos C34/C35 e Ts/Tm. Já no

fragmentograma de massas do íon m/z 217, os compostos em C27 predominam sobre

os em C28 e C29 e ocorre baixa proporção relativa dos esteranos de baixo peso

molecular. Óleos com estas características se encontram acumulados nos campos

localizados ao longo do Sistema de Falhas de Carnaubais e Alto de Macau (Estreito,

Rio Panon, São Pedro, Alto do Rodrigues, Palmeiras, Fazenda Pocinho e Guamaré)

tendo sido gerados pelos níveis depositados em ambientes evaporíticos com influência

marinha das Camadas Ponta do Tubarão da Fm. Alagamar (Figura 6.4).

95

Ainda neste trabalho, SANTOS NETO et al. (1990) classificaram como mistos

os óleos acumulados na plataforma continental dos Campos de Ubarana, Aratum e

áreas dos poços RNS-36 e RNS-43 (próximas ao Alto de Macau) e os óleos da porção

emersa da bacia, como os dos campos localizados ao longo da Linha de Charneira de

Areia Branca (Campos de Canto do Amaro, Mossoró, Cajazeira, Alto da Pedra, Salina

Vermelha e Redonda) (Figura 6.4). Estes óleos apresentam características

geoquímicas ora relacionadas a ambiente lacustre, ora a ambiente marinho

hipersalino, tendo sido gerados pelos folhelhos lacustres da Fm. Pendência ou do

Membro Upanema, e pelos folhelhos e margas das Camadas Ponta do Tubarão e

Membro Galinhos, respectivamente.

Estes autores ressaltam que é comum os óleos marinho-evaporíticos e mistos

apresentarem biodegradação. Quando a biodegradação é incipiente é possível apenas

notar um decréscimo relativo dos alcanos normais de baixo peso molecular, porém em

outros casos a biodegradação agiu severamente, eliminando quase todos os alcanos

normais e causando a desmetilação dos hopanos (Figura 6.5).

Figura 6.5: Cromatogramas gasosos de quatro amostras de óleo mostrando diferentes níveis

de biodegradação.

A presença marcante de óleos com diferentes contribuições dos óleos gerados

pela seção lacustre (folhelhos da Fm. Pendência e Mb. Upanema da Fm. Alagamar) e

pela marinho-evaporítica (folhelhos e margas do Mb. Galinhos e Camadas Ponta do

96

Tubarão da Fm. Alagamar) levou TRINDADE (1992) e TRINDADE et al. (1992) a

estudarem em detalhe as variações na composição dos biomarcadores e dos

parâmetros de evolução térmica destes óleos com intuito de entender melhor a

distribuição dos óleos classificados como mistos, bem como explicar a migração e o

preenchimento dos reservatórios ao longo da bacia. Primeiramente, destacaram como

características discriminantes entre óleos de origem continental versus marinhos: no

íon m/z 191, o alto índice de tricíclicos1 (>50) para os óleos de origem lacustre em

contrapartida com os valores mais baixos dos óleos de origem marinho-evaporítica,

índice de gamacerano2 variável com a salinidade do ambiente deposicional,

acarretando altos valores nos óleos marinhos (>60) e menores nos lacustres (<50),

índice de bisnorhopano3 significantemente baixo em amostras lacustres (<5) em

relação às marinhas (>10) e razão C34/C35 normalmente superior a 1,0 em amostras

marinhas; no íon m/z 217, aqueles autores destacam que a concentração de C27

20S+20R 14α(H), 17α(H) esteranos é comumente baixa em óleos lacustres (<50 ppm)

e alta em marinhos (>800 ppm); a relação entre hopanos/esteranos é alta nas

amostras classificadas como lacustres e baixa nas classificadas como marinhas; a

presença do composto C30 esterano, detectado por cromatografia gasosa acoplada à

espectrometria de massas acoplada à espectrometria de massas (CG-EM-EM), em

amostras marinhas e ausência do mesmo em amostras lacustres.

Para os óleos mistos, TRINDADE (1992) e TRINDADE et al. (1992)

observaram que a baixa concentração dos compostos bisnorhopano e gamacerano,

que nos óleos marinho-evaporíticos, está relacionada a maior distância de migração

dos óleos, o que sugere que a contribuição de óleos lacustres é maior à medida que

se distancia da cozinha de geração. Assim como ocorre com os parâmetros de fonte,

observa-se também com os de evolução térmica, que a medida em que as

acumulações se encontram localizadas mais distantes da cozinha de geração, situada

na porção marítima da bacia, os óleos apresentam uma menor evolução térmica.

Assim, os óleos, que migraram maior distância possuem uma maior contribuição de

óleos de origem lacustre, visto que a fase inicial de geração de petróleo ocorreu nas

fácies lacustres basais da Fm. Alagamar (Mb. Upanema), tendo o óleo migrado e

preenchido os reservatórios mais rasos e distantes da porção marítima onde a Fm

Alagamar gerou petróleo.

Os óleos acumulados ao longo do Alinhamento de Carnaubais e do Alto de

Macau estudados por SANTOS NETO et al. (1995) apresentam valores de enxofre em 1 Índice de Tricíclicos = soma de C19 a C29 (excluindo-se C22 e C27) terpanos tricíclicos/17α(H),21β(H)-hopano. 2 Índice de Gamacerano = área do gamaceranox100/17α(H),21β(H)-hopano. 3 Índice de Bisnorhopano = área do 28,30-bisnorhopanox100/17α(H),21β(H)-hopano.

97

torno de 0,5% atingindo, em alguns casos, como em óleos biodegradados valores da

ordem de 0,9%. A composição isotópica é muito similar entre os óleos destas áreas,

com valores de δ13C em torno de –26,0‰. A diferenciação em termos de origem só

pôde ser estabelecida após a análise dos resultados de cromatografia gasosa e

espectrometria de massas, que revelaram dois grupos de óleos característicos para os

óleos recuperados no Alinhamento de Carnaubais e Alto de Macau.

O primeiro grupo é composto pelos óleos classificados como marinho-

evaporíticos dos campos de Guamaré, Palmeira, Fazenda Pocinho, Monte Alegre, Alto

do Rodrigues, São Luiz, Estreito, Rio Panon, São Pedro, Conceição, Salina Cristal,

Macau e Soledade. Estes óleos apresentam nos cromatogramas gasosos razão

pristano/fitano inferior a 1,0, distribuição de n-alcanos (nos óleos com menor

biodegradação aparente) com predominância dos compostos entre n-C16 e n-C20,

notável presença de iso-alcanos com 25 e 30 átomos de carbono, além da presença

do composto β-carotano na maioria destes óleos. No perfil de biomarcadores do íon

m/z 191, é observada uma abundância relativa dos compostos pentacíclicos sobre o

tricíclicos, razão gamacerano/hopano superior a 0,80, Ts maior que o Tm, razão entre

os homohopanos (22S e 22R) em C34 e C35 próxima a 1,0, além da presença dos

compostos trisnorhopano e bisnorhopano. Entre os esteranos íon m/z 217 ocorre a

predominância dos compostos com 27 átomos de carbono sobre aqueles com 28 e 29,

e uma baixa proporção relativa de diasteranos em relação aos esteranos.

O segundo grupo é constituído pelos óleos mistos que estão localizados

restritamente, na área de estudo, à porção submersa do Alto de Macau. Estes óleos

apresentam em seus cromatogramas gasosos predominância de n-alcanos entre n-C14

e n-C18, com decréscimo contínuo nos n-alcanos com moléculas sucessivamente

maiores, até n-C40, razão pristano/fitano superior a 1,0, e ausência ou baixa

concentração do composto β-carotano. Entre os hopanos (íon m/z 191), apresentam

maior abundância relativa dos compostos tricíclicos sobre os pentacíclicos, razão

gamacerano/hopano inferior a 0,80, predominância do Ts sobre o Tm, e razão entre os

homohopanos (22S e 22R) em C34 e C35 superior a 1,0. Com relação aos esteranos

(íon m/z 217), os óleos apresentaram predominância dos compostos com 27 átomos

de carbono sobre aqueles com 28 e 29, e proporção de diasteranos em relação aos

esteranos mais elevada que no caso dos óleos classificados como marinho-

evaporíticos do primeiro grupo.

Assim como MELLO et al. (1984), TRINDADE (1992) e TRINDADE et al. (1992)

observaram que as variações nas características dos óleos mistos são função da

diferente contribuição dos end-members lacustre e marinho-evaporítico na mistura,

SANTOS NETO et al. (1995) também destacaram que este é o principal condicionante

98

à grande variedade de características geoquímicas nos óleos deste grupo, e

apontaram, neste sentido, que a amostra de óleo recuperado no poço 3-RNS-74-RN é

a que apresenta maior contribuição de óleo lacustre.

SANTOS NETO (1996) e SANTOS NETO & HAYES (1999) caracterizaram 26

amostras de óleos da Bacia Potiguar, porção terrestre, representados nas três

diferentes classes: marinho-evaporítico, lacustre e misto. Os óleos marinho-

evaporíticos apresentaram como principais feições cromatográficas razão

pristano/fitano inferior a um (1,0), distribuição das n-parafinas proeminente na região

de n-C16-n-C18, abundante presença dos compostos i-C25, i-C30 e β-carotano; os perfis

de massas mostram para as razões hopanos/esteranos e Ts/(Ts+Tm) valores

relativamente baixos, predominância de pentacíclicos sobre os tricíclicos, razões

bisnorhopano/hopano e gamacerano/hopano com valores elevados, perfil bem

definido para a série dos homopanos estendidos até C35. Nos esteranos, predominam

os compostos em C27 sobre os C28 e C29 havendo, baixa ou muito baixa concentração

de diasteranos; em termos isotópicos, os óleos marinho-evaporíticos se encontram

depletados em deutério (D) e enriquecidos em δ13C, com valores de δ variando de –

135 a –114‰, e –26,5 a –25,7‰, respectivamente.

Nos óleos lacustres, SANTOS NETO (1996) e SANTOS NETO & HAYES

(1999) destacaram que existe nos cromatogramas gasosos uma leve predominância

de parafinas com números ímpares de carbono sobre aquelas que possuem números

pares, razão pristano/fitano alta (1,3 a 2,2), presença de n-alcanos de elevado peso

molecular (por exemplo, superiores a n-C38) e distribuição de n-alcanos típica de óleos

parafínicos cerosos; possuem altas razões hopanos/esteranos (6,1 a 15), entre os

terpanos apresentam maior abundância de tricíclicos em relação aos pentacíclicos,

baixa razão gamacerano/hopano, o composto bisnorhopano está ausente, ou quando

presente, em baixíssima concentração, assim como os homopanos em C33, C34 e C35.

Dentre os esteranos, observa-se a predominância de compostos em C29 e C27 sobre

os em C28, e a presença mais relevante de diasteranos quando comparados com os

óleos marinho-evaporíticos; são enriquecidos em deutério e depletados em 13C, os

valores de δD e δ13C variam de –101 a –88‰ e –33,6 a –30,2‰, respectivamente.

Os óleos mistos analisados por SANTOS NETO (1996) e SANTOS NETO &

HAYES (1999) possuem características nos cromatogramas gasosos e

fragmentogramas de massas intermediárias entre os óleos marinho-evaporíticos e

lacustres. Com relação ao sinal isotópico, os autores destacam que os valores de δD e

δ13C variam de –113 a –104‰ e –27,7 a –26,1‰, respectivamente.

99

Ainda neste estudo, os autores propuserem uma forma de quantificar a

contribuição dos diferentes end-members, a partir dos resultados de δD ou δ13C,

segundo a equação 6.1:

( )melacmememix ff −+= 1δδδ ( )1.6

onde:

δmix pode ser δD ou δ13C do óleo misto;

δme pode ser δD ou δ13C do óleo marinho evaporítico;

δlac pode ser δD ou δ13C do óleo lacustre;

fme é a fração de contribuição do óleo marinho evaporítico na mistura, e

(1- fme) é a fração de contribuição do óleo lacustre na mistura.

SANTOS NETO & TAKAKI (2000) estudaram as diferenças entre os óleos

classificados como lacustre na Bacia Potiguar, porção terrestre. Estes óleos

apresentam variações significantes em suas composições isotópicas e moleculares,

sendo então divididos em duas famílias pelos autores. Entre os resultados de

Cromatografia Gasosa e Espectrometria de Massas acoplada à Cromatografia Gasosa

as principais diferenças são observadas nas razões: pristano/fitano (valores em torno

de 3,0 para a Família I e em torno de 2,5 para a Família II), hopanos/esteranos

(valores inferiores a 17 para a Família I e superiores a 20 para a Família II) e

tricíclicos/pentacíclicos (valores inferiores a 0,2 para a Família I e em torno de 1,0 para

a Família II). O valor de isotópico de carbono total é o parâmetro mais importante para

distinguir as duas famílias de óleos lacustres reconhecidos como gerados pela

Formação Pendência, a Família I possui valores de δ13C maiores que –30,00‰ e a

Família II menor que –31,00‰. SANTOS NETO & TAKAKI (2000) associam estas

variações a heterogeneidades nos fácies orgânicos geradores da Formação

Pendência ao longo do tempo.

Durante o desenvolvimento do estudo do risco exploratório em reservatórios

portadores de óleos biodegradados, MAGNIER & PENTEADO (2000) caracterizaram

geoquimicamente os óleos do Trend de Carnaubais. Dentre as características

principais destacam-se grau API variando de 14 a 24º, porcentagem de compostos

saturados entre 39 e 66%, porcentagem de compostos NSO entre 18 e 36% e

isótopos estáveis de carbono total entre –25,5 e –27,0‰. Na maioria dos reservatórios

rasos foi observada depleção de n-alcanos, sendo ainda observado isoprenóides

como pristano e fitano nos óleos localizados a NE do trend, e nos óleos recuperados a

SW é observado, na maioria, apenas a UCM. Os dados de biomarcadores refletem

100

uma mistura de diferentes matérias orgânicas de ambiente marinho-evaporítico

associadas à Formação Alagamar, como por exemplo, altos valores para as razões:

H35/H34 homopanos, TET24/26TRI, H29/H30 e gamacerano/hopano; baixos valores

para a razão hopanos/esteranos. As amostras apresentam boa correlação de

parâmetros moleculares indicativos de evolução térmica com a profundidade como,

por exemplo, αββ/(αββ+ααα) e S/(S+R), exceto nos campos de Guamaré, Fazenda

Pocinho e Palmeira. A respeito da biodegradação, os autores destacam que a

intensidade de biodegradação caminha da região offshore no extremo NE do trend em

direção ao continente até os campos de Rio Panon e São Pedro. A alteração nos

parâmetros de biomarcadores só foi evidenciada nos óleos onde a biodegradação foi

mais intensa.

PARENTE (2006) estudou os óleos recuperados nos Campos de Baixa do

Algodão, Fazenda Malaquias, Alto do Rodrigues, Fazenda Pocinho, Guamaré, Pajeú e

São Miguel, e a partir de parâmetros como grau API, cromatografia gasosa, isótopos

de carbono e biomarcadores, separou os óleos através de análise de cluster e

componentes principais em dois grupos principais. O primeiro grupo é composto pelos

óleos dos Campos de Fazenda Malaquias e Baixa do Algodão. Estes são classificados

como lacustres por apresentarem elevada razão hopano/esterano (>10,0), baixa razão

gamacerano/hopano (≈0,20), elevada razão pristano/fitano (>3,0), elevada razão

C26/C25 tricíclicos (>1,7), baixa razão H35/H34 homopanos (<0,5), elevada razão

diasteranos/C27ααα (>0,6) e valores ide isótopo de carbono em torno de –30,0‰. Os

óleos do segundo grupo compreendem os Campos de Alto do Rodrigues, Fazenda

Pocinho, Guamaré, Pajeú e São Miguel e possuem características relacionadas aos

óleos marinho-evaporíticos da bacia, são elas: baixa razão hopano/esterano (<3,0),

moderada a elevada razão gamacerano/hopano (>0,5), baixa razão pristano/fitano

(<1,5), baixa razão C26/C25 tricíclicos (<1,5), elevada razão H35/H34 (>0,7), baixa razão

diasteranos/C27ααα (<0,2), isotopicamente apresentam valores de δ13C mais pesados

que –26,0‰. Neste segundo grupo, a autora destaca que os óleos dos Campos de

Pajeú e São Miguel apresentam características geoquímicas ligeiramente diferentes

(são mais depletados em δ13C e apresentam valores da razão gamacerano/hopano

inferiores) dos demais óleos pertencentes ao mesmo grupo.

BEHAR et al. (2006) estudaram as perdas de hidrocarbonetos durante os

processos de biodegradação. Para realização do estudo os autores selecionaram 12

amostras de óleo recuperadas ao longo do Trend de Carnaubais, sendo três de óleos

não biodegradados e nove de óleos biodegradados. Dentre as características

ressaltadas pelos autores em termos de biomarcadores estão o aumento da

concentração de hopanos e esteranos nos óleos mais biodegradados, embora não

101

tenha sido observado o aumento contínuo com o avanço da biodegradação. A razão

25-norhopano/C30 Hopano (m/z 177) não mostra variações significativas com a

biodegradação e os valores para as amostras biodegradados possuem faixas

semelhantes às amostras não biodegradadas.

J.V.P.GUZZO (Inf. Verbal) apresentou um refinamento a respeito dos óleos

classificados como lacustre. Anteriormente, estes óleos eram considerados apenas

lacustres, porém GUZZO propõe uma subdivisão baseada na hipótese de alguns

destes óleos, em particular os localizados no Graben de Apodi, apresentarem a razão

diasteranos/C27ααα elevada (>0,5) chegando até valores como três (3,0). A elevada

abundância relativa de diasteranos é relacionada a geradores associados a ambientes

com alto aporte sedimentar (PETERS et al., 2005). Desta forma, os óleos que

possuem esta razão elevada podem estar associados a um fácies mais siliciclástico do

gerador lacustre. Além desta razão, GUZZO também observou para estes óleos,

variações nas razões 19/23TRI e TET24/26TRI, que já foram reportadas na literatura

(PHILP & GILBERT, 1986, ISAKSEN, 1995 e PETERS et al., 2005) como indicadoras

de ambientes com alto aporte de sedimentos terrígenos.

Em resumo, os dados geoquímicos apontam para a presença de pelo menos

três classes de óleos pertencentes à porção terrestre da Bacia Potiguar sumarizados

na Tabela 6.1. Os óleos lacustres gerados pelos folhelhos lacustres da Formação

Pendência e Mb. Upanema da Fm. Alagamar, os óleos marinho-evaporíticos gerados

pelos folhelhos e margas da Formação Alagamar e os óleos mistos resultado da

mistura em diferentes proporções dos óleos lacustres (Pendência e/ou Upanema) e

marinho-evaporíticos.

102

Tabela 6.1: Parâmetros geoquímicos diagnósticos adotados para discriminação genética de óleos na Bacia Potiguar.

Classe Autor (es) Lacustre Marinho-Evaporítico Misto

RODRIGUES et al., 1983 e RODRIGUES, 1983

Distribuição simétrica entre as n-parafinas. pristano/fitano > 1,0. δ13C < -28,0‰ . Ausência de esteranos. Ausência ou baixa proporção de gamacerano.

Distribuição assimétrica entre as n-parafinas. pristano/fitano < 1,0. δ13C < -26,7‰ . Elevada concentração de esteranos. Alta proporção de gamacerano.

Valores intermediários entre os apresentados pelos óleos lacustres e marinho-evaporítico.

MELLO et al., 1984

Predominância de n-parafinas entre n-C14-n-C25. Razão pristano/n-C17=0,32. Razão fitano/n-C18=0,11. Razão pristano/fitano=1,8. Ausência ou baixa concentração de esteranos. Baixa proporção de gamacerano. Alta proporção de C29. Razão Ts/Tm > 1.

Predominância de n-parafinas entre n-C15-n-C17. Razão pristano/n-C17=0,41. Razão fitano/n-C18=0,32. Razão pristano/fitano=1,5. δ13C > -25,0‰ . Presença de esteranos. Alta proporção de gamacerano. Razão Ts/Tm < 1.

Predominância de n-parafinas entre n-C13-n-C17 e n/C25-n-C28. Razão pristano/n-C17=0,41. Razão fitano/n-C18=0,26. Razão pristano/fitano=1,72. δ13C < -26,0 e -27,5‰ . Concentração de biomarcadores intermediária aos óleos lacustres e marinho-evaporíticos.

CERQUEIRA, 1985

%S=0,1 ºAPI=30 Predominância de n-parafinas entre n-C19-n-C25. Razão pristano/n-C17=0,32. Razão fitano/n-C18=0,11. Razão pristano/fitano=1,8. Ausência ou baixa concentração de esteranos. Baixa proporção de gamacerano. Alta proporção de C29. Razão Ts/Tm > 1.

Predominância de n-parafinas entre n-C15-n-C17. Razão pristano/n-C17=0,41. Razão fitano/n-C18=0,32. Razão pristano/fitano=1,5. δ13C > -25,0‰ . Presença de esteranos. Alta proporção de gamacerano. Razão Ts/Tm < 1.

Predominância de n-parafinas entre n-C13-n-C17 e n/C25-n-C28. Razão pristano/n-C17=0,41. Razão fitano/n-C18=0,26. Razão pristano/fitano=1,72. δ13C < -25,9 e -28,1‰ . Concentração de biomarcadores intermediária aos óleos lacustres e marinho-evaporíticos.

MELLO, 1988 e MELLO et al., 1988

n-alcanos de alto peso molecular (>n-C23). Pristano/fitano > 1. δ13C < -28,0‰. Baixa concentração de esteranos. Ausência de C30 esterano. C27 esteranos > C29 esteranos. Alta abundância de C24 TET. Ts>Tm.

Pristano/fitano < 0,6. δ13C=-25,0 a - 26,6‰. Alta concentração de esteranos. Presença de C30 esterano. C27 esteranos > C28 e C29 esteranos. Alta abundância de gamacerano. H35>H34 homopanos. Ts<Tm.

-----------

103

Tabela 6.1: Parâmetros geoquímicos diagnósticos adotados para discriminação genética de óleos na Bacia Potiguar (continuação).


SANTOS NETO et al., 1990

Baixo CPI. n-alcanos de alto peso molecular (>n-C23). Razão pristano/n-C17 baixa. Razão fitano/n-C18 baixa. δ13C < -28,0‰ . Baixa proporção de gamacerano. Ts/Tm > 1,0. H34>>H35. Alta proporção de C29 sobre C27 e C28 esteranos. Razões de ααβ/(ααα+αββ) e S/(S+R) em C29 já equilibradas.

Baixo CPI. n-alcanos de baixo peso molecular (<n-C19). Presença de isoalcanos i-C25 e i-C30. δ13C > -26,6‰ . Alta proporção de gamacerano e bisnorhopano. Ts/Tm << 1,0. H34<<H35. Alta proporção de C27 sobre C28 e C29 esteranos.

Estes óleos apresentam características ora de ambiente lacustre ora de ambiente marinho-evaporítico.

TRINDADE, 1992 e TRINDADE et al., 1992

Baixo Índice de tricíclicos, de gamacerano e bisnorhopano. Razão H34/H35 < 1,0. Baixa concentração de C27 esteranos (<50ppm). Razão hopanos/esteranos alta. Ausência de C30 esterano.

Alto Índice de tricíclicos, de gamacerano e bisnorhopano. Razão H34/H35 > 1,0. Alta concentração de C27 esteranos (>800ppm). Razão hopanos/esteranos baixa. Presença de C30 esterano.

Os óleos apresentam características intermediárias aos end-members, e a predominância em determinados parâmetros é função da diferente contribuição de cada end-member à mistura.

SANTOS NETO et al., 1995 -----------

Predominância de n-parafinas entre n-C16-n-C20. Presença de isoalcanos i-C25 e i-C30. Presença de β-carotano. Razão pristano/fitano<1,0. Predominância de C27 sobre C28 e C29 esteranos. Baixa proporção relativa de diasteranos sobre esteranos. Razão gamacerano/hopano > 0,8. Ts>Tm.

Predominância de n-parafinas entre n-C14-n-C18. Decréscimo contínuo das n-parafinas até n-C40. Presença de β-carotano em baixa proporção ou ausência. Razão pristano/fitano>1,0. Predominância de C27 sobre C28 e C29 esteranos. Maior proporção relativa de diasteranos sobre esteranos. H34/H34>1,0. Razão gamacerano/hopano < 0,8. Ts>Tm.

104

Tabela 6.1: Parâmetros geoquímicos diagnósticos adotados para discriminação genética de óleos na Bacia Potiguar.


SANTOS NETO, 1996 e SANTOS NETO & HAYES, 1999

Presença de n-parafinas de alto peso molecular (>n-C38). Razão pristano/fitano alta. δ13C -33,6 a –30,2‰ . δD -101 a -88‰ . Alta razão hopano/esterano. Baixa razão gamacerano/hopano. Bisnorhopano presente em baixa concentração ou ausente. Predominância de C29 sobre C27 e C28 esteranos. Proporção de diasteranos maior quando comparados aos óleos marinho-evaporíticos.

Predominância de n-parafinas entre n-C16-n-C18. Razão pristano/fitano<1,0. Presença de isoalcanos i-C25 e i-C30. Presença de β-carotano. δ13C -26,5 a -25,7‰ . δD -135 a -114‰ . Razões hopanos/esteranos e Ts/(Ts+Tm) baixas. Razões bisnorhopano/hopano e gamacerano/hopano elevadas. Predominância de C27 sobre C28 e C29 esteranos. Predominância de esteranos sobre diasteranos.

Possuem características em seus cromatogramas gasosos e fragmentogramas de massas intermediárias entre os óleos lacustres e marinho-evaporíticos. O sinal isotópico de δ13C -27,7 a –26,1‰ . δD -113 a -104‰ .

SANTOS NETO & TAKAKI, 2000

Família I: Razão pristano/fitano≈ 3,0. Razão hopanos/esteranos<17. Razão tricíclicos/pentacíclicos<0,2. δ13C> -30,0‰ . Família II: Razão pristano/fitano≈ 2,5. Razão hopanos/esteranos>20. Razão tricíclicos/pentacíclicos≈ 0,1. δ13C< -31,0‰ .

----------- -----------

MAGNIER & PENTEADO, 2000 -----------

Amostras, em maio parte, depletadas em n-alcanos e isoprenóides. δ13C -27,0 a –25,6‰ . Razão hopanos/esteranos baixa. Razões H35/H34, H29/H30, 24TET/26TRI, e gamacerano/hopano altas. Boa correlação entre parâmetros de evolução térmica com a profundidade.

-----------

PARENTE, 2006

Razão pristano/fitano>3,0. δ13C≈ -30,0‰ . Razão hopanos/esteranos>10,0. Razão gamacerano/hopano≈0,2. Razão 26/25TRI>1,7. Razão H35/H34<0,5. Razão Diasteranos/C27ααα>0,6.

Razão pristano/fitano<1,5. δ13C> -26,0‰ . Razão hopanos/esteranos<3,0. Razão gamacerano/hopano>0,5. Razão 26/25TRI<1,5. Razão H35/H34>0,7. Razão Diasteranos/C27ααα<0,2.

----------

105

6.3) Metodologia para Seleção das Amostras

Um dos grandes desafios enfrentado por grande parte dos pesquisadores que

trabalham com vasto número de amostras é realizar uma amostragem que represente

de uma forma concisa as características da população com um pequeno número de

casos.

Amostragem significa obter informação sobre um todo, a população,

examinando-se apenas uma parte do mesmo, a amostra (COSTA, 1998). Para isso, a

amostra deve ser representativa da população e, para uma amostra ser

representativa, cada item da população deve ter a mesma chance de ser selecionado.

Porém, de acordo com o descrito acima, uma amostragem aleatória simples no

conjunto de amostras pertencentes ao banco de dados da Gerência de Geoquímica do

CENPES/PETROBRAS não resultaria em uma amostragem realista, ou seja, classes

de óleos que possuem pequeno número de casos e ocorrem em porções restritas da

bacia seriam desfavorecidas em função da presença conspícua de classes com maior

número de casos e amplamente distribuídas ao longo da bacia. Adicionalmente, ocorre

heterogeneidade presente dentro das classes, o que acarreta a presença de sub-

classes. Estes sub-grupos são decorrentes de variações advindas de diferentes fácies

geradoras, graus de evolução térmica variantes ao longo da bacia, amostras alteradas

em diferentes níveis por processos secundários (p. ex.: biodegradação) e o que mais

caracteriza o conjunto de amostras desta bacia, que são as diferentes proporções de

misturas de end-members nos óleos classificados como mistos. E estes sub-grupos

não podem sofrer prejuízos em sua representação, pois os mesmos ilustram os casos

ímpares na bacia e devem fazer parte do modelo gerado.

Frente a este obstáculo, qual seria a melhor metodologia a seguir para garantir

que a amostragem seria eficiente? Então foi proposto como uma alternativa a

associação de uma análise de cluster prévia e, posteriormente, uma amostragem

aleatória simples.

A análise de cluster (que será discutida no item 6.3.2) separou inicialmente em

k grupos todo o conjunto de casos pertencentes a óleos da porção terrestre da Bacia

Potiguar no banco de dados da Gerência de Geoquímica do CENPES/PETROBRAS,

estes grupos obtidos foram posteriormente plotados sob a forma de mapa, onde foi

observada a distribuição espacial destes ao longo da bacia. Após esta etapa, os

grupos gerados foram separados em diferentes planilhas eletrônicas (uma planilha

para cada grupo) para então ser realizada a amostragem aleatória considerando uma

porcentagem, x%, que respeitasse a proporcionalidade das amostras pertencentes a

106

aquele grupo, até que as duzentas amostras utilizadas neste estudo fossem

recuperadas. Posteriormente, estas duzentas amostras foram replotadas em mapa

para garantir que toda a bacia tinha sido amostrada. Caso alguma região estivesse

desfavorecida, uma nova amostragem seria realizada, aleatória ou imparcialmente, e

finalmente, as novas amostras reclassificadas segundo a classificação a ser adotada

(Figura 6.6).

Figura 6.6: Fluxograma mostrando as etapas seguidas para a seleção das amostras.

6.3.1) Análise Exploratória

A análise exploratória de dados possui importância estratégica em qualquer

processamento de dados. As características estatísticas do conjunto de dados de

entrada determinarão a qualidade e confiabilidade estatística dos resultados de saída.

A presença de outliers, de variáveis dotadas de naturezas matemáticas diferentes,

diferentes grandezas e/ou multicorrelacionadas entre si são fatores determinantes nos

resultados dos processamentos realizados.

Banco de Dados

Análise de cluster.

Grupo 1 Grupo 2 GrupoK...

(Visualização da distribuição dos dados em mapa.)

Amostras plotadas em mapa para obvervar a distribuiçãoao longo da bacia.

REDISTRIBUIÇÃO NAS CLASSESCONHECIDAS A PRIORI.

Seleção aleatória para cada grupo gerado.

Visualização das amostras em mapa

Amostragem realizada, dadosprontos para os próximos passos.

OKNÃO

Banco de Dados

Análise de cluster.

Grupo 1 Grupo 2 GrupoK...

(Visualização da distribuição dos dados em mapa.)

Amostras plotadas em mapa para obvervar a distribuiçãoao longo da bacia.

REDISTRIBUIÇÃO NAS CLASSESCONHECIDAS A PRIORI.

Seleção aleatória para cada grupo gerado.

Visualização das amostras em mapa

Amostragem realizada, dadosprontos para os próximos passos.

OKNÃO

107

Na fase de seleção de amostras, a análise exploratória foi aplicada a fim de

detectar outliers e eliminar dados ausentes, buscando reduzir possíveis

inconsistências nos dados. Posteriormente, os valores foram transformados para um

formato padronizado, deixando-os com a mesma importância dentro do modelo, visto

que a utilização de análise de cluster requer que as variáveis possuam a mesma

grandeza escalar para que o modelo não seja comprometido por mudança de escalas

entre as variáveis.

Assim, o método definido para a análise estatístico-exploratória dos dados

originais consolidou-se nos seguintes processos:

Análise geral do conjunto de dados alvo a partir do cálculo da média, valores

mínimo e máximo, e desvio padrão para cada variável.

Verificação da presença de outliers em cada variável.

Verificação de valores ausentes em cada variável, e posterior exclusão do

caso.

Transformação dos dados através de padronização.

A técnica de transformação utilizada para uniformizar os dados foi a

padronização (Standardization). Esta técnica apresenta como premissa transformar as

variáveis de modo que as mesmas apresentem médias iguais a zero e desvios médios

absolutos iguais a um (SHARMA, 1996), segundo a equação:

f

fifif s

mxz

−= ( )2.6

onde:

zif é o valor padronizado para o valor xif.

xif é o valor a ser padronizado.

mf é a média da variável f.

sf é o desvio padrão da variável f.

O emprego da padronização evita que durante a análise de cluster as

diferentes variáveis contribuam com graus de influência variada decorrentes dos

diferentes pesos associados.

Deve ficar claro que a fase de análise exploratória não envolve somente os

procedimentos aqui adotados. Uma análise exploratória completa requer a análise

mais detalhada do conjunto de dados, como por exemplo, o estudo da correlação entre

variáveis. Porém, aqui foi adotada apenas uma varredura geral no conjunto de dados

pertencentes ao banco de dados da Gerência de Geoquímica do

108

CENPES/PETROBRAS no intuito de realizar uma amostragem mais concisa, ao invés

de uma amostragem puramente aleatória simples. Desta forma, possíveis

inconsistências ainda podem estar presentes no conjunto de dados resgatado. Estas

possíveis inconsistências serão tratadas ao longo das próximas etapas no

desenvolvimento do estudo.

6.3.2) Análise de Cluster

A análise de cluster é uma técnica bastante popular que possui como objetivo

descobrir grupos de amostras dentro de conjunto de dados. A técnica é empregada

em muitos campos, tais como biologia, química, geologia e geoquímica. A análise de

cluster é considerada uma técnica de reconhecimento de padrões do tipo não

supervisionado. Os métodos de clusterização são divididos em três categorias:

hierárquicos, por particionamento e grafos-teóricos (LAVINE, 2005). Neste trabalho

será empregado o método baseado em particionamento.

Segundo SHARMA (1996), a análise de cluster é uma técnica usada para

combinação de observações dentro de grupos tais que:

Cada grupo é homogêneo ou compacto com respeito a certa característica, isto

é, casos de um mesmo grupo são similares uns em relação aos outros.

Cada grupo deve ser diferente de outros grupos, com respeito a uma mesma

característica, de forma que observações de um grupo devem ser diferentes

em relação as de outros grupos.

Na análise de cluster, cada amostra é tratada como um ponto n-dimensional

medido no espaço. As coordenadas no espaço são definidas pelas medidas das

variáveis utilizadas para caracterizar as amostras. Desta forma, a análise de cluster

utiliza a similaridade entre amostras através da medida das distâncias entre os pontos

no espaço. Amostras que são similares se encontram localizadas próximas umas das

outras no espaço, enquanto que amostras dissimilares se encontram distantes

(LAVINE, 2005).

A medida de similaridade entre as amostras pode ser obtida através de várias

métricas, sendo a mais comum a Distância Euclidiana. Nesta, a distância é computada

a partir do cálculo da separação entre dois pontos em um espaço bi-dimensional

(Figura 6.7).

109

Figura 6.7: Distância Euclidiana entre dois pontos em um espaço bidimensional para as

variáveis X1 e X2.

Os métodos baseados em particionamento são aqueles em que, a partir de um

conjunto de n objetos, os mesmos são agrupados em k grupos. O número de grupos

(clusters), na maioria dos algoritmos de particionamento, é fornecido pelo usuário. No

caso do algoritmo empregado neste estudo, o número de grupos a serem obtidos pode

ser determinado pelo próprio algoritmo, não sendo necessária esta informação a priori.

O algoritmo escolhido para o particionamento de todo o conjunto de dados obtém os

grupos a partir da maximização da expectativa através de validação cruzada.

6.4) Características do Conjunto Escolhido

O conjunto gerado é composto de duzentas amostras, que abrange toda a

extensão da Bacia Potiguar, porção terrestre, e são representativas das diferentes

classes de óleo lá presentes.

Como visto anteriormente, as características geoquímicas das amostras de

óleo da Bacia Potiguar são reflexo de diferentes fatores que vão desde a origem a

processos de alteração secundária e misturas de óleos de origens distintas em

proporções diferentes. Desta forma, sua caracterização será tratada aqui segundo as

diferentes classes que as mesmas compõem.

Três principais classes foram tomadas preliminarmente, baseadas nas

classificações dos diversos autores que foram discutidas no item 6.2 deste capítulo.

Estas classes são lacustre, lacustre siliciclástico e misto. As amostras classificadas

como mistas englobam os óleos marinho-evaporítico e as misturas. Porém, para dar

x2

x1

Dkl

K

L

0

( )∑=

−=n

1j

2kjx ijxDkl

x2

x1

Dkl

K

L

0

( )∑=

−=n

1j

2kjx ijxDkl

110

prosseguimento a este estudo, estas classes pré-definidas foram refinadas à seguinte

subdivisão (Tabela 6.2), cujas características serão tratadas a seguir:

Amostras classificadas preliminarmente como lacustres foram subdivididas em

lacustres A e B.

As amostras anteriormente classificadas como lacustres siliciclásticas foram

subdivididas em lacustres siliciclásticas A e B.

As amostras inicialmente classificadas como mistas foram reorganizadas em

três diferentes grupos: o primeiro composto pelas amostras marinho-

evaporíticas, o segundo pelas amostras mistas pertencentes ao Trend de Areia

Branca e o terceiro composto pelas amostras mistas oriundas do Trend de

Carnaubais.

Tabela 6.2: Número de amostras por classe contidas no conjunto amostrado.

Classes

Lacustre Siliciclástico

A


B

Lacustre A

Lacustre B

Misto Trend de Areia Branca

Misto Trend de Carnaubais

Marinho- Evaporítico

Nº d

e am

ostr

as

25 10 48 22 40 35 20

O refinamento da classificação foi realizado baseado na integração dos

resultados das técnicas de cromatografia líquida, cromatografia gasosa,

espectrometria de massas e isótopos de carbono total, além de parâmetros como grau

ºAPI e porcentagem de enxofre. No âmbito geral da caracterização geoquímica, pode-se preliminarmente

observar as diferenças entre as amostras através dos resultados de cromatografia

líquida, de grau API e porcentagem de enxofre. Estes, de antemão, refletem a grande

variação em termos de qualidade nos óleos recuperados na bacia. A figura 6.8 mostra

o resultado de cromatografia líquida para as diferentes classes de óleos, onde é

possível observar que as amostras classificadas como lacustre e lacustre siliciclástico

são as que apresentam melhor qualidade (maiores teores de compostos saturados),

em contrapartida as amostras da classe marinho-evaporítico possuem uma baixa

qualidade (maiores porcentagens de compostos NSO). Para as amostras da classe

misto ocorre uma variação neste aspecto, havendo amostras de boa, média e baixa

qualidade.

111

Figura 6.8: Diagramas triangulares representando as porcentagens de compostos saturados,

aromáticos e NOS (resinas e asfaltenos) para as 200 amostras de óleo na Bacia Potiguar terrestre separadas em suas diferentes classes.

O grau API também pode, juntamente com a porcentagem de enxofre, separar

as amostras de acordo com a qualidade. Os elevados valores de grau API na área

terrestre da bacia, em geral estão associados a óleos que possuem baixo teor de

enxofre (Figura 6.9). Em termos de origem, óleos lacustres possuem baixos teores de

enxofre em virtude das próprias características ligadas ao ambiente deposicional da

rocha geradora. Assim, os valores mais altos apresentados por algumas amostras

podem estar ligados a condições do ambiente deposicional das rochas geradoras e/ou

a processos de alteração secundária (biodegradação), como pode ser visto pelo

aumento relativo de compostos NSO (Figura 6.10). Através dos resultados de

cromatografia gasosa também é possível observar diferenças entre os óleos de

diferentes classes (Figura 6.11).

%SATURADOS

%AROMÁTICOS%NSO

LacustreSiliciclástico

Lacustre

Bacia Potiguar

MarinhoEvaporítico

Misto

%SATURADOS

%AROMÁTICOS%NSO



LacustreLacustre

Bacia Potiguar

MarinhoEvaporítico

MarinhoEvaporítico

MistoMistoMisto

112

Figura 6.9: Gráfico entre o grau API versus porcentagem de enxofre para as amostras da

porção terrestre da Bacia Potiguar utilizadas neste estudo.

Figura 6.10: Gráfico entre o grau API versus porcentagem de compostos NOS (resinas e

asfaltenos) para as amostras da porção terrestre da Bacia Potiguar utilizadas neste estudo.

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 10 20 30 40 50ºAPI

% S

La c us tre S ilic La c us tre M is to

Marinho Evaporítico

0

0.2

0.4

0.6

0.8

1

1.2

1.4

0 10 20 30 40 50ºAPI

% S



0

10

20

30

40

50

60

0 10 20 30 40 50ºAPI

% N

SO



0

10

20

30

40

50

60

0 10 20 30 40 50ºAPI

% N

SO



113

Figura 6.11: Cromatogramas Gasosos representando as diferentes classes de óleo

recuperados na Bacia Potiguar, porção terrestre.

CLASSE LACUSTRE SILICICLÁSTICO:

Este grupo é composto por 35 amostras e representa os óleos que se localizam

no Graben de Apodi (Figura 6.12). Estas amostras foram inicialmente classificadas

como simplesmente lacustre siliciclástico e se diferenciam das demais amostras

lacustres da bacia por terem sido oriundas de matéria orgânica lacustre com alto

aporte de material siliciclástico, conforme indicado pela elevada abundancia relativa de

diasteranos (PETERS et al., 2005).

114

Figura 6.12: Mapa com a distribuição geográfica das diferentes classes de óleos encontradas

na Bacia Potiguar terra, baseadas neste estudo.

De uma maneira geral, estes óleos apresentam ºAPI variando de 25º a 47º,

baixa porcentagem de enxofre (entre 0,05 e 0,28%), porcentagem de compostos

saturados de elevada a alta (>59%), abundância relativa de alcanos de alto peso

molecular, razão pristano/fitano superior a dois (2,0), razão hopanos/esteranos maior

que 9,0, baixo valor da razão gamacerano/hopano (em média 0,2), elevada razão

entre os tricíclicos C26/C25 (>1,4), razão entre os homopanos H35/H34 em torno de 0,5,

concentração de TPP elevada, variando de 0,5 a 1,0, elevada razão

diasteranos/C27ααα esteranos (>0,4), predominância de C29 esteranos sobre seus

homólogos com 27 e 28 átomos de carbono e valores de isotópicos de carbono em

óleo total entre –28,00 e –31,00‰ (Tabela 6.3).

Além destes óleos apresentarem diferenças marcantes em relação aos óleos

tipicamente lacustres na bacia, em particular nos valores da razão diasteranos/C27ααα

esteranos, os óleos lacustres siliciclásticos apresentam composições geoquímicas

peculiares dentro do mesmo grupo, o que levou a sua subdivisão em dois subgrupos.

O primeiro fator de diferenciação está relacionado à concentração de tricíclicos (Figura

6.13). O grupo aqui renomeado de lacustre siliciclástico A apresenta valores da razão

tricíclicos/hopanos inferiores a 0,3, das razões 19/23TRI superiores a 0,3, 26/25TRI

inferiores a 2,0 e TR23/H30 menores que 0,1. O segundo fator importante para a

distinção é a concentração dos compostos TPP’s (tetracíclicos poliprenóides) (Figura

6.14) que possuem valores acima de 0,7 para o subgrupo denominado de lacustre

siliciclástico B e menores que 0,7 para o sub-grupo lacustre siliciclástico A. Outros

NLacustre ALacustre BLacustre Siliciclástico ALacustre Siliciclástico BMisto Trendde Areia BrancaMisto Trendde CarnaubaisMarinho Evaporítico

Oceano Atlântico

Linha de Costa

Falhas Principais50 Km250


Oceano Atlântico

Linha de Costa

Falhas Principais50 Km250 50 Km250


Oceano Atlântico

Linha de Costa

Falhas Principais50 Km250 50 Km250


Oceano Atlântico

Linha de Costa

Falhas Principais50 Km250 50 Km250 50 Km250 50 Km250

115

fatores em destaque são os valores da razão gamacerano/hopano que são superiores

a 0,25 nas amostras da classe lacustre siliciclástico B, e finalmente

cromatograficamente a razão fitano/n-C18, em geral, apresenta inferiores a 0,15 para a

classe lacustre siliciclástico A (Figura 6.14).

116

Tabela 6.3: Principais parâmetros geoquímicos adotados para discriminação genética dos óleos presentes no conjunto amostrado da Bacia Potiguar, porção terrestre. Para definição dos parâmetros geoquímicos consultar anexos I e II.

Parâmetros Lacustre

Siliciclástico A


B Lacustre

A Lacustre

B Misto Trend

de Areia Branca

Misto Trend de

Carnaubais Marinho-

Evaporítico

Grau API 25-45º 34-47,5º 14-42,6º 6-40º 15-46º ≈ 30º 3-42º ≈ 20º 12-27º % S 0,05-0,28 0,06 0,07-0,26 0,04-0,06 0,05-0,5 0,2-0,8 0,75-1,1 % Saturados 59-87 61-80 51-90 54-78 45-82 38-72 29-39 % NSO 5-27 4-19 3-27 3-24 5-39 13-38 >35 δ13C (‰) -28,0 a -30,5 -29,0 a -31,0 -27,9 a -32,7 -29,9 a -32,4 -26,1 a -28,5 -25,5 a -26,8 >-26,0 Cromatografia Gasosa

Pri/Phy=2,0-3,6 PHY/n-C18 <0,15

Pri/Phy=2,3-3,6 PHY/n-C18 >0,15 Pri/Phy=2-4,3 Pri/Phy=2,6-3,6 Pri/Phy>1,0 Pri/Phy<1,0 Pri/Phy<1,0

Hopanos (m/z 191)

Gam/Hop<0,25 TET24/26TRI>0,4 19/23TRI>0,3 26/25TRI<2,0 Diterpano/H30<1,0 TR23/H30<0,1 TRI/HOP<0,3

Gam/Hop>0,25 TET24/26TRI:<0,2 19/23TRI<0,3 26/25TRI>2,0, em geral Diterpano/H30>1,0 TR23/H30>0,1 TRI/HOP>0,3

Diah/H30<0,08 H29/C29Ts>3,0-7,0 Ts<Tm

Diah/H30>0,08 H29/C29Ts<3,5 Ts>Tm

21/23TRI>0,8 24/25TRI>1,2 26/25TRI>1,2 Gam/H30<0,6 H28/H29<0,05 H28/TR23<0,5 H29/H30<0,56 NorH/H30<0,03 TET24/26TRI<0,5 TRI/HOP>0,2, em geral. Ts/(Ts+Tm)>0,4

21/23TRI<0,8 24/25TRI<1,2 26/25TRI<1,2 Gam/H30>0,6, em grande parte 0,8-1,0. H28/H29>0,05 H28/TR23>0,5 H29/H30>0,56 NorH/H30>0,03 TET24/26TRI>0,5 TRI/HOP<0,2, em geral. Ts/(Ts+Tm)<0,4

21/23TRI<0,7 24/25TRI<1,05 26/25TRI<1,05 Gam/H30>0,98 Gam/TR23>26 H28/H30>0,11 TET24/26TRI>0,7 TRI/HOP<0,07 Ts/(Ts+Tm)<0,3

Esteranos (m/z 217)

Predominância de C29 esteranos sobre C27 e C28. diasteranos/C27ααα= 0,5-2,8

Predominância de C29 esteranos sobre C27 e C28. diasteranos/C27ααα= 0,3-1,9

Predominância de C29 esteranos sobre C27 e C28. S/(S+R)<0,4 [ ] Diasteranos ↓, em relação ao lacustre B.

Predominância de C29 esteranos sobre C27 e C28. S/(S+R)>0,4 [ ] Diasteranos ↑, em relação ao lacustre A.

Predominância de C29 esteranos sobre C27 e C28. 27/29ßßS<0,9

Predominância de C27 esteranos sobre C28 e C29. 27/29ßßS>0,9

Predominância de C29 esteranos sobre C27 e C28. S/(S+R)<0,35 αββ/αββ+ααα<0,3

Hopanos/ Esteranos >11 >9 >9,5 >13 1,2-3,3 1,4-3,2 ≈ 2,1

TPP (m/z 259) <0,7 >0,7 >0,96 <0,96 >0,5, em geral <0,5, em geral <0,47

117

Figura 6.13: Exemplos de fragmentogramas de massas m/z 191, m/z 217 e m/z 259 de óleos das classes lacustre siliciclástico, subgrupos A e B. Observar a diferença quanto à concentração dos compostos tricíclicos em relação aos pentacíclicos. Para identificação dos compostos consultar

Anexo I.

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC2

7BBS

C27

RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29BB

RC2

9BBS

C29

R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC2

7BBS

C27

RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29BB

RC2

9BBS

C29

R

TR20

TR21

TR22

TR23 TR24

TR25ATR25B

TET24TR

26ATR26B

TR28A

TR28A

TR28BTR

29ATR

29BTS TM TR30A

TR30B

NO

R25HH

29C

29TSD

H30

M29

H30

NO

R30HM

30H

31SH

31RG

AM H

32SH

32R

H33S H

33R

H34S

H34R

H35S

H35R

Lacustre Siliciclástico A

Lacustre Siliciclástico B

m/z 191

Tricíclicos

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

Tricíclicos

Pentacíclicos

Pentacíclicos

D27

SD

27R

C30

TP1

C30

TP2

m/z 191

m/z 259

D27

SD

27R

C30T

P1C3

0TP2

m/z 259

m/z 217

m/z 217

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB

_D29

SC

27BB

SC2

7RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29B

BRC2

9BB

SC

29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC2

7BBS

C27

RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29BB

RC2

9BBS

C29

R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC2

7BBS

C27

RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29BB

RC2

9BBS

C29

R

TR20

TR21

TR22

TR23 TR24

TR25ATR25B

TET24TR

26ATR26B

TR28A

TR28A

TR28BTR

29ATR

29BTS TM TR30A

TR30B

NO

R25HH

29C

29TSD

H30

M29

H30

NO

R30HM

30H

31SH

31RG

AM H

32SH

32R

H33S H

33R

H34S

H34R

H35S

H35R

TR20

TR21

TR22

TR23 TR24

TR25ATR25B

TET24TR

26ATR26B

TR28A

TR28A

TR28BTR

29ATR

29BTS TM TR30A

TR30B

NO

R25HH

29C

29TSD

H30

M29

H30

NO

R30HM

30H

31SH

31RG

AM H

32SH

32R

H33S H

33R

H34S

H34R

H35S

H35R

Lacustre Siliciclástico A


m/z 191

Tricíclicos

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

Tricíclicos

Pentacíclicos

Pentacíclicos

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R

C30

TP1

C30

TP2

m/z 191

m/z 259

D27

SD

27R

C30T

P1C3

0TP2

D27

SD

27R

C30T

P1C3

0TP2

m/z 259

m/z 217

m/z 217

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB

_D29

SC

27BB

SC2

7RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29B

BRC2

9BB

SC

29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB

_D29

SC

27BB

SC2

7RC

28S

C28B

BR

C28B

BSC

28R

C29

SC

29B

BRC2

9BB

SC

29R

118

Figura 6.14: Gráficos mostrando os principais diferenças observadas nos óleos classificados como lacustre siliciclástico. Para definição das razões de

parâmetros geoquímicos consultar Anexo II.

0

0.15

0.3

0.45

0.6

0 0.1 0.2 0.3 0.4 0.5

Gam/H30

Phy/

nC

18

La c us tre S ilic . A La c us tre S ilic . B

0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2 2.5 3

26/25TRI

19/2

3TR

ILa c us tre S ilic . A La c us tre S ilic . B

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

TET24/26TRI

TR23

/H30


0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

TPP

TRI/H

OP


0

0.15

0.3

0.45

0.6

0 0.1 0.2 0.3 0.4 0.5

Gam/H30

Phy/

nC

18


0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2 2.5 3

26/25TRI

19/2

3TR

ILa c us tre S ilic . A La c us tre S ilic . B

0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

TET24/26TRI

TR23

/H30


0

0.2

0.4

0.6

0.8

1

0 0.2 0.4 0.6 0.8 1

TPP

TRI/H

OP


119

CLASSE LACUSTRE:

Esta classe possui 70 amostras que representam os óleos localizados

principalmente no Graben de Umbuzeiro, secundariamente no Graben de Boa Vista, e

em menor quantidade no Graben de Apodi (Figura 6.12). As principais características

apresentadas pelas amostras desta classe são grau ºAPI geralmente superior a 20º,

índice de enxofre inferior a 0,5%, alta concentração de compostos saturados (superior

a 50%), predominância de n-alcanos de alto peso molecular, razão pristano/fitano

superior a 2,0, razão hopanos/esteranos com valores superiores a 10, baixo índice de

gamacerano, razão 26/25TRI maior que 1,6, razão entre os homopanos H35/H34 em

geral entre 0,4 e 0,8, predominância de C29 esteranos sobre seus homólogos com 27 e

28 átomos de carbono, e valores de isotópicos de carbono em óleo total em grande

parte inferiores a –30,00‰.

Assim como na classe lacustre siliciclástico foram detectadas diferenças que

permitiram a subdivisão do grupo em dois, na classe das amostras lacustres também

foram observadas particularidades que resultaram na criação de dois subgrupos. As

diferenças composicionais que levaram à criação das duas subclasses denominadas

de lacustre A e lacustre B são: valores na razão diasteranos/C27ααα, em geral,

maiores que 0,4, predominância dos hopanos C29 Ts sobre seu homólogo Tm, razão

diahopano/H30 (>0,08), razão esteranos C29 S/(S+R) (>0,4), razão H29/C29Ts (<3,5),

razão gamacerano/hopano, em geral, maior que 0,3, porcentagem de C27 esteranos

em torno de 35% na maioria das amostras, índice de TPP’s menor que 0,96, para as

amostras da classe lacustre B. Enquanto que para os mesmos parâmetros, as

amostras da classe lacustre A apresentam valores na razão diasteranos/C27ααα

inferiores a 0,4, predominância dos hopanos C29 Tm sobre seu homólogo Ts, razão

diahopano/H30 (<0,1), razão esteranos C29 S/(S+R) (<0,45), razão H29/C29Ts (>3,0),

razão gamacerano/hopano, em geral, entre 1,7 a 3,3, porcentagem de C27 esteranos

inferior a 35% na maioria das amostras, índice de TPP’s maior que 0,95.

As diferenças observadas entre as duas subclasses geradas refletem que as

amostras pertencentes à subclasse lacustre B possuem uma evolução térmica

superior àquelas da subclasse lacustre A. Os gráficos da figura 6.15 mostram esta

tendência a maior evolução para os óleos da subclasse lacustre B. Estes óleos

também apresentam feições de que possam ter sido gerados por outra fácies

geradora.

A ocorrência do diahopano, segundo PETERS & MOLDOWAN (1993), pode

ser atribuída a precursores hopanóides oriundos de bactérias que se proliferam em

ambientes argilosos favorecidos por condições de menor intensidade de anoxia a

subóxicas. O composto C29Ts também pode ser dependente do ambiente de

120

deposição, segundo os mesmo autores. Desta forma, os óleos depositados sob

condições de maior intensidade de anoxia apresentam maior abundância do C29Ts. As

amostras lacustres A apresentam baixa proporção dos compostos diahopano e C29Ts,

enquanto que as amostras lacustres B apresentam maiores proporções (Figura 6.16).

A proporção entre diasteranos e os esteranos também pode ser afetada pela

evolução térmica em virtude dos diasteranos serem mais estáveis à evolução térmica

do que os esteranos regulares. Porém, esta razão também pode refletir um ambiente

com alto aporte siliciclástico para o gerador (PETERS & MOLDOWAN, 1993). Os

óleos pertencentes à subclasse lacustre B estão localizados no Graben de Boa Vista e

de Apodi; estas amostras apresentam proporção de diasteranos altas quando

comparadas com as amostras da subclasse lacustre A.

Concluindo, as diferenças entre as subclasses Lacustre A e Lacustre B estão

associadas principalmente a diferenças de paleoambiente das rochas geradoras, pois

de acordo com as condições geológicas em que estas se encontram, não seria

possível uma migração além de um alto que as separam. Embora estes óleos se

encontrem trapeados em dois baixos seccionados por um alto central, as amostras da

classe Lacustre B apresentam características de óleos mais evoluídos termicamente

quando comparados com os da classe Lacustre A.

122

Figura 6.15: Gráficos mostrando os principais diferenças observadas nos óleos classificados como lacustre. Para definição das razões de parâmetros

geoquímicos consultar Anexo II.

0

0.1

0.2

0.3

0.4

0.5

0.8 0.9 1

TPP

Gam

/H30

La c us tre A La c us tre B

05

101520253035404550

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

C29ααα S(S+R)%

C 27ββ

SLa c us tre A La c us tre B

0

0.1

0.2

0.3

0.4

0.5

0 1.5 3 4.5 6 7.5

H29/C29TS

Dia

h/H

30


0

0.2

0.4

0.6

0.8

1

1.2

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

Ts/(Ts+Tm)

Dia

/C27αα

α


Aumento daEvolução Térmica


0

0.1

0.2

0.3

0.4

0.5

0.8 0.9 1

TPP

Gam

/H30


05

101520253035404550

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

C29ααα S(S+R)%

C 27ββ

SLa c us tre A La c us tre B

0

0.1

0.2

0.3

0.4

0.5

0 1.5 3 4.5 6 7.5

H29/C29TS

Dia

h/H

30


0

0.2

0.4

0.6

0.8

1

1.2

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8

Ts/(Ts+Tm)

Dia

/C27αα

α




123

Figura 6.16: Exemplos de fragmentogramas de massas m/z 191, m/z 217 e m/z 259 de óleos das classes lacustre A e B. Observar a presença em

maior proporção dos compostos C29Ts e diahopano na amostra da classe lacustre B. Para identificação dos compostos consultar Anexo I.

m/z 191

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 N

OR

25H

H29 C

29T

SD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

Diasteranos

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S

C29

BB

RC

29B

BS

C29

R

Diasteranos

m/z 217

m/z 191

m/z 217

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

Lacustre A

Lacustre B

m/z 191

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 N

OR

25H

H29 C

29T

SD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

Diasteranos

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S

C29

BB

RC

29B

BS

C29

R

Diasteranos

m/z 217

m/z 191

m/z 217

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

m/z 191

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 N

OR

25H

H29 C

29T

SD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 N

OR

25H

H29 C

29T

SD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

Diasteranos

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

Diasteranos

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S

C29

BB

RC

29B

BS

C29

R

Diasteranos

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S

C29

BB

RC

29B

BS

C29

R

Diasteranos

m/z 217

m/z 191

m/z 217

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

Lacustre A

Lacustre B

124

CLASSE MISTO: Esta classe compreende 75 amostras que são representantes das amostras de

óleos recuperadas nos Trends de Areia Branca e de Carnaubais (Figura 6.12). Estes

óleos apresentam como principal característica a alta variabilidade composicional,

variabilidade esta, decorrente principalmente das diferentes contribuições de cada

end-member lacustre e marinho-evaporítico à mistura.

Dentre as principais características destes óleos, foram observados valores de

grau API geralmente entre 10º e 40º, porcentagem de enxofre entre 0,05 e 1,10%,

porcentagem de compostos saturados variando de 30 a 80%; cromatograficamente,

estes óleos apresentam razão pristano/fitano inferiores a 1,5, a distribuição dos n-

alcanos é variável segundo a proporção de mistura; dentre os biomarcadores, a razão

hopanos/esteranos possui valores entre 1,0 e 3,5, o índice de gamacerano está, em

grande parte, entre 0,5 e 1,0, para a razão 26/25TRI predominam valores acima de

1,0, a razão entre os homopanos H35/H34 possui valores entre 0,6 e 1,0, baixa razão

diasteranos/C27ααα (possui valores inferiores a 0,4) e os isótopos de carbono total

oscilam entre –28,50‰ e –25,50 ‰.

Das 75 amostras classificadas como mistas, 35 pertencem ao Trend de

Carnaubais e 40 ao Trend de Areia Branca. Em virtude da diferença composicional

entre as amostras dos dois diferentes trends, optou-se por considerá-las como classe

Misto Trend de Carnaubais e Misto Trend de Areia Branca.

As principais diferenças entre as amostras destes dois grupos se estendem

desde parâmetros como grau API a parâmetros moleculares como biomarcadores. Os

gráficos da figura 6.17 (a) e (b) mostram a variação na qualidade das amostras dos

dois grupos através de parâmetros globais do óleo: grau API versus % enxofre e

resultados médios de cromatografia líquida em porcentagens de compostos saturados,

aromáticos e NSO. Nestes gráficos é possível observar que as amostras do Trend de

Areia Branca possuem melhor qualidade em relação às de Carnaubais, ou seja,

maiores porcentagens médias de saturados, e menores de aromáticos e compostos

NSO, bem como maior freqüência de amostras com grau API superior a 25º. As

amostras do Trend de Carnaubais apresentam os menores grau ºAPI e as menores

porcentagens de compostos saturados, estas características são decorrentes da maior

intensidade de biodegradação nos óleos desta região.

Através de alguns parâmetros de cromatografia gasosa e de espectrometria de

massas foi possível separar as duas classes de forma bastante eficiente (Figuras 6.18,

6.19 e 6.20). A razão pristano/fitano é maior que 1,0 para as amostras do Trend de

Areia Branca e inferior a 1,0 para as do Trend de Carnaubais, dentre os

biomarcadores ocorre predominância entre os esteranos com 27 átomos de carbono

125

nas amostras do Trend de Carnaubais e dos esteranos com 29 átomos de carbono

nas do Trend de Areia Branca. Nos óleos do Trend de Carnaubais as razões 21/23TRI

possuem valores (<0,8), 24/25TRI (<1,2), 26/25TRI (<1,2), gamacerano/hopano (>0,5,

sendo em grande parte entre 0,8 e 1,0), H28/H29 (>0,05), H28/TR23 (>0,5), H29/H30

(>0,56), Nor25H/H30 (>0,03), TET24/26TRI (>0,5), TPP (em geral, <0,5),

tricíclicos/hopanos (em geral, <0,2) e Ts/(Ts+Tm) em geral inferior a 0,4. Já nos óleos

do Trend de Areia Branca essas mesmas razões apresentam os seguintes valores:

21/23TRI (>0,8), 24/25TRI (>1,2), 26/25TRI (>1,2), gamacerano/hopano (<0,6),

H28/H29 (<0,05), H28/TR23 (<0,5), H29/H30 (<0,56, embora com superposição de

valores os óleos deste grupo tendem apresentar valores mais baixos), Nor25H/H30

(<0,03), TET24/26TRI (<0,5), TPP (em geral, >0,5), tricíclicos/hopanos (em geral,

>0,2) e Ts/(Ts+Tm) em geral superior a 0,4. Os valores isotópicos de carbono total são

mais leves (<-26,00‰) para as amostras do Trend de Areia Branca e geralmente mais

pesados para os óleos do Trend de Carnaubais (>-26,80‰).

126

Figura 6.17: Gráficos mostrando as diferenças de qualidade nos óleos mistos dos Trends de

Carnaubais e Areia Branca. Em (a) parâmetros globais º API x %S, e em (b) dados de cromatografia líquida.

Segundo J.V.P. GUZZO (Inf. Verbal), as 20 amostras que pertencem a campos

localizados na porção NW da bacia, na Plataforma de Aracati, foram classificadas

como mistas. No entanto, estas amostras compreendem óleos com feições típicas dos

óleos marinho-evaporíticos recuperados na Bacia do Ceará, como observado nos

trabalhos de RODRIGUES, 1993, MELLO et al., 1988, PENTEADO et al., 1995,

SANTOS NETO, 1996 e SANTOS NETO & HAYES, 1999, e neste trabalho serão

assim classificadas e descritas no próximo item.

% Saturados

% NSO

7 2

1513

5 1

2 22 8

0

15

30

45

60

75

M is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a

0

0.2

0.4

0.6

0.8

1

0 10 20 30 40 50 60

ºAPI

%S

M is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a(a)

(b) % Saturados

% NSO

7 2

1513

5 1

2 22 8

0

15

30

45

60

75


0

0.2

0.4

0.6

0.8

1

0 10 20 30 40 50 60

ºAPI

%S

M is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a(a)

(b)

127

Figura 6.18: Gráficos mostrando os principais diferenças observadas nos óleos classificados como mistos. Para definição das razões de parâmetros


-29

-28

-27

-26

-25

-240 0.3 0.6 0.9 1.2 1.5

GAM/H30

δ13 C


0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2

PRISTANO/FITANO

TPP


0

0.02

0.04

0.06

0.08

0.1

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

TRI/HOP

Nor

25H

/H30


0

0.4

0.8

1.2

0 0.5 1 1.5 2

21/23TRI

26/2

5TR

IM is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a

-29

-28

-27

-26

-25

-240 0.3 0.6 0.9 1.2 1.5

GAM/H30

δ13 C


0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2

PRISTANO/FITANO

TPP


0

0.02

0.04

0.06

0.08

0.1

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5

TRI/HOP

Nor

25H

/H30


0

0.4

0.8

1.2

0 0.5 1 1.5 2

21/23TRI

26/2

5TR

IM is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a

128

Figura 6.19: Gráficos mostrando os principais diferenças observadas nos óleos classificados como mistos. Para definição das razões de parâmetros


0

0.4

0.8

1.2

0 0.04 0.08 0.12 0.16 0.2

H28/H29

27/2

9ββS

(m/z

218

)


0

0.2

0.4

0.6

0.8

0 0.2 0.4 0.6 0.8 1

Ts/(Ts+Tm)

TET2

4/26

TRI


0

0.5

1

1.5

2

0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

H29/H30

24/2

5TR

I


0

0.5

1

1.5

2

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2

Diah/H30

H28

/TR

23M is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a

0

0.4

0.8

1.2

0 0.04 0.08 0.12 0.16 0.2

H28/H29

27/2

9ββS

(m/z

218

)


0

0.2

0.4

0.6

0.8

0 0.2 0.4 0.6 0.8 1

Ts/(Ts+Tm)

TET2

4/26

TRI


0

0.5

1

1.5

2

0.4 0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8

H29/H30

24/2

5TR

I


0

0.5

1

1.5

2

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2

Diah/H30

H28

/TR

23M is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc a

129

Figura 6.20: Fragmentogramas de massas íons m/z 191, 217 e 259 de um óleo da classe Misto Trend de Areia Branca e outro Misto Trend de

Carnaubais. Para identificação dos compostos consultar Anexo I.

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

BH

28N

OR2

5HH

29C

29TS

DH

30 M29

H30

NO

R30

H M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

BH

28N

OR2

5HH

29C

29TS

DH

30 M29

H30

NO

R30

H M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R

C30

TP1

C30

TP2

m/z 191

m/z 217

m/z 259


Misto Trend de Carnaubaism/z 191

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27B

BS C

27R

C28

SC2

8BBR

C28

BB

SC2

8RC

29S

C29

BBR

C29B

BSC

29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27B

BS C

27R

C28

SC2

8BBR

C28

BB

SC2

8RC

29S

C29

BBR

C29B

BSC

29R

TR19 TR

20 TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

TR19 TR

20 TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

m/z 217m/z 259

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB_

D29

SC2

7BB

SC2

7RC2

8SC

28BB

RC

28BB

SC

28R

C29

SC2

9BBR

C29

BBS

C29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB_

D29

SC2

7BB

SC2

7RC2

8SC

28BB

RC

28BB

SC

28R

C29

SC2

9BBR

C29

BBS

C29R

D27

SD

27R

C30T

P1C

30TP

2

D27

SD

27R

C30T

P1C

30TP

2

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

BH

28N

OR2

5HH

29C

29TS

DH

30 M29

H30

NO

R30

H M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

TR19

TR20

TR21

TR22 TR

23TR

24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

BH

28N

OR2

5HH

29C

29TS

DH

30 M29

H30

NO

R30

H M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R

C30

TP1

C30

TP2

m/z 191

m/z 217

m/z 259


Misto Trend de Carnaubaism/z 191

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27B

BS C

27R

C28

SC2

8BBR

C28

BB

SC2

8RC

29S

C29

BBR

C29B

BSC

29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SBB

_D29

SC

27B

BS C

27R

C28

SC2

8BBR

C28

BB

SC2

8RC

29S

C29

BBR

C29B

BSC

29R

TR19 TR

20 TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

TR19 TR

20 TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25H

H29

C29T

SD

H30

M29

H30

NO

R30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

m/z 217m/z 259

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB_

D29

SC2

7BB

SC2

7 RC2

8SC

28BB

RC

28BB

SC

28R

C29

SC2

9BBR

C29

BBS

C29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27S

BB_

D29

SC2

7BB

SC2

7 RC2

8SC

28BB

RC

28BB

SC

28R

C29

SC2

9BBR

C29

BBS

C29R

D27

SD

27R

C30T

P1C

30TP

2

D27

SD

27R

C30T

P1C

30TP

2

130

CLASSE MARINHO-EVAPORÍTICO:

Esta classe é composta por 20 amostras de óleos localizados na porção NW da

bacia, na Plataforma de Aracati (Figura 6.12). Anteriormente, embora na literatura

tenham sido consideradas como óleos gerados por fácies marinho-evaporítica, por

exemplo, RODRIGUES et al. 1983, MELLO et al., 1988, PENTEADO et al., 1995,

SANTOS NETO, 1996 e SANTOS NETO & HAYES, 1999, atualmente no banco de

dados da Gerência de Geoquímica, estes se encontravam classificados como óleos

mistos. Em função da sua alta correlação óleo-óleo com os óleos marinho-evaporíticos

da Bacia do Ceará, foi estabelecido para este trabalho que estas amostras

pertenceriam à classe marinho-evaporítica ao invés de permanecerem classificadas

como mistas (Figura 6.21).

Figura 6.21: Exemplos de resultados de cromatografia líquida e gasosa, espectrometria de massas e isótopos de carbono total em óleos pertencentes às Bacias do Ceará e Potiguar, mostrando a alta correlação óleo-óleo entre as duas amostras e classificados como óleos

marinho-evaporíticos. Para identificação dos compostos consultar Anexo I.

Os óleos recuperados nesta porção da bacia apresentaram os menores valores

de grau ºAPI, geralmente inferiores a 15º, as maiores porcentagens de enxofre

(>0,75%) e as maiores porcentagens de compostos NSO (>35%) como pode ser

observado na Figura 6.22 (a) e (b).

131

Figura 6.22: Gráficos mostrando a menor qualidade dos óleos da classe marinho-evaporítico

em relação aos demais óleos da bacia. Em (a) parâmetros globais º API x %S, e em (b) dados de cromatografia líquida.

Geoquimicamente, estes óleos apresentam perfil cromatográfico com ausência

ou baixa proporção de n-alcanos e isoprenóides (pristano e fitano) decorrente de

processos de alteração secundária (biodegradação). As bactérias degradam

preferencialmente as frações mais leves dos hidrocarbonetos saturados (n-alcanos e

isoprenóides), permanecendo no óleo os compostos de maior peso molecular

(TISSOT & WELTE, 1984 e HUNT, 1996). No caso destes óleos, são os compostos

cíclicos (naftênicos) que apresentam um enriquecimento relativo na composição global

do óleo, como pode ser observado pela alta concentração de biomarcadores

saturados e presença de um deslocamento da linha de base no cromatogramas

gasosos (“hump” ou UCM - Unresolved Complex Mixture) (Figura 6.23).

3 6 19 4 5

5 1 2 1 2 8

7 2 15 13

7 1 16 13

7 0 17 13

7 5 13 12

7 8 13 9

0% 20% 40% 60% 80% 100%

M A R . EVP .

M IS T . T . C A R .

M IS T . T . A R B .

LA C . A

LA C . B

LA C . S IL. A

LA C . S IL. B

%Saturados %Aromáticos %NSO

0

0.5

1

1.5

0 10 20 30 40 50 60ºAPI

% S




M a rinho Ev a po rít ic o

(a)

(b)

3 6 19 4 5

5 1 2 1 2 8

7 2 15 13

7 1 16 13

7 0 17 13

7 5 13 12

7 8 13 9

0% 20% 40% 60% 80% 100%

M A R . EVP .

M IS T . T . C A R .

M IS T . T . A R B .

LA C . A

LA C . B

LA C . S IL. A

LA C . S IL. B

%Saturados %Aromáticos %NSO

0

0.5

1

1.5

0 10 20 30 40 50 60ºAPI

% S





(a)

(b)

132

Figura 6.23: Gráfico entre porcentagem de compostos NSO e somatório de biomarcadores

(hopanos e esteranos) em ppm na fração dos C14+ saturados, mostrando o enriquecimento dos compostos naftênicos com o aumento da biodegradação. O cromatograma gasoso apresenta

um óleo marinho evaporítico biodegradado com ausência de n-alcanos e isoprenóides, um deslocamento da linha de base (UCM) e um enriquecimento de compostos naftênicos

decorrentes da biodegradação.

Os parâmetros moleculares de biomarcadores nestes óleos apresentam as

seguintes características: razão hopanos/esteranos (<2,0), 21/23TRI (<0,7), 24/25TRI

(<1,05), 26/25TRI (<1,05), gamacerano/hopano (>0,98), gamacerano/TR23 (>26),

TET24/26TRI (>0,7), tricíclicos/hopanos (<0,07), Ts/(Ts+Tm) (<0,3), C29 S/(S+R)

esteranos (<0,35) e C29 αββ/( αββ+ ααα) esteranos (<0,3). Os valores de isótopos

estáveis de carbono total são pesados (>-26,00‰) em relação aos demais óleos da

bacia (Figura 6.24). Estes óleos apresentam boa correlação com os extratos da

Formação Alagamar estudados por PENTEADO (1995), e quando comparados com os

óleos estudados por RODRIGUES (1983), apresenta algumas diferenças, que podem

estar associadas ao fato de que os óleos estudados por RODRIGUES (1983) não

estarem afetados por biodegradação como os do presente trabalho (Figura 6.25).

Ausência de n-alcanos e isoprenóides.

UCMUnresolved Complex Mixture

Enriquecimento relativode compostos naftênicos.

0

10

20

30

40

50

60

0 20000 40000 60000 80000Total de Biomarcadores (Hopanos+Esteranos) ppm

%N

SO











0

10

20

30

40

50

60

0 20000 40000 60000 80000Total de Biomarcadores (Hopanos+Esteranos) ppm

%N

SO





133

Figura 6.24: Gráficos mostrando as principais diferenças observadas nos óleos da classe marinho-evaporítico em relação às demais classes da bacia Potiguar, porção terrestre. Para definição das razões de parâmetros geoquímicos consultar Anexo II.

0

0.3

0.6

0.9

1.2

0 0.3 0.6 0.9 1.2Gam/H30

TET2

4/26

TRI





(a)

0.5

0.9

1.3

1.7

0.5 0.7 0.9 1.121/23TRI

24/2

5TR

I





(b)

0

0.05

0.1

0.15

0.2

0 0.3 0.6 0.9 1.2TRI/HOP

H28

/H29





(c)

-33

-32

-31

-30

-29

-28

-27

-26

-25

-240 0.2 0.4 0.6 0.8 1

Ts/(Ts+Tm)

δ13 C





(d)

0

0.3

0.6

0.9

1.2

0 0.3 0.6 0.9 1.2Gam/H30

TET2

4/26

TRI





(a)

0.5

0.9

1.3

1.7

0.5 0.7 0.9 1.121/23TRI

24/2

5TR

I





(b)

0

0.05

0.1

0.15

0.2

0 0.3 0.6 0.9 1.2TRI/HOP

H28

/H29





(c)

-33

-32

-31

-30

-29

-28

-27

-26

-25

-240 0.2 0.4 0.6 0.8 1

Ts/(Ts+Tm)

δ13 C





(d)

134

Figura 6.25: Gráficos mostrando a correlação entre os óleos da classe marinho-evaporítico com os extratos da Formação Alagamar (CES 07 e SO-05)

e os óleos marinho-evaporíticos dos poços CES-08 e 14. Para definição das razões de parâmetros geoquímicos consultar Anexo II.

-33-32-31-30-29-28-27-26-25-24-23

0 0.3 0.6 0.9 1.2

TRI/HOP

δ13 C

La c us tre S ilic . A La c us tre S ilic . BLa c us tre A La c us tre BM is to Tre nd C a rna uba is M is to Tre nd A re ia B ra nc aM a rinho Ev a po rít ic o Extra to s C ES 0 7Extra to s S O 0 5 Óle o C ES 0 8 e 14

-33-32-31-30-29-28-27-26-25-24-23

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

TPP

δ13 C


0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2 2.5 3 3.5 4DITERP/H30

19/2

3TR

I


0

0.4

0.8

1.2

1.6

2

0 0.02 0.04 0.06 0.08 0.1TET24/H30

26/2

8TR

I


-33-32-31-30-29-28-27-26-25-24-23

0 0.3 0.6 0.9 1.2

TRI/HOP

δ13 C


-33-32-31-30-29-28-27-26-25-24-23

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

TPP

δ13 C


0

0.2

0.4

0.6

0.8

1

0 0.5 1 1.5 2 2.5 3 3.5 4DITERP/H30

19/2

3TR

I


0

0.4

0.8

1.2

1.6

2

0 0.02 0.04 0.06 0.08 0.1TET24/H30

26/2

8TR

I


135

Quando comparados com os óleos mistos do Trend de Carnaubais, os perfis

de biomarcadores dos óleos marinho-evaporíticos nos íons m/z 191 e 217 são

semelhantes visualmente (Figura 6.26), porém alguns parâmetros permitem a

distinção entre os óleos das duas famílias. Dentre estes parâmetros, destacam-se

para os óleos marinho-evaporíticos a razão gamacerano/hopano superior a 0,98,

razão H28/H30 maior que 0,11, TET24/25TRI geralmente inferior a 1,0,

diahopano/hopano inferior a 0,03, gamacerano/TR23 maior que 26 e Ts/(Ts+Tm)

menor que 0,3. A maioria destes parâmetros é controlada pela anoxia da coluna de

água no ambiente deposicional da rocha geradora, segundo PETERS & MOLDOWAN

(1993). Desta forma, o ambiente gerador dos óleos marinho evaporíticos da bacia se

encontrava sob condições marinhas restritas. A figura 6.27 contrasta dois parâmetros

indicativos de anoxia de coluna de água citados por PETERS & MOLDOWAN (op. cit.),

e mostra um aumento no valor da razão gamacerano/hopano a medida em que os

óleos gradam para a classificação de marinho-evaporíticos.

136

Figura 6.26: Fragmentogramas de massas íons m/z 191, 217 e 259 de um óleo marinho-evaporítico e outro misto Trend de Carnaubais mostrando a

semelhança visual entre os perfis. Para identificação dos compostos consultar Anexo I.

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TM

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30

H31

SG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

m/z 191

m/z 217

Óleo misto Trend de Carnaubais

Óleo marinho-evaporítico

S21

S22 D

IA27

SD

IA27

RD

IA27

S2D

IA27

R2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

S C28

RC

29S

C29

BB

RC

29B

BS

C29

R

TR19

TR20 TR

21

TR22 TR

23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S C29

BB

RC

29B

BS

C29

R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S C29

BB

RC

29B

BS

C29

R

m/z 191m/z 217

m/z 259

m/z 259

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R C3

0TP1 C30

TP2D27

SD

27R C3

0TP1 C30

TP2

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TM

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30

H31

SG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TM

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30

H31

SG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

m/z 191

m/z 217

Óleo misto Trend de Carnaubais

Óleo marinho-evaporítico

S21

S22 D

IA27

SD

IA27

RD

IA27

S2D

IA27

R2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

S C28

RC

29S

C29

BB

RC

29B

BS

C29

R

S21

S22 D

IA27

SD

IA27

RD

IA27

S2D

IA27

R2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

S C28

RC

29S

C29

BB

RC

29B

BS

C29

R

TR19

TR20 TR

21

TR22 TR

23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19

TR20 TR

21

TR22 TR

23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B

H28

NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GA

MH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

SH

35R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S C29

BB

RC

29B

BS

C29

R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S C29

BB

RC

29B

BS

C29

R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S C29

BB

RC

29B

BS

C29

R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

S C28

BB

RC

28B

BS

C28

RC

29S C29

BB

RC

29B

BS

C29

R

m/z 191m/z 217

m/z 259

m/z 259

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R

C30

TP1

C30

TP2

D27

SD

27R C3

0TP1 C30

TP2D27

SD

27R C3

0TP1 C30

TP2

137

Figura 6.27: Gráfico mostrando o aumento na salinidade da água do ambiente da rocha

geradora, dos óleos da porção terrestre da Bacia Potiguar. Observar a variação na razão pristano/fitano e crescimento da razão gamacerano/hopano de acordo com o aumento da

anoxia. Para definição das razões de parâmetros geoquímicos consultar Anexo II.

6.5) Discussão da Classificação de Óleos

Os gráficos da figura 6.22 sugerem que os óleos mistos constituem uma

mistura em diferentes proporções de um end-member marinho evaporítico e um

lacustre. Entretanto o contínuo entre os óleos marinho-evaporíticos e lacustres,

englobando os óleos mistos, tem diferentes end-members lacustres de acordo com o

par de parâmetros geoquímicos selecionados. Em vários casos, parece haver um

contínuo entre os óleos marinho-evaporíticos e os lacustres A e B (Figura 6.24 (a), (b)

e (c)). Por outro lado, a figura 6.24 (d) parece sugerir uma mistura entre os óleos

marinho-evaporíticos e os lacustres siliciclásticos. Conseqüentemente, o end-member

lacustre contribuindo para os óleos mistos aparentemente não seria representado

pelas classes lacustre e lacustre siliciclástico, associadas a geradoras da Fm.

Pendência. Resta provar se o componente lacustre nos óleos mistos provém

unicamente do Mb. Upanema da Fm. Alagamar, como sugerido por autores como

TRINDADE, 1992 e TRINDADE et al., 1992.

Assim, a caracterização precisa do end-member lacustre nos óleos mistos deve

ser objeto de investigação futura, estando além do escopo do presente trabalho. Por

fim, cabe mencionar, que os óleos mistos do Trend de Carnaubais possuem um maior

componente de biomarcadores oriundos de uma fácies marinha evaporítica do que os

0

1

2

3

4

5

0 0.3 0.6 0.9 1.2Gam/H30

PRY/

FIT





0

1

2

3

4

5

0 0.3 0.6 0.9 1.2Gam/H30

PRY/

FIT





138

óleos do Trend de Areia Branca, os quais teriam uma proporção relativamente maior

do componente lacustre entre os biomarcadores.

139

CAPÍTULO

7

7. IMPLEMENTAÇÃO DAS TÉCNICAS Neste capítulo serão apresentados a ferramenta computacional utilizada para a realização do trabalho (software WEKA), a organização dos dados de entrada e os resultados obtidos para cada uma das técnicas de inteligência artificial: Árvore de Decisão e Redes Neurais Artificiais.

7.1) Introdução

Muitas são as ferramentas encontradas no mercado que seriam passíveis de

serem utilizadas na execução deste estudo. Dentre elas destacam-se: o Statistica®,

MatLab®, Clementine®, Intelligent Miner® e ODM®. Porém, optou-se pela utilização

do WEKA versão 3.4.10 por ser um software de domínio público, de fácil interface com

o usuário e com módulos de visualização já contemplados no pacote.

O conjunto de dados estudado compreende 200 amostras de óleo da Bacia

Potiguar, porção terrestre, selecionadas segundo a metodologia descrita no capítulo

anterior. A partir deste banco de dados, foram implementadas as técnicas de

inteligência artificial de Árvores de Decisão e de Redes Neurais Artificiais.

7.1.1) O Software WEKA

O pacote WEKA (Waikato Environment Knowledge Analysis) foi desenvolvido

na Universidade de Waikato na Nova Zelândia (WITTEN & FRANK, 2000) e se

encontra disponível no site da mesma: http://www.cs.waikato.ac.nz/ml/weka. Este

sistema foi desenvolvido a partir de uma linguagem de programação orientada a objeto

(JAVA) e possui seu código aberto disponível na Web. Por possuir linguagem de

programação JAVA, o código pode ser rodado em diferentes plataformas (Windows®,

Linux®, Unix® e Macintosh®), conferindo uma boa portabilidade ao software.

Além de atuar em domínio público esta ferramenta apresenta uma interface

gráfica com o usuário, o que reduz o tempo empregado na análise dos resultados,

140

devido a não necessidade de recorrer a outros programas para obter esta

visualização.

O WEKA é operado através de uma tela principal GUI (Guided User Interface)

onde são fornecidos relatórios com dados analíticos e estatísticos do domínio

minerado (Figura 7.1). Todavia, o software também pode ser operado através de linha

de comando.

Figura 7.1: Tela de apresentação do programa WEKA e suas principais funcionalidades.

O programa é formado pelo seguinte conjunto de pacotes: Preprocess,

Classify, Cluster, Associate, Select Attributes e Visualize. O pacote Preprocess é a

primeira tela ativa quando se abre o Explorer do WEKA. Nesta tela, é possível

selecionar o arquivo a ser aberto, visualizar informações a respeito dos atributos

contidos no arquivo, empregar filtros nos dados e salvar possíveis modificações

atribuídas ao conjunto de dados. O pacote Classify oferece dezenas de algoritmos de

aprendizagem de máquina, tais como: NaiveBayes, MultiLayerPerceptron, Kstar e J48.

O pacote Cluster contém cinco métodos de aprendizagem. Já o WEKA Associate

possui algoritmos de regras de associação Apriori, PredictiveApriori e Tertius. O

pacote Select Attributes, como o próprio nome diz possui algoritmos para selecionar

atributos de uma base de dados para posteriormente realizar a extração de padrões. O

último pacote é o Visualize onde é possível visualizar através de uma matriz de

gráficos o cruzamento de todas as variáveis.

141

7.1.2) Organização dos Dados de Entrada

Atualmente, o software permite a leitura de arquivos em formato .csv (variáveis

separados por vírgulas), independentemente do algoritmo utilizado, o que facilitou

muito a construção do arquivo de entrada de dados. Nas versões anteriores, o padrão

de entrada de dados era o ARFF o que demandava um bom tempo na preparação do

arquivo.

O arquivo com as 200 amostras foi então construído na forma de uma tabela

no editor de tabelas e gráficos do pacote Microsoft Office Excel®. Na primeira linha,

estão contidos todos os rótulos das variáveis e nas demais linhas (2ª-201ª) estão os

casos (amostras). Nas colunas, são alocados os valores de cada variável sendo a

última com a classe (classificação do tipo de óleo) referente a cada caso. Em outras

palavras, cada linha corresponde a informações de uma amostra de óleo em suas n

variaríeis, e cada valor na linha corresponde ao valor da n’ variável naquela amostra

de óleo. Esta tabela é salva no formato .csv (separados por vírgulas), estando pronta

para ser aberta no WEKA (Figura 7.2).

Figura 7.2: Exemplo de tabela de dados em formato .csv para entrada de dados no software

WEKA, visualizada no editor de texto Word pad®.

142

7.2) Aplicação da Técnica de Árvores de Decisão

Para a aplicação da técnica de Árvores de Decisão (AD) foi escolhido o

algoritmo J48. Os arquivos de entrada foram construídos baseados nas 200 amostras

e suas 60 variáveis selecionadas para o estudo, mais a classificação em uma das sete

classes atribuídas às amostras e discutidas anteriormente. As 60 variáveis escolhidas

para compor o banco de dados do trabalho, dentre os parâmetros geoquímicos de

possível utilização na caracterização geoquímica, são apresentadas na tabela 7.1.

Tabela 7.1: Variáveis de entrada empregadas para a construção do modelo “baseado em todas

as variáveis”. Para identificação dos parâmetros e razões, consultar Anexos I e II.

As variáveis geoquímicas selecionadas apresentam diferentes valores e limites.

Por exemplo, os dados de cromatografia líquida se encontram em porcentagem, os de

isótopos em valores negativos e os de biomarcadores em partes por milhão na fração

de saturados. Em virtude da diferença entre as escalas das variáveis empregadas

PRI/PHY 29/30H Pri/nC17 30/29BBS(218) Parâmetros de Cromatografia GasosaPHY/NC18 DIA/C27αα Parâmetros de Cromatografia Líquida17/(17+C27) DIA30/C27αα Isótopo de Carbono TotalALTURA TOTAL DIAH/H30 Parâmetros Bulk% Saturados DITERP/H30 Parâmetros de Biomarcadores% Aromáticos GAM/H30 % NSO GAM/TR23 δ13C H28/H29 API H28/H30 Enxofre (%) H28/TR23 %27ββS(218) H29/C29TS %28ββS(218) H29/H30 %29ββS(218) H30/C27αα%H31 H35/H34 %H32 HOP/STER %H33 NOR25H/H29 %H34 NOR25H/H30 %H35 NORNEO/H29 19/23TRI Total Esteranos 20S/(20S+20R) St Total Hopanos 21/23TRI TET24/26TRI 21+22/STER TET24/H30 23/24TRI TPP 24/25TRI TR23/H30 25NOR/HOPANE TRIC/HOP 26/25TRI TRIC/STER 26/28TRI TS/(TS+TM) 27/29ββS(218) TS/TM 28/29ββS(218) αββ/(αββ+ααα)

143

para a construção do modelo, foi decidido, por critérios de segurança e validação,

construir além do arquivo original, mais dois arquivos compostos com os 200 casos,

60 variáveis e 7 classes, porém um com as varáveis padronizadas (valores entre –1 e

1) e o outro com os casos organizados aleatoriamente.

Os modelos foram então construídos para os três arquivos e seus resultados

estão apresentados nas tabelas 7.2, 7.3 e 7.4. As variáveis foram omitidas das tabelas

de resultados, porém são as mesmas que constam na tabela 7.1.

O relatório-padrão gerado pelo software WEKA é composto de três partes

principais:

CABEÇALHO (RUN INFORMATION): onde é informado ao usuário o tipo de

classificador empregado (Scheme), o arquivo no qual o modelo foi gerado

(Relation), o número de casos do arquivo (Instances), o número de variáveis do

arquivo (Attributes) e o método de teste empregado na construção do modelo

(Test mode).

MODELO GERADO (CLASSIFIER MODEL): nesta porção é apresentado o

modelo gerado e informações inerentes ao tipo de classificador utilizado, por

exemplo, no caso das Árvores de Decisão, informações como o número de

folhas (Number of leaves) e o tamanho da árvore (Size of the tree) são

apresentados, nesta área também é reportado o tempo gasto para a

construção do modelo.

AVALIAÇÃO DO MODELO (EVALUATION ON TEST MODEL): aqui são

sumarizadas informações a respeito da avaliação obtida, a partir do tipo do

método de teste escolhido para a construção do modelo de classificação. Estas

informações compreendem a porcentagem de instâncias classificadas

corretamente (Correctly Classified Instances), porcentagem de instâncias

classificadas erroneamente (Incorrectly Classified Instances), medidas de erro

(Kappa statistic, Mean absolute error, Root mean squared error, Relative

absolute error, Root relative squared error) e o número total de casos

empregados para avaliar o modelo (Total Number of Instances). Nesta parte do

relatório-padrão, ainda são apresentados um sumário detalhado de acurácia

por classe (Detailed Accuracy By Class) e a matriz de confusão (Confusion

Matrix). A matriz de confusão é uma matriz quadrática, que reporta de forma

prática o número de amostras classificadas segundo as classes presentes no

modelo, ou seja, sua leitura se dá da seguinte forma: os números localizados

na diagonal correspondem as amostras classificadas corretamente, enquanto

que os números localizados fora da diagonal correspondem aos casos

pertencentes a uma determinada classe que foram classificados pelo modelo

144

como pertencentes a outra. Em alguns dos relatórios-padrão apresentados

neste trabalho, a “AVALIAÇÃO DO MODELO” terá adicionalmente uma

reavaliação obtida pela apresentação do conjunto de teste ao modelo gerado

(Re-evaluation on test set), e neste são as mesmas informações citadas

anteriormente, porém contabilizadas para o conjunto de teste.

Tabela 7.2: Relatório-padrão do software WEKA com os resultados da classificação por Árvore

de Decisão com 60 variáveis para os dados brutos.

=== Run information ===

Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2Relation: Dados sel-weka.filters.unsupervised.attribute. Instances: 200Attributes: 61Test mode: evaluate on training data

=== Classifier model (full training set) ===

J48 pruned tree------------------

HOP/STER <= 3.3921| 21+22/STER <= 0.0073: MAR_EVP (20.0)| 21+22/STER > 0.0073| | 26/25TRI <= 1.2119: MIST_T_CAR (36.0/1.0)| | 26/25TRI > 1.2119: MIST_T_ARB (39.0)HOP/STER > 3.3921| DITERP/H30 <= 0.9844: LAC_SIL_A (25.0)| DITERP/H30 > 0.9844| | DIA/C27AA <= 0.2899: LAC_A (44.0)| | DIA/C27AA > 0.2899| | | abb/(abb+aaa) <= 0.4432| | | | TPP <= 0.9259| | | | | p_H34 <= 8.9633: LAC_B (2.0)| | | | | p_H34 > 8.9633: LAC_SIL_B (10.0)| | | | TPP > 0.9259: LAC_B (19.0)| | | abb/(abb+aaa) > 0.4432: LAC_A (5.0/1.0)

Number of Leaves : 9

Size of the tree : 17

Time taken to build model: 0.23 seconds

=== Evaluation on training set ====== Summary ===

Correctly Classified Instances 198 99 %Incorrectly Classified Instances 2 1 %Kappa statistic 0.988Mean absolute error 0.0051Root mean squared error 0.0503Relative absolute error 2.129 %Root relative squared error 14.5985 %Total Number of Instances 200

=== Detailed Accuracy By Class ===

TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A1 0 1 1 1 LAC_SIL_B1 0.007 0.98 1 0.99 LAC_A0.955 0 1 0.955 0.977 LAC_B1 0.006 0.972 1 0.986 MIST_T_CAR0.975 0 1 0.975 0.987 MIST_T_ARB1 0 1 1 1 MAR_EVP

=== Confusion Matrix ===

a b c d e f g <-- classified as25 0 0 0 0 0 0 | a = LAC_SIL_A0 10 0 0 0 0 0 | b = LAC_SIL_B0 0 48 0 0 0 0 | c = LAC_A0 0 1 21 0 0 0 | d = LAC_B0 0 0 0 35 0 0 | e = MIST_T_CAR0 0 0 0 1 39 0 | f = MIST_T_ARB0 0 0 0 0 0 20 | g = MAR_EVP

145

Tabela 7.3: Relatório-padrão do software WEKA com os resultados da classificação por Árvore de Decisão com 60 variáveis para os dados padronizados.


Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2Relation: Dados sel-weka.filters.unsupervised.attribute. weka.filters.unsupervised.attribute.StandardizeInstances: 200Attributes: 61Test mode: evaluate on training data


J48 pruned tree------------------

H30/C27AA <= -0.850079| 21+22/STER <= -1.272227: MAR_EVP (20.0)| 21+22/STER > -1.272227| | 26/25TRI <= -0.935826: MIST_T_CAR (36.0/1.0)| | 26/25TRI > -0.935826: MIST_T_ARB (39.0)H30/C27AA > -0.850079| GAM/TR23 <= -0.530408| | DIA/C27AA <= -0.227629: LAC_A (44.0)| | DIA/C27AA > -0.227629| | | abb/(abb+aaa) <= 0.720777| | | | TPP <= 1.032395| | | | | p_H34 <= -0.840575: LAC_B (2.0)| | | | | p_H34 > -0.840575: LAC_SIL_B (10.0)| | | | TPP > 1.032395: LAC_B (19.0)| | | abb/(abb+aaa) > 0.720777: LAC_A (5.0/1.0)| GAM/TR23 > -0.530408: LAC_SIL_A (25.0)







TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A1 0 1 1 1 LAC_SIL_B1 0.007 0.98 1 0.99 LAC_A0.955 0 1 0.955 0.977 LAC_B1 0.006 0.972 1 0.986 MIST_T_CAR0.975 0 1 0.975 0.987 MIST_T_ARB1 0 1 1 1 MAR_EVP



146

Tabela 7.4: Relatório-padrão do software WEKA com os resultados da classificação por Árvore

de Decisão com 60 variáveis para os dados organizados aleatoriamente.

Os resultados apresentados mostram que, independentemente do arquivo

utilizado (dados brutos, padronizados ou organizados aleatoriamente), a arquitetura da

Árvore de Decisão resultante não muda. De modo semelhante, os números de acertos

(198) e erros (2) permanecem iguais, além das amostras classificadas corretamente e

erroneamente nos três casos serem as mesmas. Pode-se observar na matriz de

confusão que uma amostra de óleo Misto do Trend de Areia Branca (MIST_T_ARB) foi

erroneamente classificada como óleo Misto do Trend de Carnaubais (MIST_T_CAR),


Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2Relation: Dados sel rand-weka.filters.unsupervised.attributeInstances: 200Attributes: 61Test mode: evaluate on training data


J48 pruned tree------------------

HOP/STER <= 3.3921| 21+22/STER <= 0.0073: MAR_EVP (20.0)| 21+22/STER > 0.0073| | 26/25TRI <= 1.2119: MIST_T_CAR (36.0/1.0)| | 26/25TRI > 1.2119: MIST_T_ARB (39.0)HOP/STER > 3.3921| DITERP/H30 <= 0.9844: LAC_SIL_A (25.0)| DITERP/H30 > 0.9844| | DIA/C27AA <= 0.2899: LAC_A (44.0)| | DIA/C27AA > 0.2899| | | abb/(abb+aaa) <= 0.4432| | | | TPP <= 0.9259| | | | | p_H34 <= 8.9633: LAC_B (2.0)| | | | | p_H34 > 8.9633: LAC_SIL_B (10.0)| | | | TPP > 0.9259: LAC_B (19.0)| | | abb/(abb+aaa) > 0.4432: LAC_A (5.0/1.0)







TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A1 0.007 0.98 1 0.99 LAC_A1 0.006 0.972 1 0.986 MIST_T_CAR0.975 0 1 0.975 0.987 MIST_T_ARB1 0 1 1 1 MAR_EVP1 0 1 1 1 LAC_SIL_B0.955 0 1 0.955 0.977 LAC_B


a b c d e f g <-- classified as25 0 0 0 0 0 0 | a = LAC_SIL_A0 48 0 0 0 0 0 | b = LAC_A0 0 35 0 0 0 0 | c = MIST_T_CAR0 0 1 39 0 0 0 | d = MIST_T_ARB0 0 0 0 20 0 0 | e = MAR_EVP0 0 0 0 0 10 0 | f = LAC_SIL_B0 1 0 0 0 0 21 | g = LAC_B

147

assim como uma amostra de óleo Lacustre B (LAC_B) foi equivocadamente

classificada como óleo Lacustre A (LAC_A).

Foram feitos testes com as três modalidades de arquivos de entrada de dados,

e verificou-se que é possível prosseguir o estudo utilizando apenas um modelo de

arquivo, sendo aqui empregado o modelo com dados brutos. O arquivo com dados

brutos apresenta maior facilidade de interpretação e utilização das regras geradas pela

Árvore de Decisão em relação ao arquivo com dados padronizados, cujo emprego

resulta numa árvore com regras com valores entre –1 e 1, o que levaria à necessidade

de recalcular o valor real da variável para interpretação e utilização do modelo. Já o

arquivo com dados organizados aleatoriamente, embora não apresente dificuldades

quanto à interpretação dos valores das variáveis que constam na Árvore de Decisão,

dificulta a avaliação dos dados na tabela original, pois as amostras se encontram

embaralhadas.

Dando prosseguimento ao trabalho, o mesmo arquivo contendo os valores

brutos foi particionado em um conjunto de treinamento e outro de teste, sendo o

arquivo de treinamento constituído por 179 amostras (90%) e o de teste por 21

amostras (10%).

Os experimentos realizados seguiram a metodologia de treinamento e

validação oferecida pelo WEKA na opção Percentage split no Test options. Esta

metodologia permite que os casos sejam divididos aleatoriamente em dois grupos

contendo cada um deles tamanhos determinados pelo usuário. Quando se escolhe

80% na opção Percentage split, 80% (143 amostras) serão selecionados

aleatoriamente para constituírem o banco de treinamento e os 20% remanescentes

(36 amostras) irão compor o banco de validação. Neste estudo os 20% serão

considerados banco de validação, devido à criação independente de um conjunto de

teste com 21 amostras, anteriormente a esta separação.

A seqüência de passos seguidos por esta metodologia é de, inicialmente,

realizar o treinamento utilizando o grupo composto de 143 amostras (treino).

Posteriormente, a validação é feita apresentando ao sistema o grupo de validação

composto pelas 36 amostras remanescentes, quando a média dos erros é calculada.

Somente depois destes passos o arquivo de teste com 21 amostras é carregado no

programa e o modelo é aplicado observando-se sua performance frente a novas

amostras.

Cabe salientar, que os resultados reportados pelo programa independem do

método escolhido no Test options, ou seja, o modelo apresentado sempre será aquele

gerado a partir da avaliação de todo o conjunto de treinamento (KIRKBY & FRANK,

148

2007). Desta forma, a utilização da metodologia de split foi com o intuito de, ao final,

estimar o erro de generalização para o modelo construído.

O primeiro teste foi realizado com a variação do Fator de Confiança entre os

valores de 0,02, 0,5 e 0,9. De acordo com o Fator de Confiança utilizado, o tamanho

da árvore, o número de folhas obtido e os percentuais de casos classificados

corretamente serão avaliados. Os resultados obtidos pelo teste estão apresentados

nas tabelas 7.5 e 7.6. As figuras 7.3 e 7.4 apresentam a visualização da arquitetura

das árvores geradas. Os resultados para os modelos de Árvore de Decisão gerados

para Fator de Confiança 0,5 e 0,9 são idênticos. Conseqüentemente, foi apresentado

apenas o resultado para Fator de Confiança 0,5.

149

Tabela 7.5: Relatório-padrão do software WEKA com os resultados da classificação por Árvore de Decisão com 60 variáveis e Fator de Confiança de 0,02.


Scheme: weka.classifiers.trees.J48 -C 0.02 -M 1Relation: Dados sel 179Instances: 179Attributes: 61Test mode: split 80% train, remainder test


J48 pruned tree------------------

HOP/STER <= 3.3921| 21+22/STER <= 0.0073: MAR_EVP (17.0)| 21+22/STER > 0.0073| | 24/25TRI <= 1.1811: MIST_T_CAR (31.0)| | 24/25TRI > 1.1811| | | delC13 <= -26.14: MIST_T_ARB (37.0)| | | delC13 > -26.14: MIST_T_CAR (1.0)HOP/STER > 3.3921| DITERP/H30 <= 0.9844: LAC_SIL_A (22.0)| DITERP/H30 > 0.9844| | DIA/C27AA <= 0.2899: LAC_A (41.0)| | DIA/C27AA > 0.2899| | | abb/(abb+aaa) <= 0.4432| | | | TPP <= 0.9259| | | | | p_H34 <= 8.9633: LAC_B (2.0)| | | | | p_H34 > 8.9633: LAC_SIL_B (7.0)| | | | TPP > 0.9259: LAC_B (16.0)| | | abb/(abb+aaa) > 0.4432: LAC_A (5.0/1.0)




=== Evaluation on test split ====== Summary ===

Correctly Classified Instances 34 94.4444 %Incorrectly Classified Instances 2 5.5556 %Kappa statistic 0.9306Mean absolute error 0.0159Root mean squared error 0.126Relative absolute error 6.5905 %Root relative squared error 35.8671 %Total Number of Instances 36


TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A0.75 0 1 0.75 0.857 LAC_SIL_B1 0 1 1 1 LAC_A1 0.029 0.5 1 0.667 LAC_B1 0.031 0.8 1 0.889 MIST_T_CAR0.923 0 1 0.923 0.96 MIST_T_ARB1 0 1 1 1 MAR_EVP



150

Figura 7.3: Arquitetura da Árvore de Decisão gerada com 60 variáveis e Fator de Confiança de 0,02.

=== Re-evaluation on test set ===

User supplied test setRelation: Dados sel teste-weka.filters.unsupervised.attribute.Instances: 21Attributes: 61

=== Summary ===

Correctly Classified Instances 21 100 %Incorrectly Classified Instances 0 0 %Kappa statistic 1Mean absolute error 0Root mean squared error 0 Total Number of Instances 21


TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A1 0 1 1 1 LAC_SIL_B1 0 1 1 1 LAC_A1 0 1 1 1 LAC_B1 0 1 1 1 MIST_T_CAR1 0 1 1 1 MIST_T_ARB1 0 1 1 1 MAR_EVP



151

Tabela 7.6: Relatório-padrão do software WEKA com os resultados da classificação por Árvore de Decisão com 60 variáveis e com Fator de Confiança de 0,5.


Scheme: weka.classifiers.trees.J48 -C 0.5 -M 1Relation: Dados sel 179Instances: 179Attributes: 61Test mode: split 80% train, remainder test


J48 pruned tree------------------

HOP/STER <= 3.3921| 21+22/STER <= 0.0073: MAR_EVP (17.0)| 21+22/STER > 0.0073| | 24/25TRI <= 1.1811: MIST_T_CAR (31.0)| | 24/25TRI > 1.1811| | | delC13 <= -26.14: MIST_T_ARB (37.0)| | | delC13 > -26.14: MIST_T_CAR (1.0)HOP/STER > 3.3921| DITERP/H30 <= 0.9844: LAC_SIL_A (22.0)| DITERP/H30 > 0.9844| | DIA/C27AA <= 0.2899: LAC_A (41.0)| | DIA/C27AA > 0.2899| | | abb/(abb+aaa) <= 0.4432| | | | TPP <= 0.9259| | | | | p_H34 <= 8.9633: LAC_B (2.0)| | | | | p_H34 > 8.9633: LAC_SIL_B (7.0)| | | | TPP > 0.9259: LAC_B (16.0)| | | abb/(abb+aaa) > 0.4432| | | | TOTALHEIGHT <= 65127: LAC_A (4.0)| | | | TOTALHEIGHT > 65127: LAC_B (1.0)







TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A0.75 0 1 0.75 0.857 LAC_SIL_B1 0 1 1 1 LAC_A1 0.029 0.5 1 0.667 LAC_B1 0.031 0.8 1 0.889 MIST_T_CAR0.923 0 1 0.923 0.96 MIST_T_ARB1 0 1 1 1 MAR_EVP



152

Figura 7.4: Arquitetura da AD gerada com 60 variáveis e Fator de Confiança 0,5.


User supplied test setRelation: Dados sel teste-weka.filters.unsupervised.attribute. Instances: 21Attributes: 61

=== Summary ===

Correctly Classified Instances 21 100 %Incorrectly Classified Instances 0 0 %Kappa statistic 1Mean absolute error 0Root mean squared error 0 Total Number of Instances 21





153

Após o treinamento com as 143 amostras, a Árvore de Decisão obtida com um

Fator de Confiança de 0,02 (Tabela 7.5) classificou corretamente 34 das 36 amostras

de validação (índice de acerto de 94,4%). Na matriz de confusão, pode-se verificar que

as duas amostras classificadas erroneamente correspondem a um óleo do tipo

Lacustre Siliciclástico B (classificado como Lacustre B) e a um óleo Misto do Trend de

Areia Branca (classificado como Misto do Trend de Carnaubais). Já o índice de acerto

de classificação das 21 amostras de teste foi de 100%. Na Árvore de Decisão (Tabela

7.5 e Figura 7.3), observa-se que a razão Hopanos/Esteranos (HOP/STER) permitiu

separar, de um lado, todos óleos lacustres (valores superiores a 3,3921), e de outro

lado os óleos mistos (Trends de Areia Branca e Carnaubais) e marinho-evaporíticos

(valores da razão HOP/STER menores que 3,3921).

Entre os óleos lacustres, a razão DITERP/H30 separa os óleos lacustres

siliciclásticos A (22 amostras com valores de DITERP/H30 menores que ou iguais a

0,9844) dos demais. Em seguida, a razão DIA/C27AA serviu como critério para

distinguir os óleos lacustres A (41 amostras com valores dessa razão menores ou

iguais a 0,2899) dos restantes. Uma pequena parte de amostras do tipo lacustre A (5

amostras) se encontrou isolada das demais 41 amostras deste grupo por não atender

ao critério da razão DIA/C27AA. Entretanto, essas 5 amostras se diferenciaram das

outras lacustres na continuação da ramificação da árvore por terem valores da razão

abb/(abb+aaa) (indicativa de evolução térmica) mais altos que 0,4432. As amostras

restantes compreendem dois grupos de óleos lacustre B (16 e 2 amostras) e um grupo

de lacustre siliciclástico B (7 amostras), sendo as razões TPP e p_H34 utilizadas para

diferenciá-los. Em resumo, a Árvore de Decisão separou os óleos lacustres em

conjuntos homogêneos com correspondência quase que perfeita em relação aos

grupos previamente reconhecidos, com exceção de um desdobramento de 5 amostras

de óleos lacustres A (aparentemente com evolução térmica mais elevada que as

demais 41 amostras deste grupo) e 2 amostras de óleos lacustres B (que se

encontram, todavia relativamente próximas das demais deste grupo na Árvore de

Decisão). No ramo dos óleos mistos e marinho-evaporíticos, valores da razão

21+22/STER permitem diferenciar estes óleos (todos óleos marinho-evaporíticos

possuem valores desta razão menores que ou iguais a 0,0073) dos mistos.

Praticamente todos os óleos mistos do Trend de Carnaubais (31 amostras) atendem o

critério de 24/25TRI menor que ou igual a 1,1811. A única amostra remanescente do

grupo do Trend de Carnaubais foi separada das 37 amostras do Trend de Areia

Branca por valor de isótopo estável de carbono (delC13).

Assim como no treinamento realizado com Fator de Confiança 0,02, a Árvore

de Decisão obtida com um Fator de Confiança de 0,5 (Tabela 7.6) classificou

154

corretamente 34 das 36 amostras de validação (índice de acerto de 94,4%),

lembrando que o resultado obtido para o Fator de Confiança de 0,5 foi idêntico ao com

0,9, sendo então reportado apenas o resultado com Fator de Confiança de 0,5. Na

matriz de confusão, pode-se verificar que as duas amostras classificadas

erroneamente correspondem as mesmas amostras classificadas incorretamente no

modelo anterior, ou seja, um óleo do tipo Lacustre Siliciclástico B (classificado como

Lacustre B) e a um óleo Misto do Trend de Areia Branca (classificado como Misto do

Trend de Carnaubais). Também como no modelo gerado com Fator de Confiança

0,02, o índice de acerto de classificação das 21 amostras de teste foi de 100% e na

Árvore de Decisão (Tabela 7.6 e Figura 7.4), observa-se que as razões escolhidas

pelo algoritmo para separar as classes permanecem quase as mesmas, bem como

seus limites.

A diferença entre os modelos gerados com Fator de Confiança 0,02 e 0,5 está

presente apenas pela inserção da variável TOTALHEIGHT (Soma das alturas das n- e

isoparafinas mais a UCM do cromatograma gasoso) na discriminação de uma

amostra da classe Lacustre B (LAC_B) que anteriormente se encontrava agrupada

com uma amostra da classe Lacustre A (LAC_A), o emprego desta variável está

associado ao fato das amostras pertencentes a classe Lacustre A possuírem um

cromatograma gasoso com características de óleos menos preservados, e por vezes,

afetado por biodegradação reduzindo assim o valor da soma das alturas dos

compostos, e as amostras de óleo da classes Lacustre B por serem mais evoluídas

termicamente e ainda possuírem cromatogramas gasosos de óleos preservados

acarreta em valores maiores deste parâmetro.

Buscando novos conjuntos de informações que pudessem resultar em um

melhor desempenho do algoritmo de Árvores de Decisão, foram realizados também

testes considerando apenas as 25 variáveis escolhidas para o refinamento da

classificação proposta no capítulo anterior. Estas variáveis apresentadas na tabela 7.7,

foram escolhidas a partir da construção de gráficos binários (x versus y) e

correspondem àquelas que melhor agrupavam as classes.

155

Tabela 7.7: Variáveis de entrada empregadas para a construção do modelo “baseado nas variáveis escolhidas durante a classificação”. Para identificação dos parâmetros e razões,

consultar Anexos I e II.

A mesma metodologia seguida para a geração dos modelos no arquivo

composto com as 60 variáveis variando o Fator de Confiança foi empregada para a

geração dos modelos a partir do arquivo composto pelas 25 variáveis selecionadas

durante o refinamento da classificação.

Os resultados obtidos pelo teste variando apenas o parâmetro Fator de

Confiança em 0,02, 0,5 e 0,9 não apresentam variação nos modelos gerados. Assim,

os resultados apresentados na tabela 7.8 e na figura 7.5 são para o teste com Fator de

Confiança de 0,02.

PRI/PHY PHY/NC18 Parâmetros de Cromatografia Gasosa% NSO Parâmetros de Cromatografia Líquida

δ13C Isótopo de Carbono Total19/23TRI Parâmetros de Biomarcadores20S/(20S+20R) St 21/23TRI 24/25TRI 26/25TRI 27/29ββS(218) DIA30/C27αα DITERP/H30 GAM/H30 H28/H29 H28/H30 H28/TR23 H29/C29TS H29/H30 HOP/STER TET24/26TRI TPP TR23/H30 TRIC/HOP TS/(TS+TM) αββ/(αββ+ααα)

156

Tabela 7.8: Relatório-padrão do software WEKA com os resultados da classificação por Árvore de Decisão com 25 variáveis com Fator de Confiança de 0,02.


Scheme: weka.classifiers.trees.J48 -C 0.02 -M 1Relation: Dados sel var erica visual 179Instances: 179Attributes: 26Test mode: split 80% train, remainder test


J48 pruned tree------------------

HOP/STER <= 3.3921| TR23/H30 <= 0.0366: MAR_EVP (17.0)| TR23/H30 > 0.0366| | 24/25TRI <= 1.1811: MIST_T_CAR (31.0)| | 24/25TRI > 1.1811| | | delC13 <= -26.14: MIST_T_ARB (37.0)| | | delC13 > -26.14: MIST_T_CAR (1.0)HOP/STER > 3.3921| DITERP/H30 <= 0.9844: LAC_SIL_A (22.0)| DITERP/H30 > 0.9844| | TPP <= 0.9508| | | TPP <= 0.9259| | | | GAM/H30 <= 0.2415| | | | | PHY/NC18 <= 0.1477: LAC_B (2.0)| | | | | PHY/NC18 > 0.1477: LAC_A (4.0)| | | | GAM/H30 > 0.2415: LAC_SIL_B (7.0)| | | TPP > 0.9259| | | | GAM/H30 <= 0.2151: LAC_A (1.0)| | | | GAM/H30 > 0.2151: LAC_B (17.0)| | TPP > 0.9508: LAC_A (40.0)







TP Rate FP Rate Precision Recall F-Measure Class0.5 0 1 0.5 0.667 LAC_SIL_A0.5 0.059 0.333 0.5 0.4 LAC_SIL_B1 0 1 1 1 LAC_A0.667 0.03 0.667 0.667 0.667 LAC_B1 0 1 1 1 MIST_T_CAR1 0 1 1 1 MIST_T_ARB1 0 1 1 1 MAR_EVP



157

Figura 7.5: Arquitetura da AD com 25 variáveis e Fator de Confiança de 0,02.


User supplied test setRelation: Dados sel var erica visual 21Instances: 21Attributes: 26

=== Summary ===

Correctly Classified Instances 20 95.2381 %Incorrectly Classified Instances 1 4.7619 %Kappa statistic 0.9444Mean absolute error 0.0136Root mean squared error 0.1166Total Number of Instances 21


TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A1 0 1 1 1 LAC_SIL_B1 0 1 1 1 LAC_A1 0 1 1 1 LAC_B1 0.056 0.75 1 0.857 MIST_T_CAR1 0 1 1 1 MIST_T_ARB0.667 0 1 0.667 0.8 MAR_EVP



158

O treinamento realizado com as 143 amostras e Fator de Confiança de 0,02,

0,5 e 0,9 resultaram em um mesmo modelo de Árvore de Decisão (Tabela 7.8) que

classificou corretamente 33 das 36 amostras de validação (índice de acerto de 91,6%).

Na matriz de confusão, pode-se verificar que as três amostras foram classificadas

erroneamente e estas correspondem a um óleo do tipo Lacustre Siliciclástico A

(classificado como Lacustre Siliciclástico B), um óleo do tipo Lacustre Siliciclástico B

(classificado como Lacustre B) e a um óleo Lacustre B (classificado como Lacustre

Siliciclástico B). O índice de acerto de classificação das 21 amostras de teste foi de

95,2%, em virtude de uma amostra da classe Marinho-evaporítico ter sido classificada

como Misto Trend de Carnaubais. Na Árvore de Decisão (Tabela 7.8 e Figura 7.4),

observa-se que a razão Hopanos/Esteranos (HOP/STER) permitiu separar, mais uma

vez, de um lado, todos óleos lacustres (valores superiores a 3,3921, mesmo valor

observado nos modelos geradas anteriormente com 60 variáveis e Fatores de

Confiança 0,02, 0,5 e 0,9), e de outro lado os óleos mistos (Trends de Areia Branca e

Carnaubais) e marinho-evaporíticos (valores da razão HOP/STER menores que

3,3921).

Entre os óleos mistos e marinho-evaporíticos, na ausência da razão

21+22/STER foi empregada a razão TR23/H30 que permitiu diferenciar todos óleos

marinho-evaporíticos por possuírem valores desta razão menores que ou iguais a

0,0366 dos óleos mistos. Como as razões 24/25TRI e delC13 ainda permanecem

neste conjunto de variáveis, mais uma vez, elas foram selecionadas e com os mesmos

limites empregados nos modelos anteriores, mostrando que se constituem de

parâmetros importantes no que diz respeito à discriminação das classes Misto Trend

de Areia Branca e de Carnaubais. Já entre os óleos lacustres, a razão DITERP/H30

separa os óleos lacustres siliciclásticos A (22 amostras com valores de DITERP/H30

menores que ou iguais a 0,9844) dos demais, como nos modelos anteriores. Em

seguida, a razão DIA/C27AA foi substituída pelo valor de TPP, que quando superior a

0,9508 separa 40 amostras da classe Lacustre A de 19, 5 e 7 amostras das classes

Lacustre B, Lacustre A e Lacustre Siliciclástico B, respectivamente, que possuem este

valor inferior ou igual a 0,9508. Uma pequena parte de amostras do tipo lacustre A (5

amostras) se encontrou isolada das demais 40 amostras deste grupo por não atender

ao critério da razão TPP. Seguindo a árvore, o valor de TPP é mais uma vez

empregado, agora com limite superior a 0,9259 discriminando a maioria das amostras

da classe Lacustre B (17 amostras) e apenas uma amostra da classe Lacustre A das

demais, neste ramo a razão Gam/H30 quando superior a 0,2151 separa as 17

amostras pertencentes à classe Lacustre B da única amostra da Lacustre A. No outro

ramo, onde a razão TPP é inferior oi igual a 0,9259 estão presentes 19, 4 e 7 amostras

159

pertencentes às classes Lacustre B, Lacustre A e Lacustre Siliciclástico B,

respectivamente, e estas amostras inicialmente são separadas pela razão Gam/H30

como, no ramo oposto, porém com limites diferentes, valores desta razão superiores a

0,2415 separam as sete amostras das classe Lacustre Siliciclástico B das demais que

possuem valores inferiores ou iguais a este. As amostras restantes são separadas

pela razão PHY/NC18 através do limite superior a 0,1477 que discriminou as quatro

amostras da classe Lacustre A das duas amostras da classe lacustre B que possuem

valores inferiores ou iguais a este.

De uma maneira geral, o modelo de Árvore de Decisão gerado para as 25

variáveis e Fatores de Confiança 0,02, 0,5 e 0,9 apresentou uma boa performance,

porém quando comparado com os modelos anteriores, demonstrou uma queda relativa

na capacidade de classificação visto a presença de três amostras classificadas

erroneamente no conjunto de validação contra apenas duas amostras classificadas

incorretamente nos modelos gerados com 60 variáveis. No conjunto de teste

observou-se um erro contra os 100% de acerto dos modelos anteriores.

7.3) Aplicação da Técnica de Redes Neurais Artificiais

Para a aplicação da técnica de Redes Neurais Artificiais (RNA’s) foi escolhido

o algoritmo MultiLayerPerceptron. Os arquivos de entrada foram os mesmos

empregados na construção do modelo de Árvores de Decisão, ou seja, um arquivo de

treino (179 amostras) e teste (21 amostras) contendo ambos as 60 variáveis e as sete

classes, e outro arquivo contendo o conjunto de treino (179 amostras) e teste (21

amostras), porém com as 25 variáveis selecionadas durante o refinamento da

classificação, além das sete classes.

Na seção anterior, antes de prosseguir com a geração do modelo de Árvores

de Decisão, em virtude da diferença entre as escalas das variáveis empregadas para

construção do modelo, foi realizado um teste com arquivos de dados brutos,

padronizados e com dados organizados aleatoriamente. Para a análise por Redes

Neurais Artificiais não será necessário este teste, pois o próprio software oferece na

sua guia de edição do algoritmo MultiLayerPerceptron estas opções.

Os experimentos realizados para a construção dos modelos de Redes Neurais

Artificiais seguiram a mesma seqüência de passos adotada na confecção das Árvores

de Decisão. Assim o treinamento e validação foram realizados pela escolha da opção

Percentage split no Test options do WEKA, e o arquivo de teste foi aquele criado

anteriormente a esta separação.

160

Foram seguidos os seguintes passos: realizou-se primeiramente o treinamento

utilizando o conjunto composto de 80% dos casos (treino); posteriormente a validação

foi processada apresentando ao sistema o grupo de validação composto dos 20% dos

casos remanescentes, a partir do qual a média dos erros foi calculada, e finalmente, o

arquivo de teste foi carregado no programa e o modelo aplicado observando-se a

performance frente a estas novas amostras.

Diversos testes foram realizados no algoritmo MultiLayerPerceptron variando

parâmetros como número de neurônios na camada escondida, Taxa de Aprendizado,

Termo Momento e Número de Épocas (ciclos) antes de escolher aqueles que

resultassem no modelo mais representativo. Alguns resultados destes testes

mostraram que a utilização de uma Taxa de Aprendizado muito pequena (≈0.1)

associada a um Termo Momento baixo (≈0.1-0.3) não é aconselhável para este

conjunto de dados, independentemente do número de épocas que se escolha (por

exemplo, 100, 500, 1000 e 10000).

Durante estes experimentos também foi possível observar que os testes

realizados com a opção decay (decaimento da Taxa de Aprendizado) ativada foram os

piores, desta forma esta opção foi descartada dos demais experimentos. A melhor

resposta do algoritmo para o arquivo contendo as 60 variáveis foi o realizado com 20

neurônios na camada escondida, Taxa de Aprendizado de 0,6, Termo Momento de 0,4

e Número de Épocas de 500. A variação do Número de Épocas para valores maiores

(até 10000) não se mostrou eficiente, sendo preferível trabalhar com um Número de

Épocas menor visto a maior velocidade na aquisição da resposta. A tabela 7.9

apresenta o resultado sumarizado da rede obtida para esta topologia, no anexo IV o

resultado é apresentado de forma completa incluindo os pesos adotados nas

conexões.

161

Tabela 7.9: Relatório-padrão do software WEKA com os resultados da classificação por Redes Neurais Artificiais para o conjunto com 60 variáveis.


Scheme: weka.classifiers.functions.MultilayerPerceptron-L 0.6 -M 0.4 -N 500 -V 0 -S 0 -E 20 -H 30 -BRelation: Dados sel 179Instances: 179Attributes: 61

Test mode: split 80% train, remainder test






TP Rate FP Rate Precision Recall F-Measure Class1 0.033 0.857 1 0.923 LAC_SIL_A0 0 0 0 0 LAC_SIL_B1 0 1 1 1 LAC_A1 0.031 0.8 1 0.889 LAC_B1 0 1 1 1 MIST_T_CAR1 0 1 1 1 MIST_T_ARB1 0 1 1 1 MAR_EVP



162

O modelo de Redes Neurais Artificiais (Tabela 7.9 e Anexo IV) gerado pelo

treinamento do conjunto que contém 60 variáveis foi obtido de acordo com a topologia

descrita acima. Este modelo classificou corretamente 34 das 36 amostras de validação

(índice de acerto de 94,4%). O modelo gerado pelas Redes Neurais Artificiais não

reporta uma arquitetura de fácil entendimento como os modelos gerados pelas Árvores

de Decisão, desta forma seus resultados ficam mais restritos a interpretação baseada

na matriz de confusão. Nesta, verifica-se que as duas amostras classificadas

erroneamente correspondem a dois óleos do tipo Lacustre Siliciclástico B, onde um

deles foi classificado como Lacustre B e o outro como Lacustre Siliciclástico A. O

índice de acerto de classificação no conjunto de teste (21 amostras) foi de 90,4%. As

duas amostras classificadas incorretamente no conjunto de teste correspondem a um

óleo da classe Lacustre Siliciclástico B (classificado como Lacustre B) e um óleo da

classe Lacustre B (classificado como Lacustre Siliciclástico A).

Da mesma maneira do que foi feito anteriormente, buscaram-se novos

conjuntos de informações que pudessem resultar em um melhor desempenho do

algoritmo de das Redes Neurais Artificiais através de testes considerando apenas as

variáveis escolhidas para o refinamento da classificação.

Os experimentos de maneira análoga àqueles realizados para o arquivo com

as 60 variáveis visando alcançar a melhor topologia para a rede com um conjunto de

25 variáveis, mostraram que a utilização de uma Taxa de Aprendizado muito pequena

(≈0.1), bem como grande (0,6) associada a um Termo Momento baixo (≈0.1-0.3) ou

alto (0,7) não é aconselhável para este conjunto de dados, independentemente do


User supplied test setRelation: Dados sel teste-weka.filters.unsupervised.attribute.Remove-R1-10,16,37,45,60Instances: 21Attributes: 61

=== Summary ===

Correctly Classified Instances 19 90.4762 %Incorrectly Classified Instances 2 9.5238 %Kappa statistic 0.8889Mean absolute error 0.0306Root mean squared error 0.142 Total Number of Instances 21


TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A0.667 0.056 0.667 0.667 0.667 LAC_SIL_B1 0 1 1 1 LAC_A0.667 0.056 0.667 0.667 0.667 LAC_B1 0 1 1 1 MIST_T_CAR1 0 1 1 1 MIST_T_ARB1 0 1 1 1 MAR_EVP



163

número de épocas que se escolha (por exemplo, 100, 500, 1000 e 10000). Os

melhores resultados foram obtidos com Taxas de Aprendizado medianas. O número

de neurônios na camada escondida não apresentou melhora nos resultados quando

superior a seis.

Desta forma, após a análise dos experimentos concluiu-se que a melhor

configuração da rede seria 6 neurônios na camada escondida, Taxa de Aprendizado

de 0,3, Termo Momento de 0,6 e Número de Épocas de 100. Diferentemente, do

modelo anterior, a variação do Número de Épocas para valores maiores se mostrou

ineficiente piorando o resultado. Portanto, optou-se por trabalhar com um Número de

Épocas menor. O resultado sumarizado para a rede obtida com esta topologia é

apresentado na tabela 7.10. No anexo V o resultado é apresentado de forma

completa, incluindo os pesos adotados nas conexões.

164

Tabela 7.10: Relatório-padrão do software WEKA com os resultados da classificação por Redes Neurais Artificiais para o conjunto com 25 variáveis.


Scheme: weka.classifiers.functions.MultilayerPerceptron-L 0.3 -M 0.6 -N 100 -V 0 -S 0 -E 20 -H 6 -BRelation: Dados sel var erica visual 179Instances: 179Attributes: 26Test mode: split 80% train, remainder test




Correctly Classified Instances 36 100 %Incorrectly Classified Instances 0 0 %Kappa statistic 1Mean absolute error 0.0415Root mean squared error 0.0941Relative absolute error 17.1704 %Root relative squared error 26.6319 %Total Number of Instances 36





165

Assim como foi realizado anteriormente para o conjunto que contém 60

variáveis, foi construído um modelo de Redes Neurais Artificiais através do

treinamento de uma rede com o conjunto contendo 25 variáveis (Tabela 7.10 e Anexo

V). Este modelo classificou corretamente 100% das amostras de validação. O índice

de acerto de classificação no conjunto de teste (21 amostras) foi de 95,2%. Apenas

uma amostra do conjunto de teste foi classificada incorretamente, e esta corresponde

a um óleo da classe Lacustre Siliciclástico B (classificado como Lacustre B).


User supplied test setRelation: Dados sel var erica visual 21Instances: 21Attributes: 26

=== Summary ===

Correctly Classified Instances 20 95.2381 %Incorrectly Classified Instances 1 4.7619 %Kappa statistic 0.9444Mean absolute error 0.043Root mean squared error 0.1208Total Number of Instances 21


TP Rate FP Rate Precision Recall F-Measure Class1 0 1 1 1 LAC_SIL_A0.667 0 1 0.667 0.8 LAC_SIL_B1 0 1 1 1 LAC_A1 0.056 0.75 1 0.857 LAC_B1 0 1 1 1 MIST_T_CAR1 0 1 1 1 MIST_T_ARB1 0 1 1 1 MAR_EVP



166

CAPÍTULO

8

8. DISCUSSÃO DOS RESULTADOS Neste capítulo serão apresentadas as discussões dos resultados obtidos para cada uma das técnicas de inteligência artificial: Árvore de Decisão (AD’s) e Redes Neurais Artificiais (RNA’s), bem como sua comparação com a classificação proposta no Capítulo 6 e o contraste frente à eficiência das técnicas.

8.1) Introdução

Os resultados apresentados no capítulo anterior foram obtidos utilizando uma

metodologia análoga, onde inicialmente o modelo foi construído a partir de um

conjunto de 179 amostras que, posteriormente, para critério de avaliação, foi

particionado em dois grupos (um de treino e outro de validação). A construção do

modelo de avaliação foi realizada com um conjunto de treinamento composto de 143

amostras (80%), e este modelo foi posteriormente quantificado com o conjunto de

validação composto das 36 amostras remanescentes (20%), sendo estes grupos

divididos pelo próprio software através da opção Percentage split. Finalmente, o

modelo gerado foi analisado com o grupo de amostras de teste (21 amostras)

selecionadas previamente. Cabe ressaltar que os conjuntos de treinamento e

validação podem ter sido diferentes em qualquer um dos modelos, pois embora as 179

amostras carregadas no software tenham sido as mesmas, para cada split de 80%

solicitado, uma semente (seed) foi empregada, buscando um melhor resultado

classificatório para o modelo gerado. Em outras palavras, de acordo com a semente

escolhida, um novo conjunto de treino (80%) e validação (20%) foi gerado a partir das

179 amostras. Sendo assim, apenas os bancos de treino para a construção do modelo

final e o de teste foram os mesmos em todos os experimentos.

Para a construção do modelo classificatório de Árvores de Decisão (AD’s), foi

escolhido o algoritmo J48 e para o de Redes Neurais Artificiais (RNA’s) o algoritmo

Multi Layer Perceptron (MLP), ambos disponíveis no software WEKA.

167

Segundo KIRKBY & FRANK (2007), os modelos que são reportados nos

relatórios-padrão correspondem aos modelos gerados pelo treinamento realizado em

todo o conjunto de dados carregado no programa. Os resultados da avaliação do

modelo gerado são aqueles oriundos da construção de um modelo (que é omitido do

relatório-padrão) segundo determinação do usuário no Test options, porém é a partir

deste modelo omitido, que a matriz de confusão e os cálculos das medidas de erro e

acurácia são apresentados. Desta forma, cabe ao usuário observar no modelo final

(“Classifier model”, apresentado no relatório-padrão) o número de amostras que se

encontram classificadas erroneamente, bem como analisar a probabilidade de tal

amostra pertencer a cada uma das classes envolvidas no estudo.

Partindo-se do exposto acima, os modelos gerados no capítulo anterior serão

discutidos e comparados com a classificação proposta no Capítulo 6.

8.2) Comparação da Classificação por AD’s com a Original

Como o modelo gerado para avaliação não é reportado e sua existência reside

apenas para critério da estimativa do erro de generalização, fica difícil prever onde

surgiu um critério que levou a uma classificação equivocada durante a elaboração

deste modelo. Portanto, aqui serão discutidos os erros de classificação do modelo

completo (“Classifier model” apresentado no relatório-padrão do software WEKA).

A primeira arquitetura de Árvore de Decisão gerada foi para o conjunto que

contém as 60 variáveis e emprego do Fator de Confiança igual a 0,02. Este modelo

apresentou 10 folhas, ou seja, deste pode-se extrair 10 regras do tipo SE-ENTÃO,

conforme descrito no Capítulo 5. O segundo modelo ainda foi gerado para o conjunto

com 60 variáveis, porém com Fatores de Confiança 0,5 e 0,9 (ambos alcançaram o

mesmo resultado). Este modelo resultou em uma árvore com 11 folhas, ou seja, com

11 regras do tipo SE-ENTÃO.

A Árvore de Decisão gerada com Fator de Confiança de 0,02 apresentou um

erro de classificação, e a Árvore de Decisão construída com Fatores de Confiança de

0,5 e 0,9 não apresentou erros de classificação na etapa de construção do modelo.

Ambos os modelos não possuem erros de classificação para o conjunto de teste.

A amostra classificada incorretamente no modelo gerado com Fator de

Confiança de 0,02 como Lacustre A corresponde à amostra de número 85 (classe

Lacustre B; contida na tabela do anexo III). O erro de classificação deveu-se ao não

crescimento da árvore em virtude da utilização de um Fator de Confiança baixo (0,02).

Segundo QUINLAN (1993), para valores de Fator de Confiança baixos, maior é a poda

168

da árvore. Portanto, quando foi utilizado um Fator de Confiança maior (0,5 e 0,9), a

árvore não foi podada naquele ponto, e continuou crescendo permitindo a

classificação da amostra Lacustre B corretamente.

A figura 8.1 mostra o momento em que a amostra de número 85 ficou retida na

folha correspondente à classe Lacustre A, e a figura 8.2 apresenta a 11ª regra gerada

com intuito de separar esta amostra das demais.

Figura 8.1: Esquema ilustrando o momento em que a Árvore de Decisão (para 60 variáveis e Fator de Confiança de 0,02) foi podada e acarretou a classificação incorreta de uma amostra da classe Lacustre B como Lacustre A. Os gráficos apresentam os limites empregados pelo

algoritmo na distinção das classes. Observar a amostra classificada erroneamente destacada com um quadrado vermelho no gráfico DIA/C27αα versus αββ/(αββ+ααα). Para identificação

das razões de biomarcadores, consultar anexo II.

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

DIA/C27αα

αββ/

(αββ

+ααα

)



Lacustre B, Lacustre Siliciclástico A ou B.

Lacustre A

0

0.1

0.2

0.3

0.4

0.5

0.6

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

DIA/C27αα

αββ/

(αββ

+ααα

)

La c u s t re A La c u s tre B

Lacustre A

Lacustre B

Amostra da classe Lacustre Bclassificada como Lacustre A. 0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

DIA/C27αα

αββ/

(αββ

+ααα

)



Lacustre B, Lacustre Siliciclástico A ou B.

Lacustre A

0

0.1

0.2

0.3

0.4

0.5

0.6

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

DIA/C27αα

αββ/

(αββ

+ααα

)


Lacustre A

Lacustre B

Amostra da classe Lacustre Bclassificada como Lacustre A.

0

0.1

0.2

0.3

0.4

0.5

0.6

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

DIA/C27αα

αββ/

(αββ

+ααα

)


Lacustre A

Lacustre B

Amostra da classe Lacustre Bclassificada como Lacustre A.

169

Figura 8.2: Criação da 11ª regra da Árvore de Decisão que permitiu a classificação correta da amostra da classe Lacustre B. Árvore gerada com 60 variáveis e Fator de Confiança de 0,5 e

0,9.

Esta amostra, identificada como 85ª na tabela do anexo III, apresenta

características geoquímicas em seu cromatograma gasoso, bem como nos seus

fragmentogramas de massas, típicos para amostras da classe Lacustre B, porém o

limite apresentado pelas demais amostras de sua classe na razão αββ/(αββ+ααα) foi

inferior ao seu, o que levou esta a ser classificada com 80% de chances de pertencer

à classe Lacustre A e apenas 20% de pertencer a classe Lacustre B, segundo a

distribuição de probabilidades calculada pelo programa. O valor desta razão pode ter

sido afetado pela diferença da amplitude no sinal do pico correspondente ao composto

C27R, que se encontra levemente mais abundante em relação as demais amostras da

mesma classe, o que levou ao aumento do valor calculado para a razão

αββ/(αββ+ααα).

Como os dois modelos não apresentaram erros no conjunto de teste, cabe

agora avaliar com novas amostras pertencentes à classe Lacustre B se haverá alguma

que possua o valor da razão αββ/(αββ+ααα) superior a 0,4432. Isso irá determinar se

vale à pena permanecer com esta folha na árvore. Caso contrário, a árvore gerada

com Fator de Confiança de 0,02 pode ser empregada para classificação de novas

amostras utilizando um erro pessimista de 5,5% (duas amostras classificadas

erradas), obtido pelo modelo gerado com Percentage split de 80%, ou ainda calcular

um erro mais otimista através de outra métrica.

Nova regra gerada paraclassificação da amostra Lacustre B.

170

Ainda a respeito da árvore gerada, é possível observar que quatro amostras

correspondentes à classe Lacustre A não respeitaram à condição

αββ/(αββ+ααα)<0,4432. Estes óleos correspondem às amostras identificadas como

21, 37, 50 e 58, na tabela contida no Anexo III. A 50ª amostra apresenta uma

distribuição de diasteranos levemente mais pronunciada, o que é comum nos óleos

oriundos deste campo, o qual se encontra numa porção isolada da bacia. As amostras

37 e 58 pertencem a óleos recuperados do mesmo campo de petróleo, porém a

amostra 37 representa um óleo de alta evolução térmica, o que segundo discutido no

Capítulo 6 leva a reclassificá-la como classe Lacustre B, a amostra 58 não apresenta

alta evolução térmica, mas possui os picos correspondentes ao compostos C27αββS

C27αββR levemente menores, quando comparada com as demais amostras da

classe. A 21ª amostra possui os picos correspondentes aos homólogos do C27

esteranos não tão bem resolvidos em virtude da coeluição de metilesteranos no

mesmo tempo de retenção, o que pode ter acarretado na variação do valor da razão

αββ/(αββ+ααα).

As regras geradas pelos modelos de Árvore de Decisão, quando comparadas

com as utilizadas na classificação das amostras no Capítulo 6, assemelham-se

bastante, em particular no que diz respeito aos limites apresentados pelo algoritmo. A

primeira regra, que permitiu separar de um lado amostras lacustres e de outro mistos e

marinho-evaporíticos, quando contrastada com os valores apresentados na tabela 6.3,

apresenta valores próximos:

SE HOP/STER>3,3921 ENTÃO classe “Lacustres”.

SE HOP/STER≤3,3921 ENTÃO classes Marinho-evaporítico ou “Mistos”.

contra o limite de 3,3 (vide tabela 6.3) que separa as primeiras amostras a possuírem

valores mais baixos desta razão (Misto Trend de Areia Branca) dos óleos lacustres em

geral, que possuem valores acima de nove (9,0).

Outra razão que também foi apresentada no Capítulo de 6 é 24/25TRI>1,2

(classe Misto Trend de Areia Branca) e 24/25TRI<1,2 (classe Misto Trend de

Carnaubais). A regra da Árvore de Decisão define valor superior a 1,1811 para a

classe Misto Trend de Areia Branca e inferior/igual a 1,1811 para a classe Misto Trend

de Carnaubais. Para esta regra é observado que a amostra 137 (tabela do anexo III)

da classe Misto Trend de Carnaubais não obedece a regra, fato devido a intensidade

do pico correspondente ao composto C24 tricíclico ser sutilmente maior em relação aos

demais óleos da classe Misto Trend de Carnaubais.

Seguindo para o outro lado da árvore, onde se localizam os óleos da classe

lacustre, observa-se que a razão DITERP/H30 que separa as amostras da classe

171

Lacustre Siliciclástico A das demais lacustres está presente na tabela 6.3 com valores

similares, ou seja, próximos a um (1,0).

Uma das razões que levou a segmentação da classe Lacustre em Lacustre A e

B foi a maior concentração relativa de diasteranos em alguns óleos que parecem ser

mais evoluídos termicamente (Lacustre B). Nas Árvores de Decisão geradas, o limite

calculado para esta razão (DIA/C27AA) parece concordante com os mostrados no

gráfico da figura 6.14. No que diz respeito as amostras Lacustre Siliciclástico B e

Lacustre B, as quais possuem a razão αββ/(αββ+ααα) elevada, o do valor do TPP

permite separar quase todas as amostras da classe Lacustre B (>0,9259) das Lacustre

Siliciclástico B (≤0,9259). Apenas duas amostras da classe Lacustre B fogem à regra

por serem um pouco mais evoluídas termicamente em relação às amostras da mesma

classe, sendo estas duas então destacadas pela regra p_H34 menor ou igual a 8,9633

(classe Lacustre B).

Na tentativa de melhorar o desempenho do algoritmo de Árvores de Decisão,

foram construídos modelos com apenas as 25 variáveis que melhor discriminaram as

amostras durante o refinamento da classificação. Estes modelos gerados de maneira

análoga aos experimentos anteriores com 60 variáveis apresentaram o mesmo

resultado para o emprego dos diferentes valores de Fatores de Confiança (0,02, 0,5 e

0,9).

A árvore resultante (Figura 8.3) possui 11 folhas, nenhuma amostra

classificada errada no modelo gerado com as 179 amostras, erro de generalização

pessimista de 8,3% (três amostras classificadas incorretamente) e uma amostra

classificada incorretamente no conjunto de teste.

172

Figura 8.3: Árvore de Decisão gerada com 25 variáveis e Fator de Confiança de 0,02, 0,5 e 0,9.

A amostra classificada incorretamente no conjunto de teste corresponde à

amostra identificada como 198 na tabela do anexo III. Esta pertence à classe Marinho-

evaporítico e foi classificada como Misto Trend de Carnaubais por apresentar o valor

da razão TR23/H30 igual a 0,0428, superior ao limite estipulado para as amostras de

sua classe (≤0,0366). A alteração no valor desta razão para esta amostra é decorrente

da menor abundância do pico correspondente ao composto C30 hopano.

As razões escolhidas para derivar as regras apresentadas pela árvore, de uma

certa maneira, são semelhantes às discutidas anteriormente. A primeira delas, por

exemplo, é a mesma utilizada no modelo gerado pelas 60 variáveis (SE

HOP/STER>3,3921 ENTÃO “lacustres” e SE HOP/STER ≤3,3921 ENTÃO marinho-

evaporítico ou “mistos”). No ramo esquerdo (dos óleos marinho-evaporítico ou mistos),

a razão 21+22/STER, ausente neste conjunto, foi substituída pela razão TR23/H30

com o prejuízo de uma amostra do conjunto de teste (classe Marinho-evaporítico)

classificada incorretamente. Este fato mostra a importância da razão 21+22/STER, não

comumente empregada na classificação de óleos, para a identificação da classe

Marinho-evaporítico nesta bacia. As demais regras, neste ramo esquerdo, são as

mesmas dos modelos anteriores.

Partindo-se para o ramo direito da árvore, são encontradas as amostras das

classes lacustres, e a primeira regra apresentada ainda permanece idêntica a dos

modelos já discutidos. Em substituição à razão DIA/C27αα, o algoritmo optou por

173

utilizar o valor de TPP para discriminar 40 amostras da classe Lacustre A contra as 41

amostras desta classe discriminadas com a razão DIA/C27αα nos modelos

precedentes. Seguindo a classificação, o valor de TPP é empregado mais uma vez

com o mesmo limite, superior a 0,9259 (classe Lacustre B + uma amostra da classe

Lacustre A) e inferior/igual a 0,9259 (classe Lacustre Siliciclástico B + duas amostras

da classe Lacustre B, e quatro da classe Lacustre B) separando de um lado boa parte

das amostras da classe Lacustre B das demais.

A razão GAM/H30 é empregada com intuito de separar tanto a única amostra

da classe Lacustre A que foi agrupada juntamente com as amostras da classe

Lacustre B, quanto do outro lado para discriminar todas as amostras da classe

Lacustre Siliciclástico B das demais. A respeito da criação de qualquer regra, o caso

mais crítico, é sempre aquele que está relacionado à sua criação para a discriminação

de apenas uma amostra. Isto posto, a regra - SE GAM/H30 inferior ou igual a 0,2151

ENTÃO classe Lacustre A - deve ser avaliada. Se forem analisadas as 48 amostras da

classe Lacustre A separadamente, 17 delas (35%) possuem valores para esta razão

concordantes ao apresentado pela regra da árvore (Figura 8.4). Assim, é esperado

que, caso mais amostras desta classe não respeitem a condição TPP superior a

0,9508 não venha ser uma exceção possuir valores da razão GAM/H30 inferior ou

igual a 0,2151, pois das amostras estudadas 35% apresentam estes valores.

Figura 8.4: Gráfico mostrando a presença de 17 amostras (35%) da classe Lacustre A que

possuem valores da razão Gam/H30 inferior a 0,2151, concordando com a regra apresentada pela Árvore de Decisão do modelo com 25 variáveis. Para identificação das razões de

biomarcadores, consultar anexo II.

Como neste experimento as razões empregadas foram aquelas previamente

selecionadas, cabe avaliar apenas os limites calculados pelo algoritmo. A razão

0

0.1

0.2

0.3

0.4

0.5

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1TPP

Gam

/H30



0

0.1

0.2

0.3

0.4

0.5

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1TPP

Gam

/H30



174

TR23/H30, assim como a 21+22/STER, não é comumente empregada na

discriminação de amostras de óleo, e se mostrou bastante eficiente na identificação

dos óleos marinho-evaporíticos nesta bacia. A presença da razão TR23/H30 no

conjunto das 25 melhores variáveis era devido à separação das classes Lacustre

Siliciclástico A e B, como apresentado na tabela 6.3 e figura 6.13, e não a propósito da

classe marinho-evaporítico. Este fato mostra a importância do método na busca por

novos padrões de informação previamente desapercebidos pelo especialista.

A informação foi descoberta pelo programa, agora cabe ao especialista avaliar

qual das duas razões é a melhor para compor o conjunto final de regras

classificatórias dos óleos desta bacia. Uma maneira simples de julgá-las é através da

construção de gráficos com estes parâmetros e observar neles, os limites entres as

amostras da classe discriminada frente às amostras das demais classes. A figura 8.5

(a) e (b) apresenta dois gráficos que mostram que o limite estipulado para a razão

21+22/STER é mais confiável que o da razão TR23/H30 para diferenciar os óleos

marinho-evaporíticos dos mistos, em virtude de possuir menos amostras de outras

classes circundando as vizinhanças deste valor. Este fato reduz a probabilidade de

futuramente, com novas amostras, o classificador gerado levar a erros de

classificação.

175

Figura 8.5: Gráficos mostrando os limites das razões 21+22/STER e TR23/H30. Em (a)

observar a presença de poucas amostras da classe Misto Trend de Areia Branca na vizinhança do valor limite calculado. Em (b) observar a grande quantidade de amostras da classe Misto

Trend de Carnaubais próximo ao limite da razão para a classe marinho-evaporítico. Para identificação das razões de biomarcadores, consultar anexo II.

As demais razões presentes na árvore gerada como, por exemplo, TPP maior

que 0,9508 para as amostras da classe Lacustre A e GAM/H30 superior a 0,2415 para

as amostras classe Lacustre Siliciclástico B são concordantes com os valores

apresentados na tabela 6.3.

Em resumo, a utilização da técnica de Árvores de Decisão mostrou-se bastante

eficiente na classificação e na descoberta de informações. Porém, seu emprego deve

ser feito com o acompanhamento de um especialista no assunto, pois apenas este

será capaz de avaliar quais parâmetros escolhidos serão realmente capazes de

compor um modelo generalista para classificação de novas amostras, não permitindo

que modelos superajustados ao conjunto de treino venham a ser utilizados como

0

0.01

0.02

0.03

0.04

0.05

0 0.2 0.4 0.6 0.8 1

TPP

21+2

2/ST

ER



0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0 0.2 0.4 0.6 0.8 1

TPP

TR23

/H30



(a)

(b)

0

0.01

0.02

0.03

0.04

0.05

0 0.2 0.4 0.6 0.8 1

TPP

21+2

2/ST

ER



0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0 0.2 0.4 0.6 0.8 1

TPP

TR23

/H30



0

0.01

0.02

0.03

0.04

0.05

0 0.2 0.4 0.6 0.8 1

TPP

21+2

2/ST

ER



0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0 0.2 0.4 0.6 0.8 1

TPP

TR23

/H30



(a)

(b)

176

padrão classificatório. Adicionalmente, a análise crítica do especialista é a única capaz

de avaliar se determinada classificação de óleo é coerente com critérios geológicos.

8.3) Comparação da Classificação por RNA’s com a Original

De maneira diferente da discussão a respeito dos resultados apresentados

pelos modelos de Árvore de Decisão, que são claros e de fácil interpretação, os

modelos gerados pela técnica de Redes Neurais Artificiais ficam restritos apenas ao

julgamento dos resultados para o conjunto de parâmetros empregados para compor a

camada de entrada da rede e sua topologia.

O primeiro modelo foi gerado com o arquivo das 60 variáveis, 20 neurônios na

camada escondida, Taxa de Aprendizado de 0,6, Termo Momento de 0,4 e Número

de Épocas igual a 500. Esta configuração resultou em apenas uma amostra

classificada erroneamente no modelo gerado com as 179 amostras, erro de

generalização pessimista de 5,5% (duas amostras com classificação erradas) e duas

amostras classificadas incorretamente no conjunto de teste.

A amostra classificada equivocadamente no modelo completo (179 amostras)

corresponde à amostra de número 37 na tabela do anexo III, pertencente à classe

Lacustre A classificada como Lacustre Siliciclástico B. Este óleo é muito evoluído

termicamente, o que acarreta a alteração dos valores das razões de parâmetros

geoquímicos.

A figura 8.6 mostra os fragmentogramas de massas dos íons 191 e 217, da

amostra 37 e um exemplo da classe Lacustre A, outro da classe Lacustre Siliciclástico

B e um terceiro da classe Lacustre B. Nesta figura, é possível observar a alteração na

distribuição dos hopanos (íon m/z 191) e dos esteranos (íon m/z 217) na amostra 37.

Provavelmente, esta amostra foi classificada como Lacustre Siliciclástico B em função

da distribuição de esteranos que se assemelha com a amostra exemplificada desta

classe.

177

Figura 8.6: Fragmentogramas de massas m/z 191 e 217 de um óleo típico da classe Lacustre A, do óleo classificado incorretamente e de um óleo da classe Lacustre Siliciclástico B e outro

da classe Lacustre B. Para identificação dos compostos consultar anexo I.

Este erro de classificação deve ser considerado, visto que uma das

argumentações levantadas para o desmembramento da classe Lacustre em A e B era

o fato da existência de óleos mais evoluídos termicamente no segundo conjunto.

Assim, embora a amostra de número 37 não seja realmente da classe Lacustre

Siliciclástico B como reportado pelo algoritmo de Redes Neurais Artificiais, esta

deveria ter sido classificada como Lacustre B pelo especialista por ser mais evoluída

termicamente.

As amostras classificadas incorretamente no conjunto de teste correspondem

às amostras identificadas como 104 e 34 contidas na tabela do anexo III. A amostra

104 pertence à classe Lacustre B e foi classificada como Lacustre Siliciclástico B, esta

apresentando suas razões de evolução térmica elevadas, o que sugere um óleo mais

evoluído. Desta forma, alguns parâmetros podem estar afetados pela evolução

térmica. Como o modelo de Redes Neurais Artificiais é construído a partir de todas as

informações oferecidas no arquivo de entrada, e diferente da Árvore de Decisão que

Lacustre ATR

19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28 NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B H29

C29

TSD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AMH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

S H35

R

Lacustre Aclassificada comoLacustre Siliciclástico B

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

S BB_D

29S

C27

BBS

C27

RC

28S

C28

BBR

C28

BBS

C28

RC

29S

C29

BBR

C29

BBS

C29

R

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TSTM TR

30A

TR30

B

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R G

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R


S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

S C27

R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

S21

S22 D

IA27

SD

IA27

RD

IA27

S2D

IA27

R2

C27

S BB

_D29

SC

27B

BS

C27

R

C28

S C28

BB

RC

28B

BS

C28

R C29

SC

29B

BR

C29

BB

SC

29R

m/z 191 m/z 217

Lacustre B

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2 C27

S BB

_D29

SC

27B

BS

C27

R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

Lacustre ATR

19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28 NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

TR19

TR20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28 NO

R25

HH

29C

29TS

DH

30M

29H

30N

OR

30H

M30

H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B TS

TMTR

30A

TR30

B H29

C29

TSD

H30

M29

H30

NO

R30

HM

30H

31S

H31

RG

AMH

32S

H32

R

H33

SH

33R

H34

SH

34R

H35

S H35

R

Lacustre Aclassificada comoLacustre Siliciclástico B

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

S BB_D

29S

C27

BBS

C27

RC

28S

C28

BBR

C28

BBS

C28

RC

29S

C29

BBR

C29

BBS

C29

R

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TSTM TR

30A

TR30

B

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R G

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4 TR26

ATR

26B

TR28

ATR

28B

TR29

ATR

29B

TSTM TR

30A

TR30

B

H29

C29

TSD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R G

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R


S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

S C27

R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2

C27

SB

B_D

29S

C27

BB

S C27

R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

S21

S22 D

IA27

SD

IA27

RD

IA27

S2D

IA27

R2

C27

S BB

_D29

SC

27B

BS

C27

R

C28

S C28

BB

RC

28B

BS

C28

R C29

SC

29B

BR

C29

BB

SC

29R

S21

S22 D

IA27

SD

IA27

RD

IA27

S2D

IA27

R2

C27

S BB

_D29

SC

27B

BS

C27

R

C28

S C28

BB

RC

28B

BS

C28

R C29

SC

29B

BR

C29

BB

SC

29R

m/z 191 m/z 217

Lacustre B

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R

TR19 TR

20

TR21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TS TM TR30

ATR

30B

H28 NO

R25

HH

29C

29T

SD

H30

M29

H30

NO

R30

HM

30 H31

SH

31R

GA

MH

32S

H32

RH

33S

H33

RH

34S

H34

RH

35S

H35

R S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2 C27

S BB

_D29

SC

27B

BS

C27

R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

S21

S22

DIA

27S

DIA

27R

DIA

27S2

DIA

27R

2 C27

S BB

_D29

SC

27B

BS

C27

R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R

178

escolhe apenas aqueles parâmetros com maior poder de discriminação, a Rede

Neural Artificial recorre ao ajuste de pesos para dar esta ponderação. Porém, na

classe Lacustre B, apenas uma amostra (número 94 na tabela do anexo III) que possui

características semelhantes a esta estava contida no conjunto de treinamento. Desta

forma, a rede foi construída baseada na característica global da classe, buscando um

modelo generalista, penalizando assim a amostra 104.

A amostra 34 pertencente à classe Lacustre Siliciclástico B e classificada

incorretamente como Lacustre B, embora não destoe das demais amostras da mesma

classe possui os valores de algumas razões ausentes, o que pode ter acarretado sua

classificação errônea.

O modelo gerado com o arquivo das 25 variáveis possuiu como topologia: 6

neurônios na camada escondida, Taxa de Aprendizado de 0,3, Termo Momento de

0,6 e Número de Épocas igual a 100. Esta configuração não resultou em amostras

classificadas incorretamente no modelo gerado com as 179 amostras, seu erro de

generalização pessimista foi de 0% e uma amostra foi classificada incorretamente no

conjunto de teste.

O erro de classificação no conjunto de teste apresentado por este modelo

corresponde ao mesmo erro apresentado pelo modelo gerado com o conjunto das 60

variáveis. Esta repetição deve ser encarada como uma adversidade da técnica à

criação de um modelo robusto quando se dispõem de poucas amostras para

treinamento. A classe Lacustre Siliciclástico B continha apenas sete amostras no

conjunto de treinamento contra 21, 45, 19, 32, 37 e 17 das classes Lacustre

Siliciclástico A, Lacustre A, Lacustre B, Misto Trend de Carnaubais, Misto Trend de

Areia Branca e Marinho-evaporítico, respectivamente. Esta diferença de número de

casos não permitiu um aprendizado completo para a Rede Neural Artificial.

De uma maneira geral, a técnica de Redes Neurais Artificiais apresentou uma

boa performance, em particular para rede gerada com as 25 variáveis. A utilização

apenas dos parâmetros que possuem um maior poder discriminatório entre as classes

permitiu construir um modelo mais robusto e menos susceptível a confusões.

8.4) Discussão Geral dos Resultados

A implementação de duas diferentes técnicas, Árvores de Decisão e Redes

Neurais Artificiais, teve como objetivo avaliar a performance das mesmas na

classificação genética de amostras de óleo. Ambas responderam positivamente ao

propósito do trabalho.

179

A técnica de Árvores de Decisão, quando comparada com a de Redes Neurais

Artificiais, mostrou-se mais flexível na geração modelos com o arquivo das 60

variáveis. Já com o emprego do arquivo de 25 variáveis, a técnica de Redes Neurais

Artificiais construiu um modelo mais contundente. Estas observações refletem o fato

de que cada técnica depende de características exclusivas do seu arquivo de entrada

para a idealização de seu modelo final.

A técnica de Rede Neural Artificial mostrou-se mais sensível a diferenças no

número de amostras pertencentes a cada classe no arquivo de treinamento, o que não

foi observado para a técnica de Árvores de Decisão.

As amostras que foram classificadas erroneamente nos modelos gerados pelas

diferentes técnicas utilizadas não são coincidentes, o que sugere que cada técnica

identifica e trata os “problemas” de uma maneira ímpar.

O emprego da técnica de Árvores de Decisão permitiu identificar algumas

razões, não comumente empregadas pelos especialistas (por exemplo, 21+22/STER e

TR23/H30) como razões-chave para identificação de óleos da classe Marinho-

evaporítico na Bacia Potiguar. Neste trabalho, a razão TR23/H30 havia sido sugerida

para a separação das amostras da classe Lacustre Siliciclástico A das da classe

Lacustre Siliciclástico B e, surpreendentemente, ela aparece na árvore separando

amostras da classe Marinho-evaporítico das amostras das classes de óleos mistos.

A técnica de Árvores de Decisão, além de identificar novos padrões de

informações, também serviu para corroborar os já existentes, como discutido no item

8.2, onde a semelhança dos limites calculados pelo algoritmo e os estipulados pelo

especialista apresentados no Capítulo 6 foram confrontados. Adicionalmente, o

emprego da técnica permitiu atentar para o fato de uma amostra ter sido classificada

incorretamente como classe Lacustre A, enquanto na verdade, esta deveria ter sido

classificada como classe Lacustre B.

Por ser um modelo “caixa-preta”, as Redes Neurais Artificiais não permitem

que o usuário faça uma crítica detalhada ao modelo gerado. Porém, neste estudo,

ficou claro que a arquitetura do arquivo de entrada é imprescindível na geração do

modelo de Redes Neurais Artificiais, assim como a homogeneidade no número de

amostras de cada classe no arquivo de treinamento. Um fato interessante a respeito

do resultado desta técnica foi o erro de classificação da amostra 37 como Lacustre

Siliciclástico B, o que levou à reavaliação desta classificação, sendo a mesma

reclassificada como pertencente à classe Lacustre B, e não à classe Lacustre A.

Assim como é comum efeitos de evolução térmica e biodegradação resultarem

em classificações equivocadas por especialistas humanos devido à alteração dos

parâmetros geoquímicos comumente empregados, neste trabalho foram observadas

180

algumas inconsistências nos modelos gerados devido à presença de óleos com maior

evolução térmica. A biodegradação aqui não foi crítica na variação dos parâmetros,

até porque as amostras mais biodegradadas não apresentavam desvios significativos

nos seus parâmetros geoquímicos, bem como pertenciam a classes bastante

discerníveis. Uma importante observação a respeito do emprego de técnicas de aprendizado

de máquina é a necessidade de um especialista na avaliação dos modelos

construídos. Todo modelo é passível de erros, e nada substitui a experiência humana,

por isso este trabalho apresentou este capítulo de discussão dos resultados obtidos

pelo aprendizado de máquina. Modelos gerados sem a supervisão crítica humana

estão sujeitos a sérios problemas de generalização e podem configurar associações

não geoquímicas, apenas matemáticas e sem significado geológico interpretativo.

Em resumo, ambas as técnicas foram de grande valia para o aprendizado

geoquímico, seja este inerente à identificação de novos padrões, a corroboração dos

já usuais, reclassificação de amostras, ou na atenção que deve ser dada durante a

elaboração do arquivo de entrada. A combinação do conhecimento do especialista

com as técnicas de Inteligência Artificial permite uma exploração mais extensiva dos

dados, com um padrão de “feedback” e aprendizado que pode levar o especialista a

rever classificações e descobrir novos critérios. Por outro lado, o especialista pode

interferir no modelo gerado por Inteligência Artificial de modo a torná-lo mais confiável,

robusto e coerente com informações geológicas.

181

CAPÍTULO

9

9. CONCLUSÕES E RECOMENDAÇÕES Neste capítulo serão sumarizadas as conclusões obtidas durante o desenvolvimento deste trabalho e recomendações para trabalhos futuros serão sugeridas.

9.1) Conclusões

A utilização de inteligência computacional e a conseqüente extração de

conhecimentos a partir de grandes bases de dados constituem uma prática recente

nas áreas científicas. O desenvolvimento de softwares e algoritmos com este objetivo

auxilia cada vez mais especialistas nesta complexa tarefa.

Com o intuito de testar e comprovar a aplicabilidade de algumas técnicas de

Inteligência Artificial, que têm sido propostas ao longo dos anos para classificação de

tipos de amostras, o principal objetivo deste trabalho foi desenvolver modelos

classificatórios através do aprendizado de máquina que permitissem a predição das

classes genéticas de óleos da Bacia Potiguar, porção terrestre.

Para o desenvolvimento deste trabalho, foi necessário um conjunto de dados

geoquímicos homogêneo, e para garantir esta amostragem harmônica dos óleos foi

proposta como alternativa à amostragem aleatória convencional, uma associação

desta com a Análise de Cluster. A seqüência de passos seguidos para a construção

do arquivo final se mostrou satisfatória, tendo em vista que as premissas de

distribuição por classe e distribuição geográfica foram atendidas.

Após a seleção das amostras, o conjunto amostrado apresentou características

que permitiram a realização de um refinamento da classificação anteriormente

adotada. O emprego dos dados de Geoquímica Orgânica, em particular os de

biomarcadores, permitiu reclassificar as amostras de óleo da Bacia Potiguar, porção

terrestre, da seguinte maneira:

As amostras classificadas como Lacustres foram subdivididas em Lacustres A

e B.

As amostras classificadas como Lacustres Siliciclásticas foram subdivididas em

Lacustres Siliciclásticas A e B.

182

As amostras classificadas como Mistas foram reorganizadas em três diferentes

classes: a primeira representada pelas amostras marinho-evaporíticas, a

segunda pelas amostras mistas pertencentes ao Trend de Areia Branca e a

terceira pelas amostras mistas oriundas do Trend de Carnaubais.

Dentre as principais características de cada classe, são observados para:

CLASSE LACUSTRE: Grau API em geral superior a 20º, porcentagem de

enxofre inferior a 0,5%, alta concentração de compostos saturados (>50%),

predominância de n-alcanos de alto peso molecular, razão pristano/fitano

superior a 2,0, razão hopanos/esteranos >10, baixo índice de gamacerano,

razão 26/25 tricíclicos >1,6, razão H35/H34 homopanos na faixa de 0,4-0,8,

predominância de C29 esteranos sobre seus homólogos C27 e C28, e valores de

isótopos estáveis de carbono total geralmente inferiores a –30,00‰. As

amostras da classe Lacustre A apresentam valores da razão

diasteranos/C27ααα esteranos inferiores a 0,4, sendo valores superiores a

atribuídos às amostras da classe Lacustre B. A abundância do composto Ts é

superior a seu homólogo Tm nos óleos da classe Lacustre B, na classe

Lacustre A ocorre o inverso. A razão H29/C29Ts atinge valores entre 3,0 e 7,0

para as amostras Lacustres A, enquanto as Lacustres B não ultrapassam 3,5.

A razão de TPP é mais elevada nos óleos da classe Lacustre A (>0,96) em

relação aos da classe Lacustre B (<0,96).

CLASSE LACUSTRE SILICICLÁSTICO: Grau API entre 25 e 47º, porcentagem

de enxofre de 0,05 a 0,28%, porcentagem de compostos saturados elevada

(>59%), abundância relativa de n-alcanos de alto peso molecular, razão

pristano/fitano >2,0, razão C26/C25 tricíclicos alta (>1,4), razão entre H35/H34

homopanos ≈0,5, concentração de TPP de 0,5 a 1,0, razão diasteranos/C27ααα

esteranos >0,4, predominância de C29 esteranos sobre seus homólogos C27 e

C28. A classe Lacustre Siliciclástico B apresenta maior concentração relativa de

compostos tricíclicos em relação à classe Lacustre Siliciclástico A, assim como

a razão TPP é mais alta nos óleos da classe Lacustre Siliciclástico B. A razão

gamacerano/hopano é mais alta na classe Lacustre Siliciclástico B e a razão n-

C18/fitano é mais elevada na classe Lacustre Siliciclástico A.

CLASSE MARINHO-EVAPORÍTICO: Grau API comumente inferior a 15º, teor

de enxofre superior a 0,75%, porcentagem de compostos NSO >35%, ausência

ou baixa concentração de n-alcanos e isoprenóides, razão hopanos/esteranos

<2,0, 21/23 tricíclicos <0,7, 24/25 tricíclicos <1,05, gamacerano/hopano >0,98,

183

TET24/26Tri >0,7, tricíclicos/hopanos <0,07, Ts/(Ts+Tm) <0,3, C29 S/(S+R)

esteranos <0,35, C29 αββ/(αββ+ααα) esteranos <0,3, e valores de isótopos

estáveis de carbono mais pesados que –26,0‰.

CLASSE MISTO: Grau API geralmente entre 10 e 40º, teor de enxofre entre

0,05 e 1,0%, porcentagem de compostos saturados entre 30 e 80%, razão

pristano/fitano com valores inferiores a 1,5, distribuição de n-alcanos variável

segundo a diferente contribuição à mistura, razão hopanos/esteranos entre 1,0

e 3,5, índice de gamacerano, em grande parte, entre 0,5 e 1,0, razão 26/25

tricíclicos com valores predominantemente acima de 1,0, razão H35/H34

homopanos entre 0,6 e 1,0, razão diasteranos/C27ααα esteranos inferior a 0,4,

e isótopos estáveis de carbono total entre –28,50‰ e –25,50‰. As amostras

desta classe foram subdivididas em função da diferença na contribuição dos

end-members à mistura, o que determinou uma configuração mais ligada ao

end-member marinho-evaporítico às amostras oriundas do Trend de

Carnaubais. No Trend de Areia Branca, a contribuição do end-member lacustre

é mais marcante, em particular para os óleos recuperados à medida que se

caminha mais para dentro no continente. Um outro fator é a biodegradação,

que alterou mais os óleos do Trend de Carnaubais, tornando os óleos desta

região com uma qualidade inferior (maiores porcentagens de compostos NSO

e grau API baixo) quando comparados com os do Trend de Areia Branca.

Esta classificação proposta foi a adotada para o treinamento e construção dos

modelos apresentados neste trabalho.

Os modelos de Árvores de Decisão foram construídos de maneira simples e

rápida. Esta técnica resultou num melhor modelo para o arquivo com mais variáveis

(60 variáveis) e Fator de Confiança maior (0,5 e 0,9). Os modelos gerados possuem

10 e 11 critérios ou regras de distinção dos grupos de amostras, tendo sido bem

sucedidos na classificação e agrupamento corretos da ampla maioria das amostras.

A aplicação da técnica de Árvores de Decisão permitiu identificar algumas

razões que antes não eram comumente empregadas na identificação de óleos. Por

exemplo, 21+22/STER e TR23/H30 como razões-chave para a discretização da classe

Marinho-Evaporítico na Bacia Potiguar.

A técnica de Árvores de Decisão, além de identificar novos padrões, também

auxiliou na consagração dos mais usuais, fato este ilustrado pelos limites calculados

através do algoritmo para as regras e suas semelhanças com os valores apresentados

pelo especialista. Adicionalmente, durante a interpretação das regras geradas, foi

possível observar que uma amostra tinha sido classificada equivocadamente pelo

184

especialista como Lacustre A e na verdade após uma análise mais detalhada de seus

parâmetros geoquímicos foi possível reclassificá-la como lacustre B.

A construção do modelo através da técnica de Redes Neurais Artificiais foi a

que demandou maior tempo de pesquisa, visto a necessidade de obter uma topologia

que convergisse em um melhor resultado para cada conjunto (60 e 25 variáveis).

O melhor resultado foi obtido com a rede gerada pelo arquivo com 25 variáveis,

mostrando que uma seleção prévia nas variáveis de entrada permite a construção de

um modelo mais simples, robusto e menos sujeito a confusões. A técnica apresentou

êxito no objetivo proposto em ambos os modelos gerados.

Um fato interessante a respeito do modelo de Redes Neurais Artificiais foi a

classificação de uma amostra incorretamente, o que levou a sua análise e posterior

reclassificação da amostra. Tal possibilidade confere à técnica uma função de

feedback à classificação imposta pelo próprio especialista.

Um outro ponto abordado pela técnica de Redes Neurais Artificiais foi a sua

suscetibilidade à construção de modelos a partir de um conjunto de treinamento onde

as classes presentes não possuem número de casos iguais. Tal fato teve como

conseqüência a não representação (generalizada) de uma classe com poucos casos

no modelo produzido. Esse problema resulta num superajuste do modelo aos casos de

treinamento, o que acarreta classificações erradas ao serem apresentadas novas

amostras.

Naturalmente, as duas técnicas empregadas não coincidiram exatamente nos

resultados obtidos, o que provavelmente mostra que cada técnica identifica e

soluciona os “problemas” de maneira diferente. A utilização de um estudo comparativo,

ainda mais quando não se tem histórico no assunto da área estudada, permite que o

especialista faça uma avaliação ponderada a respeito dos resultados alcançados por

cada técnica e não atribua uma solução definitiva, sendo ela positiva ou negativa para

uma determinada técnica, podendo bani-la ou consagrá-la equivocadamente.

Em resumo, pode-se afirmar que a implementação de um processo de

classificação automatizada para as amostras de óleo da Bacia Potiguar, baseado em

modelos gerados pelas técnicas de Árvores de Decisão e Redes Neurais Artificiais foi

atingida com sucesso. Os modelos apresentaram estabilidade e coerência, o que

ajudará nas futuras pesquisas nesta área do conhecimento.

185

9.2) Recomendações para Trabalhos Futuros

Muitas são as sugestões que podem ser oferecidas, cabendo aqui citar apenas

as principais:

As técnicas de Inteligência Artificial utilizadas como instrumento de apoio à

tomada de decisão em Geoquímica Orgânica não têm tradição histórica, o

que dificulta a comparação dos resultados aqui obtidos. Porém, baseando-se

apenas neste estudo, as técnicas mostram-se bastante promissoras, o que

justifica, a sua utilização em problemas semelhantes de forma mais corrente.

Recomenda-se testar os modelos gerados nas demais amostras da bacia,

tanto em terra como em mar.

Outros métodos podem ser empregados nesta mesma base de dados para

adquirir conhecimento como, por exemplo, Regras de Associação, ou ainda

para preencher os valores de algumas variáveis que se encontram ausentes,

através de Regressão Linear.

Propõe-se a implementação da técnica de Redes Neurais Artificiais em um

software em que fosse oferecida uma maior flexibilidade para modificar o

algoritmo, visando uma melhor adaptação ao caso estudado.

Sugere-se realizar o treinamento para Redes Neurais Artificiais com o número

de amostras igual para cada classe.

Recomenda-se acoplar um algoritmo de seleção de variáveis ao algoritmo de

Redes Neurais Artificiais, visando uma maior otimização do tempo

computacional.

186

REFERÊNCIAS BIBLIOGRÁFICAS:

ALMEIDA, F. F. M., HASUI, Y., 1984. “O Pré-Cambriano do Brasil”. São Paulo, Editora

Edgard Blücher.

ALMEIDA, F.F.M, HASUI, Y., BRITO NEVES, B.B., 1977. “The upper precambriam of

South American”. Boletim do Instituto de Geociências da Universidade de São

Paulo, São Paulo, v. 7, pp. 45-80.

ANP - AGÊNCIA NACIONAL DO PETRÓLEO, GÁS NATURAL E

BIOCOMBUSTÍVEIS. Anuário Estatístico Brasileiro do Petróleo e Gás Natural

2006. Disponível em <http://www.anp.gov.br>. Acesso em 31 mai. de 2007.

ANP - AGÊNCIA NACIONAL DO PETRÓLEO, GÁS NATURAL E

BIOCOMBUSTÍVEIS/ BRASIL ROUNDS. Seminário Jurídico/Fiscal e Workshop

Técnico da Quarta Rodada de Licitações, Bacia Potiguar. Disponível em

<http://www.brasilrounds.gov.br>. Acesso em 10 out. de 2006.

ARARIPE, P.T., FEIJÓ, F.J., 1994. “Bacia Potiguar”. Boletim de Geociências da

Petrobras, Rio de Janeiro, v. 8 (1), pp. 127-141.

ARAÚJO, M.B., GOMES, J.B., SOUZA, S.M., 1978. “Bacia Potiguar – aspectos gerais

e perspectivas petrolíferas”. In: Offshore Brazil 78 Conference, Rio de Janeiro v.

2, pp. 1-11.

AURÉLIO, M., VELLASCO, M., LOPES, C.H., 1999. Apostila Descoberta de

Conhecimentos e Mineração de Dados. ICA – Laboratório de Inteligência

Computacional Aplicada, DEE/PUC-Rio, pp. 96.

BEHAR, F., PENTEADO, H.L.B., LORANT, F., BUDZINSKI, H., 2006. “Study of

biodegradation process along the Carnaubais trend, Potiguar Basin (Brazil) – Part

1”. Organic Geochemistry, v. 37, pp. 1042-1051.

BERTANI, R.T., COSTA, I.G., MATOS, R.M.D., 1991. “Evolução tectono-sedimentar,

estilo estrutural e habitat do petróleo na Bacia Potiguar”, In: Raja Gabaglia G.P.,

187

Milani E.J. (eds), Origem e Evolução de Bacias Sedimentares. PETROBRAS, Rio

de Janeiro, 2ª ed., pp. 291-310.

BRAGA, A.P., LUDEMIR, T.B., CARVALHO, A.C.P.F., 2000. Redes Neurais Artificiais:

teoria e aplicações. Rio de Janeiro, Livros Técnicos e Científicos Editora S.A..

BRAGA, R.B., 2003. Data Mining usando Árvores de Decisão Fuzzy. Disponível em

<http://www.cos.ufrj.br/~brunorb/docs/adfuzzy.pdf>. Acesso em 26 jan. de 2007.

BRITO NEVES, B.B., 1998. “The Cambro-Ordovician of the Borborema Province”. Boletim do Instituto de Geociências da Universidade de São Paulo, São Paulo, v.

29, pp. 175-193. In: Mantesso Neto, V., Bartorelli, A., Carneiro, C.D.R., Brito

Neves, B.B., (eds), 2004, Geologia do Continente Sul-Americano. São Paulo

BECA, pp.383-405.

CARVALHO, A., 2000. Redes Neurais Artificiais. Disponível em

<http://www.icms.sc.usp.br/~andre/neural1.html>. Acesso em 21 jan. de 2007.

CARVALHO, L.A.V., 2005. Data Mining – A Mineração de Dados no Marketing,

Medicina, Economia, Engenharia e Administração. Rio de Janeiro, Ciência

Moderna.

CASTELLAN, G., 1986. Fundamentos de Físico-Química. 1ª ed. Rio de Janeiro, Livros

Técnicos e Científicos Editora.

CERQUEIRA, J.R., 1985. ”Geoquímica do Campo de Ubarana e adjacências (Bacia

Potiguar)”. Dissertação de Mestrado, UFBA, Bahia, Brasil.

CHANG, H.K., KOWSMAN, R.O., 1987. “Interpretação genética das seqüências

estratigráficas das bacias da margem continental brasileira”, Revista Brasileira de

Geociências, v. 17, pp. 74-80.

CHANG, H.K., KOWSMAN, R.O., FIGUEREDO, A.M.F., BENDER, A.A., 1992.

“Tectonics and stratigraphy of the East Brazil Rift System: An Overview”,

Tectonophysics, v. 213, pp. 97-138.

188

COLLINS, C.H., BRAGA, G.L., BONATO, P.S., (1997). Introdução a Métodos

Cromatográficos. São Paulo, Editora Unicamp.

CONCEIÇÃO, J.C.J., ZALÁN, P.V., WOLFF, S., 1988. “Mecanismo, evolução e

cronologia do rift sul-atlântico”. Boletim Técnico da Petrobras, v. 2 (2/4) pp. 255-

265.

COSTA, S.F., 1998. Introdução Ilustrada à Estatística. São Paulo, Editora Habra.

CYPRIANO, J.L., NUNES, A.B., 1968. “Geologia da Bacia Potiguar”. Maceió, Relatório

Interno da Petrobras, pp. 60.

DEMAISON, G., 1984. “The generative basin concept”. In: Demaison, G., Murris, R.J.

(eds), Petroleum geochemistry and basin evaluation. AAPG Memoir, v. 35, pp. 1-

14.

DIAS, M.M., 2002. “Parâmetros na escolha de técnicas e ferramentas de mineração de

dados”. Acta Scientiarum, v.24 (6), pp. 1715-1725.

DOW, W.G., 1974. “Application of oil correlation and source rock data to exploration in

Williston basin”. AAPG Bulletin, v. 58 (7), pp. 1253-1262.

FAYYAD, U., PIATETSKY-SHAPIRO, G., SMYTH, P., 1996 "From data mining to

knowledge discovery: An Overview". In: Fayyad, U., Shapiro, G. P., Smyth, P.

Uthurusamy, R. (eds), Advances in Knowledge Discovery and Data Mining, pp. 1–

34, AAAI Press, Menlo Park, CA.

FRANÇOLIN, J.B.L., SZATMARI, P., 1987. “Mecanismo de rifteamento da porção

oriental da margem norte brasileira”. Revista Brasileira Geociências, v. 17 (2), pp.

196-207.

FREITAS, E.P., SANTOS, R.C.R., 1982. Apostila Geoquímica do Petróleo.

CENPES/PETROBRAS, 1ª Ed., Cap. 12, pp.214-222.

GALLANT, S.L., 1994. Neural Network Learning and Expert Systems. Cambridge, MIT

Press.

189

GAMA, J., 2000. Árvores de Decisão. Disponível em

<http://www.liacc.up.pt/~jgama/Mestrado/ECD1/Arvores.html>. Acesso em 27 jan.

de 2007.

GARCIA, S.C., 2000. O uso de Árvores de Decisão na descoberta de conhecimento na

Área de Saúde. Semana Acadêmica, Porto Alegre, UFRGS, Brasil.

HAYKIN, S., 1994. Neural Networks – A Comprehensive Foundation. Macmillian

College publishing Company.

HERTZ, J., KROGH, A., PALMER, R.G., 1990. Introduction to the Theory of Neural

Computing. Addison Wesley Publishing Company.

HUNT, M.J., 1996. Petroleum geochemistry and geology. 2nd., New York, W.H.

Freedman.

ISAKSEN, G.H., 1995. “Organic Geochemistry of Paleodepositional Environments with

a Predominance of Terrigenous Higher-Plant Organic Matter”. In: Huc, A.Y., (ed),

Paleogeography, Paleoclimate and Source Rocks. AAPG Memoir, v. 40, pp. 81-

104.

KIRKBY, R., FRANK, E. 2007. WEKA Explorer User Guide for Version 3-4. Nova

Zelândia, University of Waikato, N.Z..

KOVÁCS, Z.L., 1996. Redes Neurais Artificiais – Fundamentos e Aplicações. São

Paulo, Edição Acadêmica, SP.

KRÖSE, B.J.A., SMAGT, P.P., 1993. An Introduction to Neural Networks. Amsterdan,

University of Amsterdan.

LAVINE, B.K., 2005. “Clustering and Classification of Analytical Data”. Encyclopedia of

Analytical Chemistry. John Wiley & Sons LTDA, Chiechester.

LEAL, F., MARTINS, J.C., 2003. “Inteligência Empresarial: Ferramentas de Apoio à

Tomada de Decisão”. Revista Bate Byte, v. 134.

190

LIMA NETO, F.F., 1985. “Magmatismo pós-paleozóico na Bacia Potiguar –

Comentários sobre informações disponíveis”. Natal, Relatório Interno da

Petrobras, pp. 24.

LOPES, S., 1997. Bio 2. 1ª ed. São Paulo, Saraiva.

LUCENA, P., De PAULA, M., 2001. Árvores de Decisão Fuzzy. Disponível em

<http://www.icms.sc.usp.br/~percival.html>. Acesso em 27 jan. de 2007.

MAGNIER, C.I. F.P., PENTEADO, H.L.B., 2000. “Estimating the risks of its occurrence

in Petroleum reservoirs: Na organic geochemistry & basin modeling approach

PART 1: Description of the Carnaubais Trend”. Instituto Francês do Petróleo.

Relatório 53 067, pp.36.

MAGOON, L.B., DOW, W.G., 2000. “ Mapping the Petroleum System – An

investigative Technique to explore the Hydrocarbon Fluid System”. In: Mello, M.R.,

Katz, B.J. (eds), Petroleum Systems of South Atlantic margins. AAPG Memoir, v.

73, pp. 53-68.

MAGOON, L.B., DOW, W.G., 1994. “The petroleum system-from source to trap”.

AAPG Memoir v. 60, p.3-23.

MATOS, R.M.D., 1992. “The Northeast Brazilian rift system”. Tectonics, v. 11 (4), pp.

766-791.

MATOS, R.M.D., 1987. “Sistema de rifts cretáceos do Nordeste Brasileiro”. In:

Seminário de Tectônica da Petrobras, Atas: Rio de Janeiro.

DEPEX/CENPES/PETROBRAS. pp. 126-159.

MATOS, R.M.D., LIMA NETO, F. F., ALVES, A.C., WAICK, R. N., 1987. “O Rift

Potiguar: Gênese, preenchimento e acumulações de hidrocarbonetos”. In:

Seminário de rifts intracontinentais. Anais: Rio de Janeiro: PETROBRAS/DEPEX.

pp. 160-197.

MAYER, E., 1974. “Estratigrafia preliminar na plataforma continental da Bacia

Potiguar, Rio Grande do Norte”. Rio de Janeiro, Relatório Interno da Petrobras,

pp. 21.

191

MEISSNER, F.F., WOODWARD, J., CLAYTON, J.L., 1984. “Stratigraphhic

relationships and distribution of source rocks in the greater Rocky Mountain

region”. In: Woodward, J., Meissener, F.F., Clayton, J.L. (eds), Hydrocarbon

source rocks of the greater Rocky Mountain region. Rocky Mountain Association

of Geologists, pp. 1-34.

MELLO, M.R., 1988. Geochemical and molecular studies of the depositional

environments of source rocks and their derived oils from the Brazilian marginal

basins. Ph.D. dissertation, University of Bristol, Bristol, UK.

MELLO, M.R., MAGOON, L.B., 1996, “Aplicação do conceito de sistema petrolífero

como método preditivo na redução do risco exploratório”. Congresso Brasileiro de

Geologia, Salvador, pp. 217-221.

MELLO, M.R., KOUTSOUKOS, E.A.M., SANTOS NETO, E.V., TELLES JR, A.C.S.,

1993. “Geochemical and micropaleontological characterization of lacustrine and

marine hypersaline environments from Brazilian sedimentary basins”. In: Katz,

B.J., Pratt, L.M. (eds), Source rocks in a sequence stratigraphic framewok. AAPG

Studies in Geology, pp. 17-34.

MELLO, M.R., GAGLIANONE, P.C., BRASSEL, S.C., MAXWELL, J.R., 1988.

“Geochemical and biological marker assessment of depositional environments

using Brazilian offshore oils”. Marine and Petroleum Geology, v. 5, pp. 205-223.

MELLO, M.R., CERQUEIRA, J.R., SOLDAN, A.L., ARARIPE, P.T., 1984. “Avaliação

geoquímica da plataforma continental da Bacia Potiguar”. Rio de Janeiro,

Relatório Interno da Petrobras, pp. 98.

MELLO, U.T., 1987. “Evolução Termomecânica da Bacia Potiguar-RN, Brasil”.

Dissertação de Mestrado, UFOP, Ouro Preto, Brasil.

MIZUSAKI, J.M., 1987. “A Formação Macau na porção submersa da Bacia Potiguar”.

Boletim Técnico da Petrobras, v. 3 (3), pp. 191-200.

MOLDOWAN, J. M., SEIFERT, W. K., GALLEGOS, E. J., 1985. “Relationship between

petroleum composition and depositional environment of petroleum source rocks”.

AAPG Bulletin, v. 69, pp. 1255-1268.

192

MOREIRA, C.A.A., 1987. Análise estratigráfica das Formações Alagamar (pós-CPT) e

Açu (parte inferior) na região de Macau-Ubarana: a transição Aptiano (não

marinho) – Albiano (marinho), na Bacia Potiguar. Dissertação de Mestrado,

UFOP, Ouro Preto, Brasil.

OJEDA, H.A.O., SANTOS, E.R., 1982. “Bacia Potiguar (parte emersa) - integração

geológica regional de dados exploratórios”. Rio de Janeiro, Relatório Interno da

Petrobras, pp. 71.

OSÓRIO, F., 2001. Sistemas Adaptativos Inteligentes. Disponível em

<http://www.inf.unisinos.br/õsorio/sistadap.html>. Acesso em 21 jan. de 2007.

OURISSON, G., ALBRECHT, P., ROHMER, M., 1984. “The microbial origin of fossil

fuel”. Scientific American, v. 251 (2), pp. 709-729.

PARENTE, P.F., 2006. “Avaliação das condições de biodegradação do petróleo a

partir da caracterização de parâmetros físico-químicos das águas e óleos da

Formação Açu na Bacia Potiguar, RN-Brasil”. Dissertação de Mestrado,

COPPE/UFRJ, Rio de Janeiro, RJ, Brasil”.

PENTEADO, H.L.B., 1995. “Caracterização por geoquímica orgânica das camadas

Ponta do Tubarão na porção Nordeste da Bacia Potiguar”. Dissertação de

Mestrado, UFRJ, Rio de Janeiro, Brasil.

PENTEADO, H.L.B., BEHAR, F., LORANT, F., OLIVEIRA, C.C., 2007 (in press).

“Study of biodegradation process along the Carnaubais trend, Potiguar basin

(Brazil) – Part 2”. Organic Geochemistry, pp. 15.

PENTEADO, H.L.B., MELLO M.R., FREITAS L.C.S., 1995. “Geochemical

characterization of source rocks and their derived oils in the Ceará Basin,

Brazilian Equatorial ”. International Meeting of Organic Geochemistry - IMOG, pp.

133-135.

PERRODON, A., 1980. “Géodynamique pétrolière. Genèse et répartition dês

gisements d’hydrocarbures”. Paris, Masson-Elf Aquitaine, pp. 381.

193

PESSOA NETO, O.C., 2003. “Estratigrafia de seqüências da plataforma mista

neogênica na Bacia Potiguar, margem equatorial brasileira”. Revista Brasileira de

Geociências, v. 33 (3), pp. 263-278.

PETERS, K.E., WALTERS, C.C., MOLDOWAN, J.M., 2005. “The Biomarker Guide: 2nd

ed. Biomarkers and Isotopes in Petroleum Exploration and Earth History”, New

York. Cambridge University Press , NY.

PETERS, K.E., MOLDOWAN, J.M., 1993. “The Biomarker Guide: Interpreting

molecular fossils in petroleum and ancient sediments”, New York. Englewood

Cliffs e Prentice Hall, NJ.

PHILP, R.P., 1985. Fossil Fuel Biomarkers – Methods in Geochemistry and

Geophysics. Elsevier, New York.

PHILP, R.P., GILBERT, T.D., 1986. “Biomarker distributions in Australian oils

predominantly derived from terrigenous source material”. Organic Geochemistry,

v. 10, pp.73-84.

QUINLAN, R., 1993. C 4.5: Programs for Machine Learning. San Mateo, Morgan

Kaufmann Publishers, CA.

QUINLAN, R., 1986. Introduction of Decision Trees. Machine Learning, v. 1 (1) , pp.

81-106.

RODRIGUES, R., 1983. “Utilização de marcadores biológicos na correlação dos óleos

da bacia do Ceará e parte emersa da Bacia Potiguar”. Boletim Técnico da

Petrobras, v. 26(3), pp. 163-179.

RODRIGUES, R., FRANÇOLIN, J.B.L., LIMA, H.L., 1983. “Avaliação geoquímica

preliminar da Bacia Potiguar terrestre”. Rio de Janeiro, Relatório Interno da

Petrobras, pp. 71.

SÁ, E. F. J., 1984. “A Evolução proterozóica da província Borborema”. In: Atas do XI

Simpósio de Geologia do Nordeste, pp. 297-316, Natal.

194

SAMPAIO, A.V., SCHALLER, H., 1968. “Introdução à estratigrafia cretácea da Bacia

Potiguar”. Boletim de Geociências da Petrobras, Rio de Janeiro, v. 11 (1), pp. 19-

44.

SANTOS NETO, E. V., 1996. Isotopic caracterization of the Cretaceous lacustrine and

marine-evaporitic sequences and related oils from the Potiguar basin,

northeastern Brazil. Ph.D. dissertation, University of Indiana, Bloomington,

Indiana, USA.

SANTOS NETO, E.V., GUZZO, J.V.P., ROSS, S., GAINO, M.B., 2003. “Biodegradation

and mixing of oils in the area of the field “C” Areia Branca trend, Potiguar Basin

Basin, Brazil”. In: 21st International Meeting on Organic Geochemistry, Kraków v.2,

pp. 219-220.

SANTOS NETO, E.V., TAKAKI, T., 2000. “Isotopic and molecular heterogeneities in

lacustrine oils from the Potiguar Basin, Brazil”. In: Latin American Association of

Organic Geochemistry, Foz do Iguaçu v.1, pp. 338-340.

SANTOS NETO, E.V., HAYES, J.M., 1999. “Use of hydrogen and carbon stable

isotopes characterizing oils from the Potiguar Basin (Onshore), Northeastern

Brazil”. AAPG Bulletin, v. 83 (3), pp. 496-518.

SANTOS NETO, E. V., LIMA NETO, F.F., PENTEADO, H.L.B., TAKAKI, T., 1995.

“Geração e Migração do Petróleo Acumulado no Alinhamento de Carnaubais e

Alto de Macau, Bacia Potiguar”. Rio de Janeiro, Relatório Interno da Petrobras,

pp. 52.

SANTOS NETO, E.V., MELLO, M.R., RODRIGUES, R., 1990. “Caracterização

geoquímica dos óleos da Bacia Potiguar”, In: Congresso Brasileiro de Geologia,

Natal v. 2, pp. 974-985.

SANTOS, R.C.R., RODRIGUES, R., 1986. “Bacia Potiguar: implicações

paleombientais dos dados de geoquímica”. In: Congresso Brasileiro de Geologia,

Goiânia v. 6, pp. 2805-2814.

195

SHARMA, S., 1996. Applied Multivariate Techniques. University of South Carolina,

John Wiley & Sons, INC.

SILVA, E., CANEDO, A., 2001. Dicas para Configuração de Redes Neurais. Disponível

em <http://www.labic.nce.ufrj.br/downloads/dicas_cfg_rna.pdf>. Acesso em 02

fev. de 2007.

SILVA JÚNIOR, C., SASSON, S., 1996. Biologia 1. 2ª ed. São Paulo, Saraiva.

SIMEÃO, J.M., 1999. Bancos de Dados Geográficos e Redes Neurais Artificiais:

Tecnologias de Apoio à Gestão de Território. Tese de D.Sc., USP, São Paulo, SP,

Brasil.

SOUTO FILHO, J.D., CORREA, A.C.F., SANTOS NETO, E.V., TRINDADE, L.A.F.,

2000. “Alagamar-Açu Petroleum System, Onshore Potiguar Basin, Brazil: A

Numerical Approach for Secondary Migration”. In: Mello, M.R., Katz, B.J. (eds),

Petroleum systems of South Atlantic margins. AAPG Memoir, v. 73, pp. 151-158.

SOUZA, S.M., 1982. “Atualização da Litoestratigrafia da Bacia Potiguar”. In: SBG,

Congresso Brasileiro de Geologia 32, v. 5, pp. 2392-2406, Salvador.

SZATMARI, P., FRANÇOLIN, J.B.L, ZANOTTO, O., WOLFF, S., 1987. “Evolução

tectônica da margem equatorial brasileira”. Revista Brasileira Geociências, v. 17

(2), pp. 180-188.

THOMÉ, A.C.G., 2003. “Apostila de Inteligência Computacional”. Material da disciplina:

Redes Neurais – Uma Ferramenta para KDD e Data Mining. NCE/UFRJ, pp. 23-

27.

TIBANA, P., TERRA, G.J.S., 1981. “Seqüências carbonáticas do Cretáceo da Bacia

Potiguar”. Boletim Técnico da Petrobras, v. 24 (3), pp. 174-183.

TISSOT, B.P., WELTE, D.H., 1984. Petroleum Formation and Occurrence, 2 Ed. Berlin

Springer-Verlag.

196

TRINDADE, L.A.F., 1992. Geochemical assessment of petroleum migration and mixing

in the Potiguar and Sergipe-Alagoas basins, Brazil. Ph.D. dissertation, University

of Stanford, Stanford, USA.

TRINDADE, L.A.F., BRASSELL, S.C., SANTOS NETO, E.V., 1992. “Petroleum

migration and mixing in the Potiguar Basin, Brazil”. AAPG Bulletin v. 76 (12), pp.

1903-1924.

VASCONCELOS, E.P., LIMA NETO, F.F., ROOS, S., 1990. “Unidades de correlação

da Formação Açu – Bacia Potiguar”. In: Congresso Brasileiro de Geologia, Natal

v. 1, pp. 227-240.

WITTEN, H.I., FRANK, E., 2000. Data Mining: Pratical machine learnig tools with Java

implementations. San Francisco, Morgan kaufmman.

197

198

ANEXO I

Identificação dos Compostos

NCn = n-alcanos, n = número de carbonos PRI = pristano PHY = fitano

22

R

24

Abu

ndân

cia

rela

tiva

Tempo de retenção (mim)

CG

NC

8N

C9

NC

10

NC

11

NC

12

NC

13

NC

14 NC

15

NC

16

NC

17P

RI

NC

18PH

YN

C19

NC

20N

C21

NC

22N

C23

NC

24N

C25

NC

26N

C27

NC

28N

C29

NC

30N

C31

NC

32N

C33

NC

34N

C35

NC

36N

C37

NC

38N

C39

22

R

24

Abu

ndân

cia

rela

tiva


CG

NC

8N

C9

NC

10

NC

11

NC

12

NC

13

NC

14 NC

15

NC

16

NC

17P

RI

NC

18PH

YN

C19

NC

20N

C21

NC

22N

C23

NC

24N

C25

NC

26N

C27

NC

28N

C29

NC

30N

C31

NC

32N

C33

NC

34N

C35

NC

36N

C37

NC

38N

C39

NC

8N

C9

NC

10

NC

11

NC

12

NC

13

NC

14 NC

15

NC

16

NC

17P

RI

NC

18PH

YN

C19

NC

20N

C21

NC

22N

C23

NC

24N

C25

NC

26N

C27

NC

28N

C29

NC

30N

C31

NC

32N

C33

NC

34N

C35

NC

36N

C37

NC

38N

C39

199

Terpanos

TR 19 = C19 Terpano Tricíclico TR 20 = C20 Terpano Tricíclico TR 21 = C21 Terpano Tricíclico TR 22 = C22 Terpano Tricíclico TR 23 = C23 Terpano Tricíclico TR 24 = C24 Terpano Tricíclico TR 25A e TR25B = C25 Terpano Tricíclico (S e R) TET24 = C24 Terpano Tetracíclico TR 26A e TR26B = C26 Terpano Tricíclico (S e R) TR 28A e TR28B = C28 Terpano Tricíclico (S e R) TR 29A e TR29B = C29 Terpano Tricíclico (S e R) TS = 18α(H)-22,29,30-trisnorneohopano TM = 17α(H)-22,29,30-trisnorhopano TR 30A e TR30B = C30 Terpano Tricíclico (S e R) H28 = 17α(H),18α(H),21β(H)-28,30-bisnorhopano NOR25H = 17α(H)-C28 desmetilado no anel A/B H29 = 17α(H),21β(H)-30-norhopano C29TS = 18α(H)-22,29,30-trisnorhopano DH30 = 17α(H)-diahopano M29 = 17α(H), 21α(H)-30-normoretano H30 = 17α(H), 21β(H)-hopano NOR30H = 17α,30-nor-29-homohopano M30 = 17α(H),21α(H)-moretano H31S e H31R = 17α(H),21β(H)-homohopano (22S e 22R) GAM = gamacerano H32S e H32R = 17α(H),21β(H)-bishomohopano (22S e 22R) H33S e H33R = 17α(H),21β(H)-trishomohopano (22S e 22R) H34S e H34R = 17α(H),21β(H)-tetrakishomohopano (22S e 22R) H35S e H35R = 17α(H),21β(H)-pentakishomohopano (22S e 22R)

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29M

29H

30N

OR

30H

M30 H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

m/z 191


Abu

ndân

cia

rela

tiva

17

21

2528

22

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29M

29H

30N

OR

30H

M30 H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

m/z 191


Abu

ndân

cia

rela

tiva

TR19

TR20 TR

21

TR22

TR23

TR24

TR25

ATR

25B

TET2

4TR

26A

TR26

B

TR28

ATR

28B

TR29

ATR

29B

TSTM

TR30

ATR

30B

H28

NO

R25

HH

29M

29H

30N

OR

30H

M30 H

31S

H31

RG

AM

H32

SH

32R

H33

SH

33R

H34

SH

34R

H35

SH

35R

m/z 191


Abu

ndân

cia

rela

tiva

17

21

2528

22

200

Esteranos

S21 = 5α(H),14α(H),17β(H)+5α(H),14α(H),17β(H)-pregnano S22 = 4α-metil-5α(H),14β(H),17β(H)+4α-metil-5α(H),14α(H),17α(H)-homopregnano DIA27S = 13β(H),17α(H)-diacolestano (20S) DIA27R = 13β(H),17α(H)-diacolestano (20R) DIA27S2 = 13α(H),17β(H)-diacolestano (20S) DIA27R2 = 13α(H),17β(H)-diacolestano (20R) C27S = 5α(H),14α(H),17α(H)-colestano (20S) C27abbR = 5α(H),14β(H),17β(H)-colestano (20R) C27abbS = 5α(H),14β(H),17β(H)-colestano (20S) C27R = 5α(H),14α(H),17α(H)-colestano (20R) C28S = 5α(H),14α(H),17α(H)-24-metil-colestano (20S) C28 bbR = 5α(H),14β(H),17β(H)-24-metil-colestano (20R) C28 bbS = 5α(H),14β(H),17β(H)-24-metil-colestano (20S) C28R = 5α(H),14α(H),17α(H)-24-metil-colestano (20R) C29S = 5α(H),14α(H),17α(H)-24-etil-colestano (20S) C29 bbR = 5α(H),14β(H),17β(H)-24-etil-colestano (20R) C29 bbS = 5α(H),14β(H),17β(H)-24-etil-colestano (20S) C29R = 5α(H),14α(H),17α(H)-24-etil-colestano (20R)

m/z 217A

bund

ânci

a re

lativ

a

S21

S22 DIA

27S

DIA

27R

DIA

27S

2D

IA27

R2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R


R R

24 24

5

14

1713

17

m/z 217A

bund

ânci

a re

lativ

a

S21

S22 DIA

27S

DIA

27R

DIA

27S

2D

IA27

R2

C27

SB

B_D

29S

C27

BB

SC

27R

C28

SC

28B

BR

C28

BB

SC

28R

C29

SC

29B

BR

C29

BB

SC

29R


R R

24 24

5

14

1713

17

201

TPP’s

D27S = 27-nordiacolestano S D27R = 27-nordiacolestano R C30TP1 = C30 Terpano (Poliprenóide Tetracíclico) C30TP2 = C30 Terpano (Poliprenóide Tetracíclico)

m/z 259

Abu

ndân

cia

rela

tiva


R

24

5

14

17

D27

SD

27R

C30

TP1

C30

TP2

m/z 259

Abu

ndân

cia

rela

tiva


R

24

5

14

17

D27

SD

27R

C30

TP1

C30

TP2

202

ANEXO II

Identificação das Razões

Cromatografia Gasosa

PRI/PHY = Pristano/Fitano PRI/n-C17 = Pristano/n-C17 PHY/n-C18 = Fitano/n-C18 17/(17+27) = alcano n-C17/( n-C17+ n-C27) Altura total = Soma de todas as alturas das n-, isoparafinas e UCM

Cromatografia Líquida % SAT = Teor de hidrocarbonetos saturados (%) % ARO = Teor de hidrocarbonetos aromáticos (%) % NSO = Teor de hidrocarbonetos polares - resinas + asfaltenos (%)

Isótopos δ13C = Razão Isotópica do Carbono (óleo total)

Parâmetros Bulk ºAPI = Grau API % S = Teor de enxofre (%)

Razões entre Biomarcadores % 27ββS (218) = 100*(C27αββS)/(C27αββS+ C28αββS+ C29αββS) % 28ββS (218) = 100*(C28αββS)/(C27αββS+ C28αββS+ C29αββS) % 29ββS (218) = 100*(C29αββS)/(C27αββS+ C28αββS+ C29αββS) % H31 = 100*(H31S+H31R)/ (H31S+H31R+ H32S+H32R+ H33S+H33R+ H34S+H34R+ H35S+H35R) % H32 = 100*(H32S+H32R)/ (H31S+H31R+ H32S+H32R+ H33S+H33R+ H34S+H34R+ H35S+H35R) % H33 = 100*(H33S+H33R)/ (H31S+H31R+ H32S+H32R+ H33S+H33R+ H34S+H34R+ H35S+H35R) % H34 = 100*(H34S+H34R)/ (H31S+H31R+ H32S+H32R+ H33S+H33R+ H34S+H34R+ H35S+H35R) % H35 = 100*(H35S+H35R)/ (H31S+H31R+ H32S+H32R+ H33S+H33R+ H34S+H34R+ H35S+H35R) 19/23 TRI = TR19/TR23 20S/(20S+20R) St = C29S/(C29S+C29R) esteranos

203

Razões entre Biomarcadores (continuação) 21/23TRI = TR21/TR23 21+22/STER = (S21+S22)/Concentração total de esteranos 23/24TRI = TR23/TR24 24/25TRI = TR24/TR25 25NOR/HOPANE = 25NOR/Hopano (Íon 177) 26/25TRI = TR26/TR25 26/28TRI = TR26/TR28 27/29 ββS (218) = C27αββS/C29αββS 28/29 ββS (218) = C28αββS/C29αββS 29/30H = (H29+C29Ts)/H30 30/29 ββS (218) = C30αββR/C29αββS ≈ Razão C30/C29 esteranos DIA/C27αα = (DIA27S+DIA27R)/(C27S+C27R) DIA30/C27 αα = (C30TP1+C30TP2)/(C27S+C27R) DIAH/H30 = DH30/H30 DITERP/H30 = (TR21+TR22+TR23+TR24+TR25A+TR25B+TR26A+TR26B+ TR28A+TR28B+TR29A+TR29B)/H30 GAM/H30 = Gamacerano/H30 GAM/TR23 = Gamacerano/TR23 H28/H29 = H28/H29 H28/H30 = H28/H30 H28/TR23 = H28/TR23 H29/C29Ts = H29/C29TS H29/H30 = H29/H30 H30/C27 αα = H30/(C27S+C27R) H35/H34 = (H35S+H35R)/(H34S+H34R) HOP/STER = Concentração total de hopanos/Concentração total de esteranos NOR25H/H29 = NOR25H/H29 NOR25H/H30 = NOR25H/H29 NORNEO/H29 =C29TS/H29 Total Esteranos = Concentração total de esteranos (ppm) Total Hopanos = Concentração total de hopanos (ppm) TET24/26TRI = TET24/(TR26A+TR26B) TET24/H30 = TET24/H30 TPP = Terpanos Tetracíclicos Poliprenóides/C27 diasteranos TR23/H30 = TR23/H30 TRI/HOP = (TR19+TR20+TR21+TR22+TR23+TR24+TR25A+TR25B+TR26A+ TR26B+TR28A+TR28B+TR29A+TR29B+TR30A+TR30B)/Concentração total de hopanos TRI/STER = (TR19+TR20+TR21+TR22+TR23+TR24+TR25A+TR25B+TR26A+ TR26B+TR28A+TR28B+TR29A+TR29B+TR30A+TR30B)/Concentração total de esteranos Ts/(Ts+Tm) = Ts/Ts+Tm Ts/Tm = Ts/Tm αββ/(αββ+ααα) = (C27αββS+ C27αββR)/(C27αββS+ C27αββR+ C27αααS+ C27αααR)

204

ANEXO III

Tabela com as amostras selecionadas e valores utilizados

(Amostras assinaladas com “*” representam amostras utilizadas no banco de teste, as demais correspondem ao banco de treinamento).

205


(Continuação das amostras 1-35)

206



207



208



209


210



211



212



213



214


215



216



217



218



219


220



221



222



223



224


225



226



227



228



229

ANEXO IV

Relatório-padrão completo do software WEKA com os resultados da classificação por Redes Neurais Artificiais para o conjunto com 60 variáveis

=== Run information === Scheme: weka.classifiers.functions.MultilayerPerceptron -L 0.6 -M 0.4 -N 500 -V 0 -S 0 -E 20 -H 30 -B Relation: Dados sel 179 Instances: 179 Attributes: 61 PRI/PHY Pri/nC17 PHY/NC18 17/(17+C27) TOTALHEIGHT p_ Saturados p_ Aromáticos p_ NSO delC13 API Enxofre (p_) p_27BBS218 p_28BBS218 p_29BBS218 p_H31 p_H32 p_H33 p_H34 p_H35 19/23TRI 20S/(20S+20R) St 21/23TRI 21+22/STER 23/24TRI 24/25TRI 25NOR/HOPANE 26/25TRI 26/28TRI 27/29BBS218 28/29BBS218 29/30H 30/29BBS218 DIA/C27AA DIA30/C27AA DIAH/H30 DITERP/H30 GAM/H30 GAM/TR23 H28/H29 H28/H30 H28/TR23

230

H29/C29TS H29/H30 H30/C27AA H35/H34 HOP/STER NOR25H/H29 NOR25H/H30 NORNEO/H29 Total Esteranos Total Hopanos TET24/26TRI TET24/H30 TPP TR23/H30 TRIC/HOP TRIC/STER TS/(TS+TM) TS/TM abb/(abb+aaa) Classe Test mode: split 80% train, remainder test === Classifier model (full training set) === Sigmoid Node 0 Inputs Weights Threshold -1.0371935016648985 Node 7 -0.9050419510793688 Node 8 -0.15676704792633023 Node 9 1.6471228352049627 Node 10 1.6559802925835387 Node 11 -1.4621137317868218 Node 12 1.8129287085566197 Node 13 -0.17183817762338413 Node 14 0.15799233627106196 Node 15 -1.1934809899705034 Node 16 -0.8583800115763884 Node 17 -0.39361060813281934 Node 18 -1.5504776032423664 Node 19 -2.2546517895411635 Node 20 -1.164302114921324 Node 21 3.007298165129063 Node 22 0.7148817266744742 Node 23 -2.328856956776148 Node 24 -0.6183768931996482 Node 25 -0.5095898514091762 Node 26 -1.274386048756757 Node 27 -0.6730129931268879 Node 28 -0.6409833332765512 Node 29 -1.7614607887594484 Node 30 -1.0405506958972743 Node 31 -0.9416799292049816 Node 32 -3.171232835337609 Node 33 -0.6839965355837468 Node 34 0.6217218536996599 Node 35 -0.5622598239208721

231

Node 36 -0.6611238003252283 Sigmoid Node 1 Inputs Weights Threshold -1.6604748497164818 Node 7 -0.46385722665298457 Node 8 -0.639515519516 Node 9 0.8321569665331952 Node 10 -2.4445477035520278 Node 11 -4.081050628695995 Node 12 1.7002298475791835 Node 13 -1.6962571945290486 Node 14 0.23754072993564238 Node 15 1.5998576057134049 Node 16 -0.7963482803351081 Node 17 -2.589891501482342 Node 18 -1.5766161230970648 Node 19 -1.7795743756407876 Node 20 -0.4082478332501635 Node 21 -3.962021022509219 Node 22 1.1615611427320938 Node 23 2.8350578148868673 Node 24 -0.390837857119651 Node 25 -0.35887564322895565 Node 26 -3.952152405142699 Node 27 1.7552028797703485 Node 28 -0.5856352841371899 Node 29 1.0270343271597446 Node 30 -0.6131743704600101 Node 31 1.300083504295564 Node 32 0.24830255885243374 Node 33 -0.353104550388064 Node 34 -0.06467318228288835 Node 35 -0.5070742003726497 Node 36 -0.6326963257116092 Sigmoid Node 2 Inputs Weights Threshold -1.7496710805187143 Node 7 0.5132633583989602 Node 8 -0.13073631964982793 Node 9 -2.5049221228413834 Node 10 -0.7057743346942937 Node 11 2.0450314434216623 Node 12 -1.8365222142843578 Node 13 -1.2391940940572486 Node 14 -1.4169979531297252 Node 15 3.873168321023117 Node 16 -0.9145962584052652 Node 17 0.21983357367987444 Node 18 -1.4728617818154455 Node 19 -1.725102643024125 Node 20 0.4359106199409628 Node 21 -1.0020734832303368 Node 22 -2.1918935899606313 Node 23 -0.7826677979479941 Node 24 -0.2511475240111529 Node 25 -0.32439561465488387

232

Node 26 0.746447098664429 Node 27 -1.0988517178182275 Node 28 1.493661320208343 Node 29 -1.6987879881484516 Node 30 -1.1588633599517035 Node 31 -0.4028282048934673 Node 32 -1.3330013652000114 Node 33 1.5579767917235414 Node 34 -1.6729881822179828 Node 35 1.93407893761188 Node 36 0.5106383763450737 Sigmoid Node 3 Inputs Weights Threshold -1.1879641816133495 Node 7 -0.25104412759975286 Node 8 -0.020356343434039 Node 9 2.0546823092063464 Node 10 -0.8013575586931083 Node 11 1.459592996314696 Node 12 -2.9425763319093354 Node 13 -1.3311719770410877 Node 14 -1.8988415735228532 Node 15 -5.593116508824311 Node 16 -0.6520898636469109 Node 17 1.3118579342765584 Node 18 -0.8620144893260071 Node 19 -1.5124120127689658 Node 20 -0.2200619862280429 Node 21 -1.0447525342246933 Node 22 -0.009785215297682337 Node 23 1.3702040181858492 Node 24 -0.5527096525680985 Node 25 -0.5658060735236515 Node 26 3.979266575108539 Node 27 1.2894933468305227 Node 28 -2.029583715846618 Node 29 -1.1326725444022743 Node 30 -0.6885554229484813 Node 31 -0.38898899991111846 Node 32 -0.47891413369207225 Node 33 -2.6949965611640185 Node 34 -3.226191037477239 Node 35 -2.771447775124383 Node 36 -1.1095650524756666 Sigmoid Node 4 Inputs Weights Threshold -1.1291943946312595 Node 7 -0.6312558567181045 Node 8 -3.1397571709978047 Node 9 -0.8715578062282993 Node 10 -1.7549791564282642 Node 11 -0.9137241577691497 Node 12 0.4782410357098081 Node 13 1.3900869964012263 Node 14 -0.46324328163183925 Node 15 -1.2142499877780597

233

Node 16 2.73449383595667 Node 17 -1.206650856232866 Node 18 0.870385167498608 Node 19 0.756079053548453 Node 20 -1.2541940008574644 Node 21 -0.6175692560651314 Node 22 -2.4088725464703393 Node 23 -0.5800016530260198 Node 24 -2.6719298085673344 Node 25 -1.9407676161482923 Node 26 -0.8645163392236923 Node 27 -0.9093828949378 Node 28 -1.6228758928620093 Node 29 0.13162301062052323 Node 30 4.29936510254201 Node 31 -0.5043226801603207 Node 32 0.15544829810773375 Node 33 -2.09735679857529 Node 34 -0.013022852105317164 Node 35 -1.980667783275662 Node 36 -0.8717777792413273 Sigmoid Node 5 Inputs Weights Threshold 0.23510602968605948 Node 7 -0.8786214966053716 Node 8 0.6300891564934256 Node 9 -2.348567676398756 Node 10 -1.4146743370814934 Node 11 -1.3710937847372526 Node 12 -2.126834050289009 Node 13 -2.387841494336316 Node 14 0.07827168012438769 Node 15 -0.5921979098600724 Node 16 -3.0581976217497004 Node 17 -1.4027628489814348 Node 18 2.762372520741429 Node 19 2.100014267120785 Node 20 -0.9965154887780577 Node 21 -1.0687502275878753 Node 22 0.8962269977166123 Node 23 -1.5287033009298248 Node 24 -0.9780625785955718 Node 25 -0.6473645154260479 Node 26 -1.6711611241022266 Node 27 -1.8082675277061557 Node 28 -0.665809454680411 Node 29 0.7102964199071494 Node 30 -4.361125269373106 Node 31 -0.6624579348739325 Node 32 1.4224128813543135 Node 33 -0.8032482221497544 Node 34 -0.5273975818316359 Node 35 -0.809736478186275 Node 36 -0.028143141185541877 Sigmoid Node 6 Inputs Weights

234

Threshold -1.4485430202686858 Node 7 -0.4376249769627563 Node 8 -1.6285419811231152 Node 9 -0.9173962720001242 Node 10 1.7630137099791732 Node 11 -0.9068710331497558 Node 12 -0.7789074026900574 Node 13 0.2956645461589255 Node 14 -0.7473684083532958 Node 15 -0.08844180566458369 Node 16 0.7995721251700091 Node 17 -1.1148066894373925 Node 18 -2.5243980151724217 Node 19 -0.6851979410386221 Node 20 0.4864940135912355 Node 21 -0.5362084063409286 Node 22 -1.2312143848406027 Node 23 -0.4390910008887513 Node 24 2.823744562121949 Node 25 1.8008240359366574 Node 26 -1.0749186968236526 Node 27 -0.769216664847365 Node 28 0.4973187878270373 Node 29 -0.9870845335867847 Node 30 0.9322305525182693 Node 31 -0.27451043264889463 Node 32 -1.5381855613565019 Node 33 1.3617393052930444 Node 34 -0.49043886726053404 Node 35 0.7274495939608631 Node 36 -0.2596435963257864 Sigmoid Node 7 Inputs Weights Threshold 0.06064536967053715 Attrib PRI/PHY 0.10307343352631197 Attrib Pri/nC17 -0.09033129051996854 Attrib PHY/NC18 0.038900192696212345 Attrib 17/(17+C27) -0.045524063324394806 Attrib TOTALHEIGHT -0.10389838380825958 Attrib p_ Saturados -0.12026816724791073 Attrib p_ Aromáticos 0.1296795469579156 Attrib p_ NSO -0.04105017852931349 Attrib delC13 -0.3392565257973532 Attrib API -0.04440538518308929 Attrib Enxofre (p_) -0.03894264450230294 Attrib p_27BBS218 -0.10267169584724516 Attrib p_28BBS218 0.22136469502897516 Attrib p_29BBS218 -0.013383749705842156 Attrib p_H31 0.14703217161778678 Attrib p_H32 -0.12286156600160895 Attrib p_H33 -0.13613794190665462 Attrib p_H34 -0.14278800949133477 Attrib p_H35 -0.007128708525164366 Attrib 19/23TRI -0.12026004347348523 Attrib 20S/(20S+20R) St -0.14999270686852625 Attrib 21/23TRI -0.13921266206820118

235

Attrib 21+22/STER 0.27241462932600313 Attrib 23/24TRI 0.027163491339068292 Attrib 24/25TRI 0.014528630724834936 Attrib 25NOR/HOPANE -0.11182694879597599 Attrib 26/25TRI 0.1756724150405023 Attrib 26/28TRI -0.20709527501666558 Attrib 27/29BBS218 -0.09270297231137171 Attrib 28/29BBS218 0.16533973547589567 Attrib 29/30H -0.18177289527434337 Attrib 30/29BBS218 0.2219574863010313 Attrib DIA/C27AA -0.14901283861676862 Attrib DIA30/C27AA 0.29930010565023085 Attrib DIAH/H30 -0.04182471119895065 Attrib DITERP/H30 0.28287997555253924 Attrib GAM/H30 -0.0747177591670126 Attrib GAM/TR23 0.0027721950085900326 Attrib H28/H29 -0.013483724764758563 Attrib H28/H30 0.043115661811101325 Attrib H28/TR23 0.2963098393679626 Attrib H29/C29TS 0.3488972011913262 Attrib H29/H30 -0.015762552899789322 Attrib H30/C27AA 0.26731730969127343 Attrib H35/H34 0.06264666451497249 Attrib HOP/STER 0.3233114281140916 Attrib NOR25H/H29 0.12229195171548025 Attrib NOR25H/H30 0.1002373409605068 Attrib NORNEO/H29 -0.05333622510647875 Attrib Total Esteranos 0.03176661666512514 Attrib Total Hopanos 0.011987195041179573 Attrib TET24/26TRI -0.17227086997770008 Attrib TET24/H30 0.10456498683563042 Attrib TPP 0.41367897738016135 Attrib TR23/H30 0.22793075791878598 Attrib TRIC/HOP 0.31505433333706123 Attrib TRIC/STER 0.2939252889785901 Attrib TS/(TS+TM) -0.14293773075583482 Attrib TS/TM 0.14075985003258912 Attrib abb/(abb+aaa) 0.06364556541609885 Sigmoid Node 8 Inputs Weights Threshold 0.06352859041098158 Attrib PRI/PHY 0.021524596984544078 Attrib Pri/nC17 -0.5361102586087622 Attrib PHY/NC18 -0.541608482378474 Attrib 17/(17+C27) 0.28150164320297283 Attrib TOTALHEIGHT -0.6253493144018459 Attrib p_ Saturados 0.6914612045920997 Attrib p_ Aromáticos -0.4337283651794894 Attrib p_ NSO -0.6314972980542637 Attrib delC13 -0.5513643221318074 Attrib API 0.20375914339122003 Attrib Enxofre (p_) 0.043151807109292936 Attrib p_27BBS218 -0.192909309665203 Attrib p_28BBS218 0.11050357567291663 Attrib p_29BBS218 0.1129060482679285 Attrib p_H31 0.015095811502167687

236

Attrib p_H32 -0.7334241124958054 Attrib p_H33 0.039375751467939646 Attrib p_H34 0.1269810997088195 Attrib p_H35 0.1063828404864003 Attrib 19/23TRI -0.024630619586410094 Attrib 20S/(20S+20R) St 0.05082514245913222 Attrib 21/23TRI 0.5482844410771096 Attrib 21+22/STER 0.2199904648335722 Attrib 23/24TRI -0.058432821222335486 Attrib 24/25TRI 0.865791509584789 Attrib 25NOR/HOPANE -0.3678217268895245 Attrib 26/25TRI 0.5613043045642286 Attrib 26/28TRI 0.4652270991506924 Attrib 27/29BBS218 -0.4086701880117352 Attrib 28/29BBS218 -0.0385736910300746 Attrib 29/30H -0.34426109337110344 Attrib 30/29BBS218 0.030940595273917012 Attrib DIA/C27AA -0.040848839983234825 Attrib DIA30/C27AA -0.04574253229947312 Attrib DIAH/H30 -0.03604707025064509 Attrib DITERP/H30 0.11534195592219443 Attrib GAM/H30 -1.278398404271329 Attrib GAM/TR23 -0.6636236436113241 Attrib H28/H29 -0.0833027138917817 Attrib H28/H30 -0.14473127038720926 Attrib H28/TR23 -0.17647705007222664 Attrib H29/C29TS 0.1504264542481822 Attrib H29/H30 -0.2422849332599671 Attrib H30/C27AA 0.12373213147525094 Attrib H35/H34 -0.18074170266173203 Attrib HOP/STER 0.1166377920021938 Attrib NOR25H/H29 -0.09586542342598454 Attrib NOR25H/H30 -0.053002316553288235 Attrib NORNEO/H29 -0.13269634523548868 Attrib Total Esteranos -0.06422958478580773 Attrib Total Hopanos -0.1057674015880158 Attrib TET24/26TRI -0.5380308146273164 Attrib TET24/H30 0.19650340197613808 Attrib TPP 0.2800364315956155 Attrib TR23/H30 0.13940482225412432 Attrib TRIC/HOP 0.1784048308910193 Attrib TRIC/STER -0.051078150122288786 Attrib TS/(TS+TM) 0.142882703610354 Attrib TS/TM 0.07043645502343196 Attrib abb/(abb+aaa) 0.05839558938204054 Sigmoid Node 9 Inputs Weights Threshold 0.07224914435721871 Attrib PRI/PHY 0.873724684332881 Attrib Pri/nC17 0.761407810563734 Attrib PHY/NC18 -0.21275610475684098 Attrib 17/(17+C27) 0.02841165510162212 Attrib TOTALHEIGHT -0.19322258473866957 Attrib p_ Saturados -0.23628414447371254 Attrib p_ Aromáticos 0.06787246534404764 Attrib p_ NSO 0.18012719815994402

237

Attrib delC13 -0.9044998127044579 Attrib API -0.25547953556736197 Attrib Enxofre (p_) -0.21158688198357667 Attrib p_27BBS218 0.6182017238648154 Attrib p_28BBS218 -0.5894460614633438 Attrib p_29BBS218 -0.5019386067748925 Attrib p_H31 -0.22349752264208064 Attrib p_H32 0.6153281860852938 Attrib p_H33 0.4258333233034498 Attrib p_H34 0.09294086851853534 Attrib p_H35 -0.4029945767022812 Attrib 19/23TRI 0.3769314080240172 Attrib 20S/(20S+20R) St 1.4483106776084795 Attrib 21/23TRI 0.6873862460238656 Attrib 21+22/STER 0.010829245083861327 Attrib 23/24TRI -0.2013817006741177 Attrib 24/25TRI 0.7272470637970313 Attrib 25NOR/HOPANE 0.8514267725264899 Attrib 26/25TRI 0.1277135755703607 Attrib 26/28TRI 0.39555618762799305 Attrib 27/29BBS218 0.6707355294568362 Attrib 28/29BBS218 0.11681518753493404 Attrib 29/30H 0.002972797534138328 Attrib 30/29BBS218 -0.7935625127947515 Attrib DIA/C27AA 0.8829558094290854 Attrib DIA30/C27AA 0.12352526752200095 Attrib DIAH/H30 0.8012106777859587 Attrib DITERP/H30 0.07809480356052331 Attrib GAM/H30 -0.009939499767220394 Attrib GAM/TR23 -0.09612999341209684 Attrib H28/H29 -0.16686575633023126 Attrib H28/H30 -0.12306973819847486 Attrib H28/TR23 -0.3464371438211289 Attrib H29/C29TS -1.345332234553994 Attrib H29/H30 -0.8097098234040232 Attrib H30/C27AA 0.025464026162154447 Attrib H35/H34 -0.20229870123657917 Attrib HOP/STER -0.10152574229839782 Attrib NOR25H/H29 -0.5104535240006364 Attrib NOR25H/H30 -0.5244460543752569 Attrib NORNEO/H29 0.6184632836203461 Attrib Total Esteranos -0.033708114441122254 Attrib Total Hopanos -0.1320411553170097 Attrib TET24/26TRI -0.022552420713318276 Attrib TET24/H30 -0.5042060501165186 Attrib TPP 0.3156435989738856 Attrib TR23/H30 0.09576721997464775 Attrib TRIC/HOP -0.028455791102167765 Attrib TRIC/STER -0.5767021916713662 Attrib TS/(TS+TM) 1.1380086369017732 Attrib TS/TM 0.45911168924272866 Attrib abb/(abb+aaa) 0.02784540135347461 Sigmoid Node 10 Inputs Weights Threshold 0.06676891630105408 Attrib PRI/PHY 0.673165348586031

238

Attrib Pri/nC17 -0.2587959012121562 Attrib PHY/NC18 -0.017233288449896318 Attrib 17/(17+C27) 0.543734031328843 Attrib TOTALHEIGHT -0.2058715736742464 Attrib p_ Saturados -0.12771014852372117 Attrib p_ Aromáticos -0.06597028598171395 Attrib p_ NSO 0.19475751490430787 Attrib delC13 -0.18728425431872556 Attrib API 0.6178590220149728 Attrib Enxofre (p_) -0.2773153287773176 Attrib p_27BBS218 0.16697087359831944 Attrib p_28BBS218 -0.2785142975163853 Attrib p_29BBS218 -0.09946433047951134 Attrib p_H31 -0.24779688239902914 Attrib p_H32 0.689808133634155 Attrib p_H33 0.601260669598422 Attrib p_H34 -0.40404738975769444 Attrib p_H35 -0.3933111804107563 Attrib 19/23TRI 1.020109570764559 Attrib 20S/(20S+20R) St -0.0265375703858822 Attrib 21/23TRI -0.2618998165468626 Attrib 21+22/STER 0.06338703130887026 Attrib 23/24TRI 0.023379727626026282 Attrib 24/25TRI -0.19714285855048636 Attrib 25NOR/HOPANE 0.5528150226535854 Attrib 26/25TRI 0.2652448473697853 Attrib 26/28TRI -0.6421013947950255 Attrib 27/29BBS218 0.026709007890521417 Attrib 28/29BBS218 -0.05164128429653233 Attrib 29/30H 0.3061035081527588 Attrib 30/29BBS218 -0.008964629199850903 Attrib DIA/C27AA 0.6131903011678375 Attrib DIA30/C27AA -0.5373797903430871 Attrib DIAH/H30 0.33951356480421807 Attrib DITERP/H30 -0.42433909202672304 Attrib GAM/H30 -0.10841076490586898 Attrib GAM/TR23 0.9277421420144263 Attrib H28/H29 0.14752996486798614 Attrib H28/H30 0.10107716409689241 Attrib H28/TR23 1.057058224129196 Attrib H29/C29TS -0.3162082329464926 Attrib H29/H30 -0.18041844312232017 Attrib H30/C27AA -0.02803549925594235 Attrib H35/H34 -0.1571243982330216 Attrib HOP/STER 0.2777923340102336 Attrib NOR25H/H29 -0.1698325425622208 Attrib NOR25H/H30 -0.05296751264032447 Attrib NORNEO/H29 0.6311854529806159 Attrib Total Esteranos 0.20599935731933566 Attrib Total Hopanos 0.21704943555813705 Attrib TET24/26TRI 1.132695812197578 Attrib TET24/H30 -0.43214008388970526 Attrib TPP -0.5251666921870269 Attrib TR23/H30 -0.5409716996484087 Attrib TRIC/HOP -0.5591114884461171 Attrib TRIC/STER -0.44536457788717143

239

Attrib TS/(TS+TM) 0.7477630300208468 Attrib TS/TM 0.87024106223837 Attrib abb/(abb+aaa) -0.6775438851688483 Sigmoid Node 11 Inputs Weights Threshold -0.14998516896145286 Attrib PRI/PHY 0.16900327677614252 Attrib Pri/nC17 -0.3018143547954734 Attrib PHY/NC18 0.3135116523697541 Attrib 17/(17+C27) 0.03531526914499301 Attrib TOTALHEIGHT -0.11046644235360983 Attrib p_ Saturados -0.5504673510018884 Attrib p_ Aromáticos 0.5749217347586691 Attrib p_ NSO 0.3592631612015118 Attrib delC13 -1.3759046274520437 Attrib API 0.27563268449805395 Attrib Enxofre (p_) -1.274950832147754 Attrib p_27BBS218 -0.5342422628471813 Attrib p_28BBS218 1.261255981086916 Attrib p_29BBS218 0.005327259935060124 Attrib p_H31 0.6187140689169776 Attrib p_H32 -0.2602692115208245 Attrib p_H33 -0.1990379668973381 Attrib p_H34 -1.2850294799725335 Attrib p_H35 -0.18839519630289817 Attrib 19/23TRI -0.26911168254009193 Attrib 20S/(20S+20R) St -1.2490144867070423 Attrib 21/23TRI 0.5180213098381853 Attrib 21+22/STER 0.45194975478026705 Attrib 23/24TRI 0.9435780238315339 Attrib 24/25TRI 0.19571312710559607 Attrib 25NOR/HOPANE -0.4416511675246493 Attrib 26/25TRI 0.2458428862707554 Attrib 26/28TRI -0.060651956726170304 Attrib 27/29BBS218 -0.5805375833621803 Attrib 28/29BBS218 0.7700444369319702 Attrib 29/30H -0.6065166582391406 Attrib 30/29BBS218 0.7687137335329541 Attrib DIA/C27AA -1.0279638275749627 Attrib DIA30/C27AA 1.3735959093847399 Attrib DIAH/H30 -0.2649518531579737 Attrib DITERP/H30 0.07244895780951455 Attrib GAM/H30 -0.08442813340041075 Attrib GAM/TR23 0.005948870660101531 Attrib H28/H29 -0.3391498722558466 Attrib H28/H30 -0.36107736256082057 Attrib H28/TR23 0.6745805295245789 Attrib H29/C29TS 1.1841285432286146 Attrib H29/H30 0.22975587422914207 Attrib H30/C27AA 1.0096682745605694 Attrib H35/H34 0.30120394790585936 Attrib HOP/STER 1.4293368296891025 Attrib NOR25H/H29 -0.0713010854379583 Attrib NOR25H/H30 -0.14816480016248265 Attrib NORNEO/H29 -0.6632935652974513 Attrib Total Esteranos 0.16987841260852912

240

Attrib Total Hopanos 0.22281449102181408 Attrib TET24/26TRI -0.2548896228009213 Attrib TET24/H30 0.16462964365277405 Attrib TPP 1.208330256180801 Attrib TR23/H30 0.2681491871027574 Attrib TRIC/HOP 0.45025400799728765 Attrib TRIC/STER 1.2274798494670305 Attrib TS/(TS+TM) -1.1994278656842694 Attrib TS/TM -0.5134358792019201 Attrib abb/(abb+aaa) 0.39390506533527286 Sigmoid Node 12 Inputs Weights Threshold -0.16255240788587202 Attrib PRI/PHY 0.40210867220732904 Attrib Pri/nC17 -0.12582279883370526 Attrib PHY/NC18 0.05857735682133706 Attrib 17/(17+C27) -0.10109042834555718 Attrib TOTALHEIGHT 0.5733678250294528 Attrib p_ Saturados -0.4464535347186337 Attrib p_ Aromáticos 0.6703594490451379 Attrib p_ NSO 0.20945692653542444 Attrib delC13 0.37348737665287063 Attrib API -0.1126568295353441 Attrib Enxofre (p_) 0.6792415263595328 Attrib p_27BBS218 0.869446926000138 Attrib p_28BBS218 -1.297282700648664 Attrib p_29BBS218 -0.44592636313238765 Attrib p_H31 -0.637451360499133 Attrib p_H32 0.8301554668561113 Attrib p_H33 0.16559806081293582 Attrib p_H34 1.0327509815377585 Attrib p_H35 0.036455994416118756 Attrib 19/23TRI 0.8643293806556578 Attrib 20S/(20S+20R) St 1.5565112908690448 Attrib 21/23TRI -0.7176004211577756 Attrib 21+22/STER -0.18930445343744537 Attrib 23/24TRI -0.9004775999594308 Attrib 24/25TRI -0.12043375137533847 Attrib 25NOR/HOPANE 0.42898850084450557 Attrib 26/25TRI 0.1942622204807643 Attrib 26/28TRI -0.4353156769945534 Attrib 27/29BBS218 1.042451958013798 Attrib 28/29BBS218 -0.4476062393771063 Attrib 29/30H 0.2419258129086371 Attrib 30/29BBS218 -0.06148988016529224 Attrib DIA/C27AA 1.2074995165768616 Attrib DIA30/C27AA -0.22768141331650157 Attrib DIAH/H30 0.5626712573530139 Attrib DITERP/H30 -0.3279711733333825 Attrib GAM/H30 0.24689880069973502 Attrib GAM/TR23 0.16710081562782264 Attrib H28/H29 0.07617030153142337 Attrib H28/H30 0.0357203173171438 Attrib H28/TR23 -0.8195021094481612 Attrib H29/C29TS -0.9599518394523507 Attrib H29/H30 -0.6570551579806955

241

Attrib H30/C27AA -0.09730281476032251 Attrib H35/H34 -0.2835232219406173 Attrib HOP/STER 0.05176834019110124 Attrib NOR25H/H29 0.16388373759608843 Attrib NOR25H/H30 0.10315982790123503 Attrib NORNEO/H29 0.8134564615450949 Attrib Total Esteranos -0.01104904771711842 Attrib Total Hopanos -9.439723204389403E-4 Attrib TET24/26TRI 0.523597006332769 Attrib TET24/H30 -0.520941647212981 Attrib TPP -0.6043282523028851 Attrib TR23/H30 -0.5042662401877478 Attrib TRIC/HOP -0.5016457414421068 Attrib TRIC/STER -0.44904836663249387 Attrib TS/(TS+TM) 1.138302598623183 Attrib TS/TM 0.7210496632713951 Attrib abb/(abb+aaa) -0.3936396841677677 Sigmoid Node 13 Inputs Weights Threshold 0.08004573673631864 Attrib PRI/PHY 0.40089096506729094 Attrib Pri/nC17 0.38317133441818474 Attrib PHY/NC18 0.42817265474520905 Attrib 17/(17+C27) -0.06411545305446895 Attrib TOTALHEIGHT 0.5231110266014176 Attrib p_ Saturados -0.8728526731799523 Attrib p_ Aromáticos 0.7525669775659256 Attrib p_ NSO 0.5068323725098733 Attrib delC13 0.5852162471934299 Attrib API 0.0233274559345138 Attrib Enxofre (p_) -0.28010973122162836 Attrib p_27BBS218 0.33489872154982164 Attrib p_28BBS218 -0.28822569379686325 Attrib p_29BBS218 -0.3443731533626526 Attrib p_H31 -0.38586452528854714 Attrib p_H32 1.1111178182628267 Attrib p_H33 0.30026424817690056 Attrib p_H34 -0.319366093566992 Attrib p_H35 0.022437430523945513 Attrib 19/23TRI 0.533251670044289 Attrib 20S/(20S+20R) St 0.48486596862391385 Attrib 21/23TRI -0.7105263002641571 Attrib 21+22/STER -0.09399985957126614 Attrib 23/24TRI -0.395831392389831 Attrib 24/25TRI -0.6621568090922123 Attrib 25NOR/HOPANE 0.24089466423188502 Attrib 26/25TRI -0.27564649543958986 Attrib 26/28TRI -0.6785720080655092 Attrib 27/29BBS218 0.5682941470609916 Attrib 28/29BBS218 0.05430631672897988 Attrib 29/30H 0.30380587144529425 Attrib 30/29BBS218 0.0021589552392479693 Attrib DIA/C27AA 0.48009976433809337 Attrib DIA30/C27AA -0.06810730825492026 Attrib DIAH/H30 0.21838158888293932 Attrib DITERP/H30 -0.23316179240706092

242

Attrib GAM/H30 0.8816167572009554 Attrib GAM/TR23 0.5161212667308397 Attrib H28/H29 0.03349511692707005 Attrib H28/H30 0.0371611459209098 Attrib H28/TR23 0.1631425364541399 Attrib H29/C29TS -0.45719985701866 Attrib H29/H30 -0.10112419147312102 Attrib H30/C27AA -0.01647191668173193 Attrib H35/H34 0.4216419620288637 Attrib HOP/STER 0.07067157143878113 Attrib NOR25H/H29 -0.22745453022108217 Attrib NOR25H/H30 -0.11426653256419769 Attrib NORNEO/H29 0.36411872845731713 Attrib Total Esteranos -0.08470108498328986 Attrib Total Hopanos -0.10895959843976595 Attrib TET24/26TRI 0.7077240807345929 Attrib TET24/H30 -0.3658274034119298 Attrib TPP -0.35338999549922 Attrib TR23/H30 -0.4631812165820057 Attrib TRIC/HOP -0.36901132534987025 Attrib TRIC/STER -0.26272494844051597 Attrib TS/(TS+TM) 0.46190878305316735 Attrib TS/TM 0.6348638416657382 Attrib abb/(abb+aaa) -0.17865329330811355 Sigmoid Node 14 Inputs Weights Threshold -0.10234696113388199 Attrib PRI/PHY -0.07772688381694048 Attrib Pri/nC17 0.06316145431724329 Attrib PHY/NC18 -0.020984455098191666 Attrib 17/(17+C27) 0.07667041484205485 Attrib TOTALHEIGHT 0.02774779523896275 Attrib p_ Saturados 0.1341485988783677 Attrib p_ Aromáticos 0.012030948269152774 Attrib p_ NSO -0.20567706273694053 Attrib delC13 0.5145357184443943 Attrib API -0.25224995905774117 Attrib Enxofre (p_) 0.7406816091720958 Attrib p_27BBS218 0.3520440329922865 Attrib p_28BBS218 -0.6304232385821568 Attrib p_29BBS218 -0.058600176538410466 Attrib p_H31 -0.3343164712166218 Attrib p_H32 0.03643922804064064 Attrib p_H33 -0.07777509303041036 Attrib p_H34 0.7691024702304494 Attrib p_H35 0.22060332861695378 Attrib 19/23TRI 0.27400475890947196 Attrib 20S/(20S+20R) St 0.7070859089605451 Attrib 21/23TRI -0.1869900061169289 Attrib 21+22/STER -0.2289803153388448 Attrib 23/24TRI -0.6130359350517487 Attrib 24/25TRI 0.0820117060095682 Attrib 25NOR/HOPANE -0.01635805809137211 Attrib 26/25TRI -0.08597292210504058 Attrib 26/28TRI -0.21716574185718449 Attrib 27/29BBS218 0.36695580868529326

243

Attrib 28/29BBS218 -0.38603137976938984 Attrib 29/30H 0.142885051813426 Attrib 30/29BBS218 0.013784664017233807 Attrib DIA/C27AA 0.5292591237537657 Attrib DIA30/C27AA -0.4940193745326023 Attrib DIAH/H30 0.3032076505067925 Attrib DITERP/H30 -0.12163139158979974 Attrib GAM/H30 -0.13795859699630902 Attrib GAM/TR23 -0.03513903359427693 Attrib H28/H29 -0.12691407402496258 Attrib H28/H30 -0.10040716816799289 Attrib H28/TR23 -0.41650623291198613 Attrib H29/C29TS -0.44112741423775 Attrib H29/H30 -0.2975946002825702 Attrib H30/C27AA -0.2813916577974919 Attrib H35/H34 -0.2636328435491954 Attrib HOP/STER -0.4444917067876329 Attrib NOR25H/H29 0.014640269045892662 Attrib NOR25H/H30 -0.011841289675836414 Attrib NORNEO/H29 0.4491482925919387 Attrib Total Esteranos 0.042220304776214204 Attrib Total Hopanos 0.02493330187702373 Attrib TET24/26TRI 0.12199426644651047 Attrib TET24/H30 -0.04069817926637401 Attrib TPP -0.5449656049314502 Attrib TR23/H30 -0.31648900331934293 Attrib TRIC/HOP -0.33266118880235873 Attrib TRIC/STER -0.5158791686272504 Attrib TS/(TS+TM) 0.6027050973370749 Attrib TS/TM 0.42204547958070376 Attrib abb/(abb+aaa) -0.05710362340702961 Sigmoid Node 15 Inputs Weights Threshold -0.3139082602756724 Attrib PRI/PHY -0.796505739919175 Attrib Pri/nC17 -0.4347930912618758 Attrib PHY/NC18 0.8512017149127311 Attrib 17/(17+C27) 0.18147794324882344 Attrib TOTALHEIGHT 0.05131599763393984 Attrib p_ Saturados 1.481191096906084 Attrib p_ Aromáticos -1.4030429664382449 Attrib p_ NSO -0.7315938947293467 Attrib delC13 -0.2276659703831023 Attrib API 0.7636852271600162 Attrib Enxofre (p_) -0.300939497883684 Attrib p_27BBS218 -0.9675020468908416 Attrib p_28BBS218 1.2934248119358815 Attrib p_29BBS218 0.5071624397462602 Attrib p_H31 0.7710429157447605 Attrib p_H32 -1.1003357203380804 Attrib p_H33 -0.6044583405518928 Attrib p_H34 0.32240781818848385 Attrib p_H35 -0.1929103146414887 Attrib 19/23TRI -0.05064952960558731 Attrib 20S/(20S+20R) St -2.3420883492315054 Attrib 21/23TRI -0.3297749358850358

244

Attrib 21+22/STER 0.8256600003144958 Attrib 23/24TRI -0.06813487789222497 Attrib 24/25TRI -0.7229468608467734 Attrib 25NOR/HOPANE -1.0556831107306794 Attrib 26/25TRI 0.6066413336176296 Attrib 26/28TRI -0.861370417257052 Attrib 27/29BBS218 -1.0441367500741796 Attrib 28/29BBS218 0.2558439514045743 Attrib 29/30H 0.08071481544794282 Attrib 30/29BBS218 1.2619526822875407 Attrib DIA/C27AA -1.0922540280063233 Attrib DIA30/C27AA 0.11892011992005058 Attrib DIAH/H30 -1.2342658305578194 Attrib DITERP/H30 0.9552118980386743 Attrib GAM/H30 -0.47972488817806 Attrib GAM/TR23 0.44076906789118037 Attrib H28/H29 0.8710842657619716 Attrib H28/H30 0.9321773154197824 Attrib H28/TR23 0.759484359264626 Attrib H29/C29TS 2.223645736962454 Attrib H29/H30 1.0940508266349398 Attrib H30/C27AA 0.18706243051437862 Attrib H35/H34 -0.4801994385893694 Attrib HOP/STER 1.296534919642963 Attrib NOR25H/H29 0.6220231985779334 Attrib NOR25H/H30 0.854802624145636 Attrib NORNEO/H29 -0.7791636490782222 Attrib Total Esteranos 0.4340341908973407 Attrib Total Hopanos 0.45523037555722456 Attrib TET24/26TRI 0.18687117562066946 Attrib TET24/H30 0.794179941210434 Attrib TPP 0.6623497546262114 Attrib TR23/H30 0.5793565397861904 Attrib TRIC/HOP 0.9325638840167806 Attrib TRIC/STER 1.3782864964242507 Attrib TS/(TS+TM) -1.4896800566194952 Attrib TS/TM -0.3377663084651576 Attrib abb/(abb+aaa) -0.9109532857805518 Sigmoid Node 16 Inputs Weights Threshold -0.16934836298231168 Attrib PRI/PHY -0.011966902393884782 Attrib Pri/nC17 0.595617766091063 Attrib PHY/NC18 0.8382305057631032 Attrib 17/(17+C27) -0.30019490370743873 Attrib TOTALHEIGHT 0.8491661399086521 Attrib p_ Saturados -0.9758049304645172 Attrib p_ Aromáticos 0.7360627399537847 Attrib p_ NSO 0.8265137401575704 Attrib delC13 0.5820612591909541 Attrib API -0.1087316284303422 Attrib Enxofre (p_) -0.3403107521884913 Attrib p_27BBS218 0.28336950382644616 Attrib p_28BBS218 -0.08452003359330734 Attrib p_29BBS218 -0.44452479509045045 Attrib p_H31 -0.17144949392270667

245

Attrib p_H32 1.1024860506341567 Attrib p_H33 0.08713627588218761 Attrib p_H34 -0.29642805242399634 Attrib p_H35 -0.03015394213352501 Attrib 19/23TRI 0.20271923050525134 Attrib 20S/(20S+20R) St -0.08158243993260111 Attrib 21/23TRI -0.6768510094421551 Attrib 21+22/STER -0.05009140918984701 Attrib 23/24TRI -0.0018352033201431228 Attrib 24/25TRI -1.162579530266265 Attrib 25NOR/HOPANE 0.1067493266713177 Attrib 26/25TRI -0.7008437534702714 Attrib 26/28TRI -0.7414072069947826 Attrib 27/29BBS218 0.6308924333678944 Attrib 28/29BBS218 0.29503883058365504 Attrib 29/30H 0.5263289396071528 Attrib 30/29BBS218 -0.008806913390738335 Attrib DIA/C27AA 0.14797682994969624 Attrib DIA30/C27AA 0.0906997245217327 Attrib DIAH/H30 0.10207869839410692 Attrib DITERP/H30 -0.16923398643110354 Attrib GAM/H30 1.6281839233032172 Attrib GAM/TR23 0.8878570845213888 Attrib H28/H29 -0.004414563637655026 Attrib H28/H30 0.009974314097956547 Attrib H28/TR23 0.05840138731606613 Attrib H29/C29TS -0.10997719635262769 Attrib H29/H30 0.4157066414765788 Attrib H30/C27AA 0.0021389263938364727 Attrib H35/H34 0.4984944174434366 Attrib HOP/STER -0.012636717066228946 Attrib NOR25H/H29 -0.3505263768325498 Attrib NOR25H/H30 -0.2844005374732572 Attrib NORNEO/H29 0.15783796740121545 Attrib Total Esteranos 0.19621742512635731 Attrib Total Hopanos 0.20221440248095363 Attrib TET24/26TRI 0.8437197140593531 Attrib TET24/H30 -0.17067068145546554 Attrib TPP -0.3034145298296705 Attrib TR23/H30 -0.19934890241773637 Attrib TRIC/HOP -0.23613221496737144 Attrib TRIC/STER 0.1027697434506437 Attrib TS/(TS+TM) -0.12251228467182451 Attrib TS/TM 0.15893775443298988 Attrib abb/(abb+aaa) -0.012245970320895928 Sigmoid Node 17 Inputs Weights Threshold 0.0709541552606439 Attrib PRI/PHY 0.2716696294823397 Attrib Pri/nC17 -0.057718714907492384 Attrib PHY/NC18 -0.00879915662487161 Attrib 17/(17+C27) 0.2507441404715277 Attrib TOTALHEIGHT -0.212812921230741 Attrib p_ Saturados -0.43695652882129843 Attrib p_ Aromáticos 0.5977472773843117 Attrib p_ NSO 0.07947702964519064

246

Attrib delC13 -0.9687375063724593 Attrib API 0.35112194082987175 Attrib Enxofre (p_) -1.3988666245546024 Attrib p_27BBS218 -0.34132156785727846 Attrib p_28BBS218 0.7366110679884251 Attrib p_29BBS218 0.026395266568357025 Attrib p_H31 0.22016717034000602 Attrib p_H32 0.0713592937121754 Attrib p_H33 0.26233037183940694 Attrib p_H34 -1.229055947820886 Attrib p_H35 -0.039088613170344684 Attrib 19/23TRI 0.13519321418170477 Attrib 20S/(20S+20R) St -0.4866289634589825 Attrib 21/23TRI 0.5212229937796713 Attrib 21+22/STER 0.5064385046382477 Attrib 23/24TRI 0.533054227711978 Attrib 24/25TRI 0.37172335998929 Attrib 25NOR/HOPANE -0.24506382524791318 Attrib 26/25TRI 0.14730713135233842 Attrib 26/28TRI 0.0800149060696392 Attrib 27/29BBS218 -0.39734715737312876 Attrib 28/29BBS218 0.4785904989457704 Attrib 29/30H -0.3008402918875731 Attrib 30/29BBS218 0.015528844461832912 Attrib DIA/C27AA -0.425867618753874 Attrib DIA30/C27AA 0.6520448474114057 Attrib DIAH/H30 0.2579421729932888 Attrib DITERP/H30 0.22947262658256376 Attrib GAM/H30 -0.21486611227309937 Attrib GAM/TR23 -0.13113841214593938 Attrib H28/H29 -0.34024725549758156 Attrib H28/H30 -0.38740677406302854 Attrib H28/TR23 0.5005564791583672 Attrib H29/C29TS 0.30716716207098793 Attrib H29/H30 -0.07831821542445093 Attrib H30/C27AA 0.4491117277260979 Attrib H35/H34 0.5469653627955098 Attrib HOP/STER 0.602836720005479 Attrib NOR25H/H29 -0.543452288583844 Attrib NOR25H/H30 -0.44722154145462745 Attrib NORNEO/H29 -0.07874384633148418 Attrib Total Esteranos -0.05390858884020991 Attrib Total Hopanos -0.07470131401204287 Attrib TET24/26TRI -0.07778501020403836 Attrib TET24/H30 0.3013843138083492 Attrib TPP 0.6944753456353633 Attrib TR23/H30 0.2801365227941774 Attrib TRIC/HOP 0.3608047527538046 Attrib TRIC/STER 0.502722677741399 Attrib TS/(TS+TM) -0.2990976524000471 Attrib TS/TM 0.291464444143505 Attrib abb/(abb+aaa) 0.7815079679439139 Sigmoid Node 18 Inputs Weights Threshold -0.6464628742750544 Attrib PRI/PHY -0.9926195942149917

247

Attrib Pri/nC17 0.14142768904018801 Attrib PHY/NC18 0.06647740474603567 Attrib 17/(17+C27) -8.025342499533499E-4 Attrib TOTALHEIGHT 0.36766225215832393 Attrib p_ Saturados 0.040745627447815666 Attrib p_ Aromáticos 0.6606098122335093 Attrib p_ NSO -0.19038849271170633 Attrib delC13 1.2561333569990378 Attrib API -0.6667190701141872 Attrib Enxofre (p_) -0.13773398902293876 Attrib p_27BBS218 -0.4115126927609678 Attrib p_28BBS218 0.08980707528321076 Attrib p_29BBS218 0.4021250823113677 Attrib p_H31 -0.15854701192329612 Attrib p_H32 -0.41184939772675583 Attrib p_H33 -0.19696114361059996 Attrib p_H34 0.2582932621857762 Attrib p_H35 0.8214104528814147 Attrib 19/23TRI -0.13332397111858768 Attrib 20S/(20S+20R) St 0.18305093015292728 Attrib 21/23TRI 0.22426797686597708 Attrib 21+22/STER -0.07420471511335149 Attrib 23/24TRI -0.09555059697742328 Attrib 24/25TRI 0.019351781818471463 Attrib 25NOR/HOPANE -0.5001200656035534 Attrib 26/25TRI -0.349285991768136 Attrib 26/28TRI 0.4399146975791644 Attrib 27/29BBS218 -0.23607439572745173 Attrib 28/29BBS218 -0.16841926243034003 Attrib 29/30H 0.09667849234437477 Attrib 30/29BBS218 0.07389444129782043 Attrib DIA/C27AA -0.05364532360881163 Attrib DIA30/C27AA -0.20963733689476016 Attrib DIAH/H30 0.6560057027929543 Attrib DITERP/H30 0.19183907702684788 Attrib GAM/H30 -0.194744648376495 Attrib GAM/TR23 -0.8277792442159976 Attrib H28/H29 -0.27799322740728216 Attrib H28/H30 -0.29734385728004153 Attrib H28/TR23 -0.5180113360614009 Attrib H29/C29TS -0.1809913327534263 Attrib H29/H30 -0.10298029803967755 Attrib H30/C27AA -0.4578408515546536 Attrib H35/H34 0.4813533831224913 Attrib HOP/STER -1.1169312030660308 Attrib NOR25H/H29 -0.01905039003405943 Attrib NOR25H/H30 -0.17502345825351628 Attrib NORNEO/H29 0.4045110866107831 Attrib Total Esteranos 0.17348033088955178 Attrib Total Hopanos 0.04891698548465066 Attrib TET24/26TRI -0.5656564140599338 Attrib TET24/H30 0.8454409040969937 Attrib TPP -0.7375873419356447 Attrib TR23/H30 0.15956706130015438 Attrib TRIC/HOP -0.04464109045241871 Attrib TRIC/STER -0.28892824042774345

248

Attrib TS/(TS+TM) -0.008940996461453367 Attrib TS/TM 0.5269714978801269 Attrib abb/(abb+aaa) 1.032744649173902 Sigmoid Node 19 Inputs Weights Threshold -0.5187449730914555 Attrib PRI/PHY -1.0094872708543674 Attrib Pri/nC17 0.27889820473747523 Attrib PHY/NC18 0.05084539584035947 Attrib 17/(17+C27) -0.2079249818282046 Attrib TOTALHEIGHT 0.2844986965694542 Attrib p_ Saturados -0.13644756385507212 Attrib p_ Aromáticos 0.6330755528240664 Attrib p_ NSO -0.0894830843343406 Attrib delC13 1.5330613083226643 Attrib API -0.6548749066808576 Attrib Enxofre (p_) 0.08656012007322177 Attrib p_27BBS218 -0.32744894442785283 Attrib p_28BBS218 0.06286164465188734 Attrib p_29BBS218 0.3070945834901257 Attrib p_H31 -0.2273483720019512 Attrib p_H32 0.023265671876675133 Attrib p_H33 -0.2558355822596057 Attrib p_H34 0.20150969822836987 Attrib p_H35 0.8271266240271405 Attrib 19/23TRI -0.4140354501064947 Attrib 20S/(20S+20R) St -0.0036177151447889804 Attrib 21/23TRI -0.15635815339189615 Attrib 21+22/STER -0.11435881216386636 Attrib 23/24TRI -0.4901330400878916 Attrib 24/25TRI -0.24230052620673984 Attrib 25NOR/HOPANE -0.20222055545139725 Attrib 26/25TRI -0.3787198815501477 Attrib 26/28TRI 0.24008303263974592 Attrib 27/29BBS218 -0.14545838899860927 Attrib 28/29BBS218 -0.24089552955169422 Attrib 29/30H 0.07352685927381557 Attrib 30/29BBS218 0.11504321841581232 Attrib DIA/C27AA -0.17882314757658788 Attrib DIA30/C27AA -0.3729430640349989 Attrib DIAH/H30 0.36191193895591994 Attrib DITERP/H30 0.23047798000233705 Attrib GAM/H30 0.23644527643986407 Attrib GAM/TR23 -0.4617336807040468 Attrib H28/H29 -0.1356322504503742 Attrib H28/H30 -0.2032211688722741 Attrib H28/TR23 -0.29768849438854994 Attrib H29/C29TS -0.12286974954668123 Attrib H29/H30 -0.02411378427262449 Attrib H30/C27AA -0.4574547156225703 Attrib H35/H34 0.6631498389106456 Attrib HOP/STER -1.1614094059989357 Attrib NOR25H/H29 0.03322657319104344 Attrib NOR25H/H30 -0.03121638440076985 Attrib NORNEO/H29 0.27499671380711505 Attrib Total Esteranos 0.20044216503120021

249

Attrib Total Hopanos 0.21403125040568802 Attrib TET24/26TRI -0.5864135132619158 Attrib TET24/H30 0.5938960082131661 Attrib TPP -0.5466385288387955 Attrib TR23/H30 0.01405807869473455 Attrib TRIC/HOP -0.02684859369386659 Attrib TRIC/STER -0.24949291640301596 Attrib TS/(TS+TM) -0.027681646618820038 Attrib TS/TM 0.5387233908120473 Attrib abb/(abb+aaa) 0.7771460891618076 Sigmoid Node 20 Inputs Weights Threshold 0.15055277207401696 Attrib PRI/PHY 0.19990118205907423 Attrib Pri/nC17 0.15202260213126387 Attrib PHY/NC18 0.2116939352337045 Attrib 17/(17+C27) -0.1233674475161478 Attrib TOTALHEIGHT -0.19841486675124068 Attrib p_ Saturados -0.2451003238118701 Attrib p_ Aromáticos 0.043685238671096215 Attrib p_ NSO 0.2808365532403091 Attrib delC13 -0.2945880471429605 Attrib API -0.1927227381777161 Attrib Enxofre (p_) 0.16235050593075692 Attrib p_27BBS218 0.15781306278875157 Attrib p_28BBS218 0.012878158408657385 Attrib p_29BBS218 -0.2670364301917766 Attrib p_H31 0.09836435626888648 Attrib p_H32 -0.1557890897475541 Attrib p_H33 -0.21786345220828662 Attrib p_H34 -0.1231555581057986 Attrib p_H35 0.041799107872526706 Attrib 19/23TRI -0.3230301346559603 Attrib 20S/(20S+20R) St -0.32824381698257904 Attrib 21/23TRI -0.29668698853531006 Attrib 21+22/STER 0.08417489010606809 Attrib 23/24TRI 0.021555583504206097 Attrib 24/25TRI -0.093232426580269 Attrib 25NOR/HOPANE 0.14803051599491648 Attrib 26/25TRI 0.0684773620423876 Attrib 26/28TRI -0.25838620188751 Attrib 27/29BBS218 0.09908080841601079 Attrib 28/29BBS218 0.18241572469916195 Attrib 29/30H -0.1770783370076908 Attrib 30/29BBS218 0.18841362429203795 Attrib DIA/C27AA -0.30610151456330714 Attrib DIA30/C27AA 0.35999000775681866 Attrib DIAH/H30 -0.22180479887399582 Attrib DITERP/H30 0.19969896640397924 Attrib GAM/H30 0.26782493712419303 Attrib GAM/TR23 0.49899252298480207 Attrib H28/H29 0.03450170658995167 Attrib H28/H30 0.11141586913888449 Attrib H28/TR23 0.600188904105653 Attrib H29/C29TS 0.4193846891190989 Attrib H29/H30 0.08462380385404475

250

Attrib H30/C27AA 0.19529174293143256 Attrib H35/H34 0.03468213970553242 Attrib HOP/STER 0.2896253037348389 Attrib NOR25H/H29 0.18746544627126496 Attrib NOR25H/H30 0.19552290029171449 Attrib NORNEO/H29 -0.23685791354072236 Attrib Total Esteranos 0.03721705513749514 Attrib Total Hopanos 0.07404927365173063 Attrib TET24/26TRI 0.10478190844992417 Attrib TET24/H30 -0.1437898219832191 Attrib TPP 0.4755775333326477 Attrib TR23/H30 0.19709026181004613 Attrib TRIC/HOP 0.26053935789590954 Attrib TRIC/STER 0.31931766717832866 Attrib TS/(TS+TM) -0.29322649371725373 Attrib TS/TM -0.08279807178253666 Attrib abb/(abb+aaa) -0.1898457545516597 Sigmoid Node 21 Inputs Weights Threshold -0.2362309635845949 Attrib PRI/PHY 0.34400979443375473 Attrib Pri/nC17 -0.6762012971742514 Attrib PHY/NC18 0.023264766649749937 Attrib 17/(17+C27) 1.3652807189429643 Attrib TOTALHEIGHT 0.048468992450438016 Attrib p_ Saturados 0.17694686306591642 Attrib p_ Aromáticos 0.1367021943356804 Attrib p_ NSO -0.1664258350008657 Attrib delC13 0.4825558003741064 Attrib API 0.9595112402893202 Attrib Enxofre (p_) -1.0329962580244596 Attrib p_27BBS218 0.036815801064463735 Attrib p_28BBS218 -0.31585854348827463 Attrib p_29BBS218 0.03379275435240819 Attrib p_H31 -0.294513392433204 Attrib p_H32 0.7609022561827511 Attrib p_H33 0.5510700312552778 Attrib p_H34 -0.4437777708910121 Attrib p_H35 0.043648892405248926 Attrib 19/23TRI 1.389758612144084 Attrib 20S/(20S+20R) St -0.20837826666675063 Attrib 21/23TRI 0.1327663624032094 Attrib 21+22/STER 0.22631619366225 Attrib 23/24TRI -0.19866808805002278 Attrib 24/25TRI -0.1615393918612173 Attrib 25NOR/HOPANE -0.14293029396011186 Attrib 26/25TRI 0.20731990840332637 Attrib 26/28TRI -0.39323673120290176 Attrib 27/29BBS218 0.1183220666652887 Attrib 28/29BBS218 -0.09724582963183621 Attrib 29/30H 0.31143958083237855 Attrib 30/29BBS218 -0.0509782524804381 Attrib DIA/C27AA 0.167032401259358 Attrib DIA30/C27AA -0.9686420218551234 Attrib DIAH/H30 0.318700945759512 Attrib DITERP/H30 -0.5112224936755745

251

Attrib GAM/H30 -0.13665183986654283 Attrib GAM/TR23 0.48328136721385295 Attrib H28/H29 -0.11239312878590511 Attrib H28/H30 -0.11379162447442152 Attrib H28/TR23 0.32612918324056756 Attrib H29/C29TS -0.27636797311442673 Attrib H29/H30 -0.09486411205148607 Attrib H30/C27AA -0.23294835537475508 Attrib H35/H34 0.3555480588246275 Attrib HOP/STER -0.01566958646622588 Attrib NOR25H/H29 -0.7757029133863452 Attrib NOR25H/H30 -0.6128713659050158 Attrib NORNEO/H29 0.6280524198384353 Attrib Total Esteranos 0.2549544934328779 Attrib Total Hopanos 0.2310134063645472 Attrib TET24/26TRI 1.22724143257775 Attrib TET24/H30 -0.05667530604310328 Attrib TPP -0.8820688264578094 Attrib TR23/H30 -0.7196597004904649 Attrib TRIC/HOP -0.7687685968179264 Attrib TRIC/STER -0.5175247763552686 Attrib TS/(TS+TM) 0.7247633362394962 Attrib TS/TM 1.042890881562584 Attrib abb/(abb+aaa) -0.060828832506635545 Sigmoid Node 22 Inputs Weights Threshold -0.24501069561070982 Attrib PRI/PHY -0.0513805835454366 Attrib Pri/nC17 0.0957813190324679 Attrib PHY/NC18 -0.5326530021435399 Attrib 17/(17+C27) 0.24636565592200688 Attrib TOTALHEIGHT -0.5189482582354159 Attrib p_ Saturados 0.46200959594164576 Attrib p_ Aromáticos -0.26050418980034423 Attrib p_ NSO -0.3404328918516316 Attrib delC13 -0.01956266171386471 Attrib API -0.12390078105669143 Attrib Enxofre (p_) 0.22983179324237576 Attrib p_27BBS218 -0.044079315072464126 Attrib p_28BBS218 -0.20032372720537184 Attrib p_29BBS218 0.18337408465269447 Attrib p_H31 -0.3780295160553129 Attrib p_H32 -0.4103236680269326 Attrib p_H33 0.24090198876314434 Attrib p_H34 0.808239401035576 Attrib p_H35 0.31087631829728085 Attrib 19/23TRI 0.2071707580634177 Attrib 20S/(20S+20R) St 0.9138676899472034 Attrib 21/23TRI 0.62492240414256 Attrib 21+22/STER -0.2378293425021018 Attrib 23/24TRI -0.06506199654694746 Attrib 24/25TRI 0.6961739793233201 Attrib 25NOR/HOPANE 0.13336285911607515 Attrib 26/25TRI 0.27475356141817875 Attrib 26/28TRI 0.53154976249332 Attrib 27/29BBS218 -0.16068744374750746

252

Attrib 28/29BBS218 -0.22669938457542396 Attrib 29/30H 0.048838817498954974 Attrib 30/29BBS218 -0.5917654720078865 Attrib DIA/C27AA 0.7217895229616064 Attrib DIA30/C27AA -0.43129031986516625 Attrib DIAH/H30 0.8164041092541778 Attrib DITERP/H30 0.01642184389884812 Attrib GAM/H30 -0.8961302885338562 Attrib GAM/TR23 -0.4772463913680468 Attrib H28/H29 0.05634594222883017 Attrib H28/H30 -0.003113330768813238 Attrib H28/TR23 -0.29822912444598465 Attrib H29/C29TS -0.7777135125773554 Attrib H29/H30 -0.4928239677114449 Attrib H30/C27AA -0.3847700433057236 Attrib H35/H34 -0.26690091595997983 Attrib HOP/STER -0.847987263605428 Attrib NOR25H/H29 -0.15552876894221482 Attrib NOR25H/H30 -0.3192049426515637 Attrib NORNEO/H29 0.5780768406608904 Attrib Total Esteranos 0.19150095324458508 Attrib Total Hopanos 0.12765911840112773 Attrib TET24/26TRI -0.38677879662940146 Attrib TET24/H30 0.046684113421474764 Attrib TPP -0.4708336880060935 Attrib TR23/H30 -0.00934644567701686 Attrib TRIC/HOP -0.2913199125749161 Attrib TRIC/STER -0.777312150504674 Attrib TS/(TS+TM) 0.8740998535442952 Attrib TS/TM 0.4795320152766086 Attrib abb/(abb+aaa) 0.013709033279472514 Sigmoid Node 23 Inputs Weights Threshold 0.045094850746718214 Attrib PRI/PHY 0.11810207770372311 Attrib Pri/nC17 0.8914555495833973 Attrib PHY/NC18 -0.07206423489329888 Attrib 17/(17+C27) -0.8549709288179154 Attrib TOTALHEIGHT -0.259167041007665 Attrib p_ Saturados -0.4321630982462543 Attrib p_ Aromáticos 0.14674403564097815 Attrib p_ NSO 0.3625670616689737 Attrib delC13 -0.8104998897387179 Attrib API -0.9592773228427678 Attrib Enxofre (p_) 0.814161047267981 Attrib p_27BBS218 0.2572826226349723 Attrib p_28BBS218 -0.23968539039015288 Attrib p_29BBS218 -0.11269452168377236 Attrib p_H31 0.06349204807321206 Attrib p_H32 -0.28973562359692384 Attrib p_H33 -0.2799262272405997 Attrib p_H34 0.41255336186344044 Attrib p_H35 -0.052910471308508095 Attrib 19/23TRI -1.0028148903502512 Attrib 20S/(20S+20R) St 0.7896492098182211 Attrib 21/23TRI 0.07390889009983656

253

Attrib 21+22/STER -0.1729364530240205 Attrib 23/24TRI -0.0878850964125994 Attrib 24/25TRI 0.3674181548972625 Attrib 25NOR/HOPANE 0.5984287690722155 Attrib 26/25TRI 0.012585377150609098 Attrib 26/28TRI 0.608640161466089 Attrib 27/29BBS218 0.19159526163937185 Attrib 28/29BBS218 -0.03306529642438201 Attrib 29/30H 0.0288644161528509 Attrib 30/29BBS218 -0.5698654875123748 Attrib DIA/C27AA 0.24590438263175016 Attrib DIA30/C27AA 0.9582226591152615 Attrib DIAH/H30 0.49915122047283966 Attrib DITERP/H30 0.7120001171111408 Attrib GAM/H30 0.324437607284428 Attrib GAM/TR23 -0.14063339585533732 Attrib H28/H29 -0.05190821431168676 Attrib H28/H30 -0.08517939790465469 Attrib H28/TR23 -0.3778356676881892 Attrib H29/C29TS -0.6117527012271006 Attrib H29/H30 -0.22187747950762682 Attrib H30/C27AA 0.2393070634824472 Attrib H35/H34 -0.355248742348921 Attrib HOP/STER -0.08938510446215052 Attrib NOR25H/H29 0.46554876447283866 Attrib NOR25H/H30 0.3024843041198091 Attrib NORNEO/H29 0.13185802571496957 Attrib Total Esteranos -0.08655753186882197 Attrib Total Hopanos -0.09479114598181128 Attrib TET24/26TRI -0.9443360214380887 Attrib TET24/H30 -0.1985720535203063 Attrib TPP 0.9465973180845282 Attrib TR23/H30 0.8357054171972599 Attrib TRIC/HOP 0.7609815762780674 Attrib TRIC/STER 0.35177072250971836 Attrib TS/(TS+TM) 0.26740017891929235 Attrib TS/TM -0.3195088464773149 Attrib abb/(abb+aaa) 0.26097421179243085 Sigmoid Node 24 Inputs Weights Threshold -0.24203351712896742 Attrib PRI/PHY 0.1602725266510197 Attrib Pri/nC17 0.3296532221786266 Attrib PHY/NC18 0.4991596780753608 Attrib 17/(17+C27) 0.059244275086425977 Attrib TOTALHEIGHT -0.2627805666566048 Attrib p_ Saturados -0.4379883831176249 Attrib p_ Aromáticos 0.012465624065292892 Attrib p_ NSO 0.6889499345902702 Attrib delC13 -0.22840446349824237 Attrib API -0.22123154253829935 Attrib Enxofre (p_) 0.5125287435674971 Attrib p_27BBS218 0.060432362144631664 Attrib p_28BBS218 0.013890206556534184 Attrib p_29BBS218 -0.11923567819298575 Attrib p_H31 0.29186609068435587

254

Attrib p_H32 -0.1398043451946753 Attrib p_H33 -0.17630021732462747 Attrib p_H34 -0.030262145856977972 Attrib p_H35 -0.1111033013989089 Attrib 19/23TRI -0.04667750460072042 Attrib 20S/(20S+20R) St -0.48373571108004454 Attrib 21/23TRI -0.2860491771995135 Attrib 21+22/STER -0.0608163635011708 Attrib 23/24TRI 0.41989836034242295 Attrib 24/25TRI -0.41358574192272296 Attrib 25NOR/HOPANE 0.6806534370677907 Attrib 26/25TRI -0.05792047538503174 Attrib 26/28TRI -0.3599764965578493 Attrib 27/29BBS218 0.06344869222540851 Attrib 28/29BBS218 0.11652242546341943 Attrib 29/30H 0.14575904506669674 Attrib 30/29BBS218 0.012588167566463731 Attrib DIA/C27AA 0.036968582974490204 Attrib DIA30/C27AA 0.2621232202092631 Attrib DIAH/H30 4.750878584723944E-4 Attrib DITERP/H30 0.13724932778693308 Attrib GAM/H30 0.6069400577239416 Attrib GAM/TR23 1.2339806968972238 Attrib H28/H29 0.4919302889826981 Attrib H28/H30 0.49592299333761897 Attrib H28/TR23 1.3046715870845529 Attrib H29/C29TS 0.4866803265607134 Attrib H29/H30 0.2698987787659428 Attrib H30/C27AA 0.2366659875665506 Attrib H35/H34 -0.0848855770578509 Attrib HOP/STER 0.2045227682639552 Attrib NOR25H/H29 0.36477777699039915 Attrib NOR25H/H30 0.48414359638305005 Attrib NORNEO/H29 -0.036501612647372936 Attrib Total Esteranos 0.47343047049325787 Attrib Total Hopanos 0.49251058741292697 Attrib TET24/26TRI 0.6392139528622629 Attrib TET24/H30 -0.14014870150743589 Attrib TPP -1.7178969361579443E-4 Attrib TR23/H30 0.13336049264367722 Attrib TRIC/HOP 0.13955512620748467 Attrib TRIC/STER 0.3042024705012955 Attrib TS/(TS+TM) -0.2773463760424497 Attrib TS/TM 0.07608819586802917 Attrib abb/(abb+aaa) -0.6072103766992809 Sigmoid Node 25 Inputs Weights Threshold -0.13328900437943095 Attrib PRI/PHY 0.10981961201191572 Attrib Pri/nC17 0.2978564140094941 Attrib PHY/NC18 0.4395004249321417 Attrib 17/(17+C27) 0.02710179737106359 Attrib TOTALHEIGHT -0.24970327119102242 Attrib p_ Saturados -0.3355543308888679 Attrib p_ Aromáticos -0.02472494159206373 Attrib p_ NSO 0.48034558502788305

255

Attrib delC13 -0.13577699087267006 Attrib API -0.22201082316445833 Attrib Enxofre (p_) 0.476515567855478 Attrib p_27BBS218 0.10980199403707508 Attrib p_28BBS218 -0.0010940710739305753 Attrib p_29BBS218 -0.1697806094254157 Attrib p_H31 0.16849626794463235 Attrib p_H32 -0.15402782288017217 Attrib p_H33 -0.15670695656182995 Attrib p_H34 0.00481560398842985 Attrib p_H35 -0.07498898566801554 Attrib 19/23TRI 0.026583628039226107 Attrib 20S/(20S+20R) St -0.34820904633847644 Attrib 21/23TRI -0.3054783950787422 Attrib 21+22/STER -0.02463206408633284 Attrib 23/24TRI 0.2939303764080713 Attrib 24/25TRI -0.2599141379073644 Attrib 25NOR/HOPANE 0.47136842953820335 Attrib 26/25TRI -0.07388526975599083 Attrib 26/28TRI -0.34812997703516146 Attrib 27/29BBS218 0.01567436543110799 Attrib 28/29BBS218 0.08645481219791702 Attrib 29/30H 0.1619344862375383 Attrib 30/29BBS218 0.008205651790114784 Attrib DIA/C27AA -0.014590741088164225 Attrib DIA30/C27AA 0.20259130201280165 Attrib DIAH/H30 0.04849673237497167 Attrib DITERP/H30 0.1216074853927321 Attrib GAM/H30 0.41558201447157317 Attrib GAM/TR23 0.9609945075828145 Attrib H28/H29 0.3412718480835634 Attrib H28/H30 0.3085958565458769 Attrib H28/TR23 1.0126629927818336 Attrib H29/C29TS 0.43762119909404024 Attrib H29/H30 0.2428542189262435 Attrib H30/C27AA 0.14430440047242776 Attrib H35/H34 -0.033731882937636806 Attrib HOP/STER 0.13900860843186008 Attrib NOR25H/H29 0.274987696606255 Attrib NOR25H/H30 0.3309881225854492 Attrib NORNEO/H29 0.02841970199767585 Attrib Total Esteranos 0.4066581114612077 Attrib Total Hopanos 0.43977559788892484 Attrib TET24/26TRI 0.5105703323504851 Attrib TET24/H30 -0.10304078659692666 Attrib TPP -0.003216221324929529 Attrib TR23/H30 0.06677589105601059 Attrib TRIC/HOP 0.1788994572010883 Attrib TRIC/STER 0.27049297918744086 Attrib TS/(TS+TM) -0.18529495403234145 Attrib TS/TM 0.054169026702667315 Attrib abb/(abb+aaa) -0.5000098548627453 Sigmoid Node 26 Inputs Weights Threshold -0.08902117786576867 Attrib PRI/PHY 0.27979685836624163

256

Attrib Pri/nC17 -0.2597761980775744 Attrib PHY/NC18 0.13178166319887136 Attrib 17/(17+C27) -0.04393781259265957 Attrib TOTALHEIGHT -0.28627369168807065 Attrib p_ Saturados -0.8144608617425617 Attrib p_ Aromáticos 0.6098857566236016 Attrib p_ NSO 0.5762206626481993 Attrib delC13 -1.634639865663979 Attrib API 0.32822495563197673 Attrib Enxofre (p_) -1.9782350965815185 Attrib p_27BBS218 -0.7504218356791476 Attrib p_28BBS218 1.5636265272822716 Attrib p_29BBS218 0.14301004480696264 Attrib p_H31 0.7602497364823423 Attrib p_H32 -0.18071639382953059 Attrib p_H33 0.30614451603984755 Attrib p_H34 -1.924011193459885 Attrib p_H35 -0.20867680433341596 Attrib 19/23TRI -0.2940537725940011 Attrib 20S/(20S+20R) St -1.3113221755632298 Attrib 21/23TRI 0.7946452214455575 Attrib 21+22/STER 0.43482011446040525 Attrib 23/24TRI 1.4933107210267254 Attrib 24/25TRI 0.31532952827589106 Attrib 25NOR/HOPANE -0.22270564262680492 Attrib 26/25TRI 0.2260531549886359 Attrib 26/28TRI 0.37521763793024504 Attrib 27/29BBS218 -0.692095413910577 Attrib 28/29BBS218 0.9659149366363903 Attrib 29/30H -0.568782293841361 Attrib 30/29BBS218 0.044605961441814806 Attrib DIA/C27AA -1.1592265519511546 Attrib DIA30/C27AA 1.49039991164941 Attrib DIAH/H30 -0.08671392906450114 Attrib DITERP/H30 0.11009975135177774 Attrib GAM/H30 0.06434286337390893 Attrib GAM/TR23 -0.11605485356429994 Attrib H28/H29 -0.20525984724654026 Attrib H28/H30 -0.1516479579175283 Attrib H28/TR23 0.8476482616794584 Attrib H29/C29TS 1.084993281590387 Attrib H29/H30 0.2980063979326623 Attrib H30/C27AA 1.0305514645266463 Attrib H35/H34 0.7170676351963716 Attrib HOP/STER 1.383299790953747 Attrib NOR25H/H29 -0.6168036330239125 Attrib NOR25H/H30 -0.5076195816195658 Attrib NORNEO/H29 -0.7440237868994366 Attrib Total Esteranos 0.09604159287089657 Attrib Total Hopanos 0.08296053340123613 Attrib TET24/26TRI -0.3328144511009385 Attrib TET24/H30 0.12445675244363301 Attrib TPP 1.4347079451072031 Attrib TR23/H30 0.4652930596324402 Attrib TRIC/HOP 0.5340413748096269 Attrib TRIC/STER 1.1806300615670997

257

Attrib TS/(TS+TM) -1.2782528016980108 Attrib TS/TM -0.6433151771179719 Attrib abb/(abb+aaa) 0.8288695658397205 Sigmoid Node 27 Inputs Weights Threshold -0.08064631270953784 Attrib PRI/PHY 0.30499674620166195 Attrib Pri/nC17 0.5525827470470711 Attrib PHY/NC18 -0.19033421025119193 Attrib 17/(17+C27) -0.26692743310840905 Attrib TOTALHEIGHT -0.20696319958365755 Attrib p_ Saturados -0.23790147511912893 Attrib p_ Aromáticos 0.1691329381315473 Attrib p_ NSO 0.1491863810203573 Attrib delC13 -0.6634102667468155 Attrib API -0.4627797640123264 Attrib Enxofre (p_) 0.08535344647873781 Attrib p_27BBS218 0.2141989543897843 Attrib p_28BBS218 -0.31345159752756335 Attrib p_29BBS218 -0.16722747254441142 Attrib p_H31 0.07791393723528507 Attrib p_H32 0.02838570840200935 Attrib p_H33 -0.09971206652051222 Attrib p_H34 0.2669175403585373 Attrib p_H35 -0.13168431929165555 Attrib 19/23TRI -0.5425944690714588 Attrib 20S/(20S+20R) St 0.7805257726082324 Attrib 21/23TRI 0.34015907561454806 Attrib 21+22/STER 0.036899664576356205 Attrib 23/24TRI -0.1929794870238419 Attrib 24/25TRI 0.5327446610615837 Attrib 25NOR/HOPANE 0.5553292357392962 Attrib 26/25TRI 0.23630706543101387 Attrib 26/28TRI 0.4541630320269547 Attrib 27/29BBS218 0.2015143314763605 Attrib 28/29BBS218 -0.023711887334446423 Attrib 29/30H -0.027226620263317944 Attrib 30/29BBS218 -0.63317118291213 Attrib DIA/C27AA 0.27888667528013833 Attrib DIA30/C27AA 0.6458529524543274 Attrib DIAH/H30 0.6518977117002219 Attrib DITERP/H30 0.5369312642317574 Attrib GAM/H30 0.19225948706318052 Attrib GAM/TR23 -0.041592278524510064 Attrib H28/H29 -0.08422867881535481 Attrib H28/H30 -0.14521300699295125 Attrib H28/TR23 -0.3265707678730619 Attrib H29/C29TS -0.7372337499802094 Attrib H29/H30 -0.42116377020042856 Attrib H30/C27AA 0.03181594951119639 Attrib H35/H34 -0.10790011045994814 Attrib HOP/STER -0.08798419300823768 Attrib NOR25H/H29 0.15250478449502464 Attrib NOR25H/H30 0.06430918717870465 Attrib NORNEO/H29 0.3494797542695471 Attrib Total Esteranos 0.054858089255435054

258

Attrib Total Hopanos 0.0581911472448294 Attrib TET24/26TRI -0.6980390163301976 Attrib TET24/H30 -0.1522305064422029 Attrib TPP 0.8108184611611593 Attrib TR23/H30 0.6315014784965287 Attrib TRIC/HOP 0.5807195400037503 Attrib TRIC/STER 0.13064769687165043 Attrib TS/(TS+TM) 0.554035095940396 Attrib TS/TM 0.16214363173697846 Attrib abb/(abb+aaa) 0.2809582319275058 Sigmoid Node 28 Inputs Weights Threshold 0.053023172218949005 Attrib PRI/PHY 0.012478520204780526 Attrib Pri/nC17 -0.3537797501134643 Attrib PHY/NC18 0.4694914966374753 Attrib 17/(17+C27) 0.09461465009196603 Attrib TOTALHEIGHT -0.16743399992732547 Attrib p_ Saturados 0.09687355160709621 Attrib p_ Aromáticos -0.3648428759966968 Attrib p_ NSO 0.09995813119852039 Attrib delC13 -0.4483815368679431 Attrib API 0.0881817111952864 Attrib Enxofre (p_) 0.19065504650213244 Attrib p_27BBS218 -0.22209395310673746 Attrib p_28BBS218 0.4653111641226534 Attrib p_29BBS218 0.005167617810947741 Attrib p_H31 0.3548459024848304 Attrib p_H32 -0.5285274303555519 Attrib p_H33 -0.3341146723084492 Attrib p_H34 -0.02712682817197713 Attrib p_H35 -0.19044014415576635 Attrib 19/23TRI -0.09183981191544338 Attrib 20S/(20S+20R) St -1.2037298725719834 Attrib 21/23TRI -0.3967875867954791 Attrib 21+22/STER 0.2368959345435906 Attrib 23/24TRI 0.324582432621419 Attrib 24/25TRI -0.41127406385334764 Attrib 25NOR/HOPANE -0.24504836898434013 Attrib 26/25TRI 0.24516146881040102 Attrib 26/28TRI -0.594375814098301 Attrib 27/29BBS218 -0.30766566101031634 Attrib 28/29BBS218 0.1917332808886386 Attrib 29/30H -0.09372161569804072 Attrib 30/29BBS218 0.555478673969674 Attrib DIA/C27AA -0.5042844314014142 Attrib DIA30/C27AA 0.25451408682323956 Attrib DIAH/H30 -0.66580015838216 Attrib DITERP/H30 0.19326210011298461 Attrib GAM/H30 -0.16749852094710552 Attrib GAM/TR23 0.6664937426769885 Attrib H28/H29 0.1285891981061897 Attrib H28/H30 0.18384163793608052 Attrib H28/TR23 0.8908178881066349 Attrib H29/C29TS 1.314756487799838 Attrib H29/H30 0.6125314661677979

259

Attrib H30/C27AA 0.3669397228168232 Attrib H35/H34 -0.267313669547036 Attrib HOP/STER 0.7770338483843188 Attrib NOR25H/H29 0.33177249697682604 Attrib NOR25H/H30 0.5268920296006414 Attrib NORNEO/H29 -0.5573950012130803 Attrib Total Esteranos 0.17977260510436543 Attrib Total Hopanos 0.27046587754997375 Attrib TET24/26TRI 0.4665728868998104 Attrib TET24/H30 0.11705463505113173 Attrib TPP 0.41759026132651184 Attrib TR23/H30 0.08125559286428367 Attrib TRIC/HOP 0.3234884388049331 Attrib TRIC/STER 0.7314064821855658 Attrib TS/(TS+TM) -0.8758923550986277 Attrib TS/TM -0.2570856715881206 Attrib abb/(abb+aaa) -0.6989114884764368 Sigmoid Node 29 Inputs Weights Threshold -0.2564287946803585 Attrib PRI/PHY -0.5951939420953705 Attrib Pri/nC17 0.45960262171130656 Attrib PHY/NC18 0.13122548080677027 Attrib 17/(17+C27) -0.5119472449164735 Attrib TOTALHEIGHT 0.16751534266639742 Attrib p_ Saturados 0.03210873452296558 Attrib p_ Aromáticos 0.16196803172177932 Attrib p_ NSO -0.11580406379887767 Attrib delC13 0.737729669796787 Attrib API -0.715052714836761 Attrib Enxofre (p_) 0.6747640036379184 Attrib p_27BBS218 0.11090442268739759 Attrib p_28BBS218 -0.28671100347510897 Attrib p_29BBS218 -0.029907327852571605 Attrib p_H31 -0.2151293603172351 Attrib p_H32 -0.3240071820373814 Attrib p_H33 -0.3828414443403635 Attrib p_H34 0.9926520476428435 Attrib p_H35 0.5017829879337078 Attrib 19/23TRI -0.6517819220031708 Attrib 20S/(20S+20R) St 0.6032369090223234 Attrib 21/23TRI -0.21102672183198912 Attrib 21+22/STER -0.2795505639661895 Attrib 23/24TRI -0.505367532157517 Attrib 24/25TRI -0.17477711284422975 Attrib 25NOR/HOPANE -0.04406301619172749 Attrib 26/25TRI -0.3015502485123568 Attrib 26/28TRI 0.17968656644265024 Attrib 27/29BBS218 0.21204867825838827 Attrib 28/29BBS218 -0.23445781501405152 Attrib 29/30H 0.018026552589701025 Attrib 30/29BBS218 -0.11810252912379034 Attrib DIA/C27AA 0.1913935153750792 Attrib DIA30/C27AA -0.20296940645722383 Attrib DIAH/H30 0.21171932589460996 Attrib DITERP/H30 0.26071806259033226

260

Attrib GAM/H30 0.1291745825611919 Attrib GAM/TR23 -0.39161676801581075 Attrib H28/H29 0.025976070515777397 Attrib H28/H30 -0.014652136513881118 Attrib H28/TR23 -0.6855097449220687 Attrib H29/C29TS -0.29337996019715723 Attrib H29/H30 -0.16202242499823152 Attrib H30/C27AA -0.3655257149197539 Attrib H35/H34 -0.058702013298981726 Attrib HOP/STER -0.8014715368170092 Attrib NOR25H/H29 0.10598681831900326 Attrib NOR25H/H30 -0.023298881037152948 Attrib NORNEO/H29 0.17111198132821767 Attrib Total Esteranos 0.004568407361707044 Attrib Total Hopanos -0.050027337864208016 Attrib TET24/26TRI -0.6997655873749449 Attrib TET24/H30 0.13214209998894744 Attrib TPP -0.11723841367873084 Attrib TR23/H30 0.18872299496678324 Attrib TRIC/HOP 0.12879633188795506 Attrib TRIC/STER -0.265999063067129 Attrib TS/(TS+TM) 0.16850324691779542 Attrib TS/TM 0.06486545626869777 Attrib abb/(abb+aaa) 0.2038336903734379 Sigmoid Node 30 Inputs Weights Threshold -0.2897773950776242 Attrib PRI/PHY -0.03292656553586105 Attrib Pri/nC17 0.8477529007851363 Attrib PHY/NC18 1.0578116021730055 Attrib 17/(17+C27) -0.39540654750762355 Attrib TOTALHEIGHT 1.128399591606626 Attrib p_ Saturados -1.221050955016983 Attrib p_ Aromáticos 0.9223060634190953 Attrib p_ NSO 1.0304657490982079 Attrib delC13 0.8398122822546938 Attrib API -0.04161618004793903 Attrib Enxofre (p_) -0.37153740804932556 Attrib p_27BBS218 0.4926798541810524 Attrib p_28BBS218 -0.10319683179027446 Attrib p_29BBS218 -0.6065842809988506 Attrib p_H31 -0.1307655712871915 Attrib p_H32 1.33025491162275 Attrib p_H33 0.08112182959123679 Attrib p_H34 -0.441230354273472 Attrib p_H35 -0.05287859083770996 Attrib 19/23TRI 0.3172540683430565 Attrib 20S/(20S+20R) St -0.17754458024114328 Attrib 21/23TRI -0.7732046932546662 Attrib 21+22/STER -0.15205864818772524 Attrib 23/24TRI 0.04057918562534028 Attrib 24/25TRI -1.438223264584618 Attrib 25NOR/HOPANE 0.16176617975543464 Attrib 26/25TRI -1.0175784918930642 Attrib 26/28TRI -0.9922588312542983 Attrib 27/29BBS218 0.8505469672879169

261

Attrib 28/29BBS218 0.47200755974362096 Attrib 29/30H 0.694025816458776 Attrib 30/29BBS218 0.021866931944465397 Attrib DIA/C27AA 0.1662826970306496 Attrib DIA30/C27AA 0.13920505836070188 Attrib DIAH/H30 0.12440465679684859 Attrib DITERP/H30 -0.26083021963798 Attrib GAM/H30 2.131593045853796 Attrib GAM/TR23 1.2676088941102472 Attrib H28/H29 -0.06114167720570287 Attrib H28/H30 -0.07283330041996439 Attrib H28/TR23 0.08077156604429914 Attrib H29/C29TS -0.06091804302413885 Attrib H29/H30 0.5386814766534213 Attrib H30/C27AA -0.03137376011230646 Attrib H35/H34 0.5997192535630637 Attrib HOP/STER -0.031201936699844723 Attrib NOR25H/H29 -0.5280823964339066 Attrib NOR25H/H30 -0.3787395885107752 Attrib NORNEO/H29 0.24279477231713928 Attrib Total Esteranos 0.3686176978214293 Attrib Total Hopanos 0.3224395440055758 Attrib TET24/26TRI 1.1702351018782218 Attrib TET24/H30 -0.22691750802967822 Attrib TPP -0.4238664629580795 Attrib TR23/H30 -0.29210589203315196 Attrib TRIC/HOP -0.23700978230450076 Attrib TRIC/STER 0.10449445203979188 Attrib TS/(TS+TM) -0.18711150937822218 Attrib TS/TM 0.12616397497945642 Attrib abb/(abb+aaa) 0.06028068178045046 Sigmoid Node 31 Inputs Weights Threshold -0.09059590392120634 Attrib PRI/PHY -0.04253412456679837 Attrib Pri/nC17 0.22129495002653266 Attrib PHY/NC18 0.03634155131211151 Attrib 17/(17+C27) -0.3451833327340466 Attrib TOTALHEIGHT -0.13725894227637497 Attrib p_ Saturados 0.14955405916151526 Attrib p_ Aromáticos -0.223248783842725 Attrib p_ NSO 0.028006493342184472 Attrib delC13 0.019394893172013268 Attrib API -0.30379753683041943 Attrib Enxofre (p_) 0.6465605850724603 Attrib p_27BBS218 0.12477713915488362 Attrib p_28BBS218 -0.24581635535020818 Attrib p_29BBS218 -0.10389674713122062 Attrib p_H31 0.034171587756575784 Attrib p_H32 -0.21384651743124214 Attrib p_H33 -0.18565278229110432 Attrib p_H34 0.6090959637834488 Attrib p_H35 -0.00864358915465414 Attrib 19/23TRI -0.39326555660123536 Attrib 20S/(20S+20R) St 0.38312955512045355 Attrib 21/23TRI -0.10634609730466116

262

Attrib 21+22/STER -0.022269976115713706 Attrib 23/24TRI -0.37961525177096933 Attrib 24/25TRI -0.01624730036003123 Attrib 25NOR/HOPANE 0.2609834034413583 Attrib 26/25TRI 0.10595256385893265 Attrib 26/28TRI 0.009676540162164501 Attrib 27/29BBS218 0.17256119214432508 Attrib 28/29BBS218 -0.13262421135477873 Attrib 29/30H -0.021788508195845498 Attrib 30/29BBS218 -0.21707557820253057 Attrib DIA/C27AA 0.2639448354826426 Attrib DIA30/C27AA 0.06559768849040895 Attrib DIAH/H30 0.006249281107513721 Attrib DITERP/H30 0.26276775692368404 Attrib GAM/H30 0.12230300320286472 Attrib GAM/TR23 0.07465768375389475 Attrib H28/H29 0.17109699594150393 Attrib H28/H30 0.26488662866889806 Attrib H28/TR23 -0.2103864508191499 Attrib H29/C29TS -0.09674576958383373 Attrib H29/H30 -0.07772035847715283 Attrib H30/C27AA -0.04319779693448321 Attrib H35/H34 -0.2707919675947138 Attrib HOP/STER -0.049346852353797925 Attrib NOR25H/H29 0.2122394128091705 Attrib NOR25H/H30 0.2007518336408707 Attrib NORNEO/H29 0.056079754550193095 Attrib Total Esteranos 0.12385287467432324 Attrib Total Hopanos 0.1506018429944969 Attrib TET24/26TRI -0.371388472099627 Attrib TET24/H30 -0.09823584707115898 Attrib TPP 0.24775694854718422 Attrib TR23/H30 0.24195260174860142 Attrib TRIC/HOP 0.29845892176388217 Attrib TRIC/STER 0.027958974100809882 Attrib TS/(TS+TM) 0.10702152638792266 Attrib TS/TM -0.02805812038754223 Attrib abb/(abb+aaa) -0.23583125924733186 Sigmoid Node 32 Inputs Weights Threshold -0.0894767685492537 Attrib PRI/PHY -0.7381500199809643 Attrib Pri/nC17 0.36886658476923906 Attrib PHY/NC18 -0.10741209823179713 Attrib 17/(17+C27) -0.6817705180677791 Attrib TOTALHEIGHT -0.03215279306903006 Attrib p_ Saturados -0.031087666366791222 Attrib p_ Aromáticos 0.3112831538253024 Attrib p_ NSO -0.09526920911371435 Attrib delC13 0.466033095870215 Attrib API -0.8952069543730894 Attrib Enxofre (p_) 0.38260806472950626 Attrib p_27BBS218 -0.16300712142543677 Attrib p_28BBS218 0.2418256885291296 Attrib p_29BBS218 0.025571953298900406 Attrib p_H31 -0.041769867377584535

263

Attrib p_H32 -0.6917153840453769 Attrib p_H33 -0.4657446680506063 Attrib p_H34 0.5813479737986068 Attrib p_H35 0.6161323487956588 Attrib 19/23TRI -1.0179018087247045 Attrib 20S/(20S+20R) St 0.25173218603420044 Attrib 21/23TRI 0.010896529303832373 Attrib 21+22/STER -0.04737775299246745 Attrib 23/24TRI -0.1263140251526504 Attrib 24/25TRI 0.19548161916673928 Attrib 25NOR/HOPANE -0.09702465393293112 Attrib 26/25TRI -0.259691088996399 Attrib 26/28TRI 0.46409527606287754 Attrib 27/29BBS218 -0.04875080292796405 Attrib 28/29BBS218 0.05441376736012407 Attrib 29/30H -0.2525605097768794 Attrib 30/29BBS218 -0.06997866287167101 Attrib DIA/C27AA -0.2558858730742201 Attrib DIA30/C27AA 0.1396328618671713 Attrib DIAH/H30 0.1008109323398729 Attrib DITERP/H30 0.5064601390037492 Attrib GAM/H30 -0.03707784831091032 Attrib GAM/TR23 -0.7231599420233316 Attrib H28/H29 -0.002283454790931241 Attrib H28/H30 0.025569128016500152 Attrib H28/TR23 -0.5685143607236723 Attrib H29/C29TS 6.330642647021656E-4 Attrib H29/H30 -0.13918889161833733 Attrib H30/C27AA -0.2624441538500764 Attrib H35/H34 0.2839322244035757 Attrib HOP/STER -0.9138458320369914 Attrib NOR25H/H29 0.1689083220170917 Attrib NOR25H/H30 0.029379696666816717 Attrib NORNEO/H29 -0.18385947503552105 Attrib Total Esteranos -0.1522476724361386 Attrib Total Hopanos -0.2093471789087617 Attrib TET24/26TRI -1.0098017963908765 Attrib TET24/H30 0.4355222368175584 Attrib TPP 0.21812407417572566 Attrib TR23/H30 0.515604504270963 Attrib TRIC/HOP 0.4489147765020353 Attrib TRIC/STER -0.07211785332266249 Attrib TS/(TS+TM) -0.2369048886470484 Attrib TS/TM -0.1224447124788969 Attrib abb/(abb+aaa) 0.7234971925842678 Sigmoid Node 33 Inputs Weights Threshold 0.13954009163104655 Attrib PRI/PHY -0.0417644004901091 Attrib Pri/nC17 -0.1703900174009058 Attrib PHY/NC18 0.6790282120981992 Attrib 17/(17+C27) 0.059488936799891125 Attrib TOTALHEIGHT -0.21724353819262293 Attrib p_ Saturados 0.10766144795971563 Attrib p_ Aromáticos -0.49912841385451445 Attrib p_ NSO 0.1778806849750809

264

Attrib delC13 -0.5779470868470936 Attrib API 0.0880128628078542 Attrib Enxofre (p_) 0.09984089044333505 Attrib p_27BBS218 -0.16826678994134542 Attrib p_28BBS218 0.56015603320237 Attrib p_29BBS218 -0.04272153289652999 Attrib p_H31 0.5160973721594397 Attrib p_H32 -0.6518752692814249 Attrib p_H33 -0.5449159202280999 Attrib p_H34 0.015769459606635512 Attrib p_H35 -0.20390912886312548 Attrib 19/23TRI -0.2044739577770353 Attrib 20S/(20S+20R) St -1.437223481569462 Attrib 21/23TRI -0.5111477555499822 Attrib 21+22/STER 0.2019361826616524 Attrib 23/24TRI 0.4137714685606168 Attrib 24/25TRI -0.5348344542081701 Attrib 25NOR/HOPANE -0.11806599017627352 Attrib 26/25TRI 0.28794118599882274 Attrib 26/28TRI -0.6265788473684001 Attrib 27/29BBS218 -0.4326003284329965 Attrib 28/29BBS218 0.21701552989367007 Attrib 29/30H -0.021698099791317933 Attrib 30/29BBS218 0.5959927908867456 Attrib DIA/C27AA -0.7424657138822711 Attrib DIA30/C27AA 0.37227017063546325 Attrib DIAH/H30 -0.8426016755356966 Attrib DITERP/H30 0.38539429271373715 Attrib GAM/H30 -0.02161305498798708 Attrib GAM/TR23 0.8905377002650524 Attrib H28/H29 0.27298595035839196 Attrib H28/H30 0.18454644362822947 Attrib H28/TR23 1.1390371404779123 Attrib H29/C29TS 1.5409708479672706 Attrib H29/H30 0.6955240017429747 Attrib H30/C27AA 0.30856124968415144 Attrib H35/H34 -0.3756035972258166 Attrib HOP/STER 0.9419651223944143 Attrib NOR25H/H29 0.5160184578596982 Attrib NOR25H/H30 0.7290834066663201 Attrib NORNEO/H29 -0.6128302130721502 Attrib Total Esteranos 0.26809643312358084 Attrib Total Hopanos 0.30860198377348386 Attrib TET24/26TRI 0.46421988451585555 Attrib TET24/H30 0.038682368880915814 Attrib TPP 0.4768997613491087 Attrib TR23/H30 0.21015515847204633 Attrib TRIC/HOP 0.4908487711559228 Attrib TRIC/STER 0.8954757455105521 Attrib TS/(TS+TM) -1.00389523713086 Attrib TS/TM -0.4518382348838369 Attrib abb/(abb+aaa) -0.9838340903311271 Sigmoid Node 34 Inputs Weights Threshold -0.1296613642606089 Attrib PRI/PHY 0.23644662911228526

265

Attrib Pri/nC17 0.06055595059318033 Attrib PHY/NC18 0.10179857742452694 Attrib 17/(17+C27) 0.034268477824970625 Attrib TOTALHEIGHT 0.18641588622293487 Attrib p_ Saturados -0.2683362933118815 Attrib p_ Aromáticos 0.5744432497045101 Attrib p_ NSO 0.0964651021607252 Attrib delC13 0.6300607555796371 Attrib API -0.3724249361246688 Attrib Enxofre (p_) 1.0297503038160598 Attrib p_27BBS218 0.5643914768683165 Attrib p_28BBS218 -0.8819815200797496 Attrib p_29BBS218 -0.20691754608467028 Attrib p_H31 -0.5050422254017903 Attrib p_H32 0.4787456566249022 Attrib p_H33 -0.049860441732396614 Attrib p_H34 0.730132429547635 Attrib p_H35 0.1501575329927657 Attrib 19/23TRI 0.5821347050775084 Attrib 20S/(20S+20R) St 1.1263186406575096 Attrib 21/23TRI -0.46005061111232287 Attrib 21+22/STER -0.342346656294698 Attrib 23/24TRI -0.9364228945644107 Attrib 24/25TRI 0.052598998682445774 Attrib 25NOR/HOPANE 0.13444329869050528 Attrib 26/25TRI -0.07277054869910042 Attrib 26/28TRI -0.3862716095590682 Attrib 27/29BBS218 0.595880840487469 Attrib 28/29BBS218 -0.4437404762489123 Attrib 29/30H 0.12231686273348685 Attrib 30/29BBS218 0.01938870337814159 Attrib DIA/C27AA 0.8664386785934391 Attrib DIA30/C27AA -0.3516636303727597 Attrib DIAH/H30 0.41386146072086427 Attrib DITERP/H30 -0.4302802136130259 Attrib GAM/H30 0.041408318179682206 Attrib GAM/TR23 0.10285507254567706 Attrib H28/H29 -0.2707905534048363 Attrib H28/H30 -0.27293914233323874 Attrib H28/TR23 -0.41428917617178423 Attrib H29/C29TS -0.6126980609243444 Attrib H29/H30 -0.44952173262619755 Attrib H30/C27AA -0.24337774795641812 Attrib H35/H34 -0.24110686639019008 Attrib HOP/STER -0.28071644276845037 Attrib NOR25H/H29 0.09768916529205016 Attrib NOR25H/H30 0.03379970831245979 Attrib NORNEO/H29 0.5889382097100808 Attrib Total Esteranos -0.01504545068523898 Attrib Total Hopanos 0.05155148895980299 Attrib TET24/26TRI 0.36893731882508396 Attrib TET24/H30 -0.28645950544308546 Attrib TPP -0.6864418626812206 Attrib TR23/H30 -0.552522012326927 Attrib TRIC/HOP -0.6247298345031581 Attrib TRIC/STER -0.5474951297299223

266

Attrib TS/(TS+TM) 0.8390315092161321 Attrib TS/TM 0.587538270632492 Attrib abb/(abb+aaa) -0.21340688056104282 Sigmoid Node 35 Inputs Weights Threshold 0.05304274434023115 Attrib PRI/PHY -0.027042054364151365 Attrib Pri/nC17 -0.3709620586701915 Attrib PHY/NC18 0.6093162020566639 Attrib 17/(17+C27) 0.08840809939148124 Attrib TOTALHEIGHT -0.1689880646330615 Attrib p_ Saturados 0.19235579295949998 Attrib p_ Aromáticos -0.5609121106117049 Attrib p_ NSO 0.11019096451465397 Attrib delC13 -0.5616954416381892 Attrib API 0.13016834724511842 Attrib Enxofre (p_) 0.051545855379110196 Attrib p_27BBS218 -0.28288412434704907 Attrib p_28BBS218 0.5923693700921278 Attrib p_29BBS218 -0.008331752071337826 Attrib p_H31 0.46936163457729146 Attrib p_H32 -0.6666098016431454 Attrib p_H33 -0.4408114396559665 Attrib p_H34 -0.06956310273915568 Attrib p_H35 -0.2011511152896198 Attrib 19/23TRI -0.038820733960233264 Attrib 20S/(20S+20R) St -1.547349680027724 Attrib 21/23TRI -0.4712500456226954 Attrib 21+22/STER 0.3164614068075751 Attrib 23/24TRI 0.43543097748333554 Attrib 24/25TRI -0.49560303340925393 Attrib 25NOR/HOPANE -0.25550481998350877 Attrib 26/25TRI 0.2777535320504337 Attrib 26/28TRI -0.6905997627076752 Attrib 27/29BBS218 -0.41657493090860814 Attrib 28/29BBS218 0.1955367276864251 Attrib 29/30H -0.07822503951740722 Attrib 30/29BBS218 0.6797988441835385 Attrib DIA/C27AA -0.7111036767778163 Attrib DIA30/C27AA 0.33689598661471015 Attrib DIAH/H30 -0.8636985239098308 Attrib DITERP/H30 0.27423874951810623 Attrib GAM/H30 -0.17437650280323966 Attrib GAM/TR23 0.9033284196650498 Attrib H28/H29 0.18608421699232341 Attrib H28/H30 0.25450959317285327 Attrib H28/TR23 1.044822849413459 Attrib H29/C29TS 1.6360264748007063 Attrib H29/H30 0.7885410752926987 Attrib H30/C27AA 0.3647776711779431 Attrib H35/H34 -0.33743726172856375 Attrib HOP/STER 1.0347751545059223 Attrib NOR25H/H29 0.4457782978321899 Attrib NOR25H/H30 0.7379907082674148 Attrib NORNEO/H29 -0.6296587606732704 Attrib Total Esteranos 0.2186626761653238

267

Attrib Total Hopanos 0.27186580337568816 Attrib TET24/26TRI 0.5825008796851919 Attrib TET24/H30 0.09744031597695325 Attrib TPP 0.47852471447668543 Attrib TR23/H30 0.11754868927622449 Attrib TRIC/HOP 0.42608642695858306 Attrib TRIC/STER 0.9172701186178588 Attrib TS/(TS+TM) -1.111073598328804 Attrib TS/TM -0.4203402537114095 Attrib abb/(abb+aaa) -0.8798870887171455 Sigmoid Node 36 Inputs Weights Threshold -0.05127619705271227 Attrib PRI/PHY -0.26688653354745784 Attrib Pri/nC17 -0.3060398513628642 Attrib PHY/NC18 0.1313768981588515 Attrib 17/(17+C27) 0.03339268497579411 Attrib TOTALHEIGHT -0.10421273488102313 Attrib p_ Saturados 0.17824909553018098 Attrib p_ Aromáticos -0.1671100355159053 Attrib p_ NSO -0.061172929713843846 Attrib delC13 0.012545518064420051 Attrib API 0.07455419108538293 Attrib Enxofre (p_) 0.24834832720604025 Attrib p_27BBS218 -0.1985419836659246 Attrib p_28BBS218 0.3123639340772536 Attrib p_29BBS218 0.07866564351644308 Attrib p_H31 0.13390372906965517 Attrib p_H32 -0.38578463061558005 Attrib p_H33 -0.13267874121901108 Attrib p_H34 0.010572872822128866 Attrib p_H35 0.11407096817247026 Attrib 19/23TRI 0.032623197522870344 Attrib 20S/(20S+20R) St -0.5609085739749712 Attrib 21/23TRI -0.08854913730983462 Attrib 21+22/STER 0.09058112551532214 Attrib 23/24TRI 0.12019676032295602 Attrib 24/25TRI -0.08002193723826609 Attrib 25NOR/HOPANE -0.4563779105572292 Attrib 26/25TRI 0.07592793943598286 Attrib 26/28TRI -0.24680096207024135 Attrib 27/29BBS218 -0.319900076929685 Attrib 28/29BBS218 0.08142977923586309 Attrib 29/30H -0.07915289620021095 Attrib 30/29BBS218 0.3476705952129586 Attrib DIA/C27AA -0.31673329103124814 Attrib DIA30/C27AA -0.06386545371009317 Attrib DIAH/H30 -0.3025290777412607 Attrib DITERP/H30 -0.013819532699032598 Attrib GAM/H30 -0.2800818612128723 Attrib GAM/TR23 0.16354713191799014 Attrib H28/H29 -0.040068705977464605 Attrib H28/H30 -0.06740777244736403 Attrib H28/TR23 0.2967878132421225 Attrib H29/C29TS 0.7936681138258894 Attrib H29/H30 0.297128748172735

268

Attrib H30/C27AA 0.06537681781950687 Attrib H35/H34 0.017650443212010272 Attrib HOP/STER 0.2510771034633891 Attrib NOR25H/H29 -0.03748961239110501 Attrib NOR25H/H30 0.056770785718886704 Attrib NORNEO/H29 -0.30275097181996463 Attrib Total Esteranos 0.048855620807832144 Attrib Total Hopanos 0.15462855372269188 Attrib TET24/26TRI 0.21473467561604737 Attrib TET24/H30 0.17529959867501582 Attrib TPP -0.03968346143679144 Attrib TR23/H30 -0.06463511645509085 Attrib TRIC/HOP -0.022428937547210342 Attrib TRIC/STER 0.2118022810894232 Attrib TS/(TS+TM) -0.48298730361174586 Attrib TS/TM -0.0661575053592317 Attrib abb/(abb+aaa) -0.14425089844184563 Class LAC_SIL_A Input Node 0 Class LAC_SIL_B Input Node 1 Class LAC_A Input Node 2 Class LAC_B Input Node 3 Class MIST_T_CAR Input Node 4 Class MIST_T_ARB Input Node 5 Class MAR_EVP Input Node 6 Time taken to build model: 70.88 seconds === Evaluation on test split === === Summary === Correctly Classified Instances 34 94.4444 % Incorrectly Classified Instances 2 5.5556 % Kappa statistic 0.9335 Mean absolute error 0.0198 Root mean squared error 0.1182 Relative absolute error 8.2769 % Root relative squared error 33.8499 % Total Number of Instances 36

269

=== Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class 1 0.033 0.857 1 0.923 LAC_SIL_A 0 0 0 0 0 LAC_SIL_B 1 0 1 1 1 LAC_A 1 0.031 0.8 1 0.889 LAC_B 1 0 1 1 1 MIST_T_CAR 1 0 1 1 1 MIST_T_ARB 1 0 1 1 1 MAR_EVP === Confusion Matrix === a b c d e f g <-- classified as 6 0 0 0 0 0 0 | a = LAC_SIL_A 1 0 0 1 0 0 0 | b = LAC_SIL_B 0 0 6 0 0 0 0 | c = LAC_A 0 0 0 4 0 0 0 | d = LAC_B 0 0 0 0 6 0 0 | e = MIST_T_CAR 0 0 0 0 0 8 0 | f = MIST_T_ARB 0 0 0 0 0 0 4 | g = MAR_EVP === Re-evaluation on test set === User supplied test set Relation: Dados sel teste-weka.filters.unsupervised.attribute.Remove-R1-10,16,37,45,60 Instances: 21 Attributes: 61 === Summary === Correctly Classified Instances 19 90.4762 % Incorrectly Classified Instances 2 9.5238 % Kappa statistic 0.8889 Mean absolute error 0.0306 Root mean squared error 0.142 Total Number of Instances 21 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class 1 0 1 1 1 LAC_SIL_A 0.667 0.056 0.667 0.667 0.667 LAC_SIL_B 1 0 1 1 1 LAC_A 0.667 0.056 0.667 0.667 0.667 LAC_B 1 0 1 1 1 MIST_T_CAR 1 0 1 1 1 MIST_T_ARB 1 0 1 1 1 MAR_EVP

270

=== Confusion Matrix === a b c d e f g <-- classified as 3 0 0 0 0 0 0 | a = LAC_SIL_A 0 2 0 1 0 0 0 | b = LAC_SIL_B 0 0 3 0 0 0 0 | c = LAC_A 0 1 0 2 0 0 0 | d = LAC_B 0 0 0 0 3 0 0 | e = MIST_T_CAR 0 0 0 0 0 3 0 | f = MIST_T_ARB 0 0 0 0 0 0 3 | g = MAR_EVP

271

ANEXO V

Relatório-padrão completo do software WEKA com os resultados da classificação por Redes Neurais Artificiais para o conjunto com 25 variáveis

=== Run information === Scheme: weka.classifiers.functions.MultilayerPerceptron -L 0.6 -M 0.6 -N 500 -V 0 -S 0 -E 20 -H 6 -B Relation: Dados sel var erica visual 179 Instances: 179 Attributes: 26 PRI/PHY PHY/NC18 p_ NSO delC13 19/23TRI 20S/(20S+20R) St 21/23TRI 24/25TRI 26/25TRI 27/29BBS218 DIA30/C27AA DITERP/H30 GAM/H30 H28/H29 H28/H30 H28/TR23 H29/C29TS H29/H30 HOP/STER TET24/26TRI TPP TR23/H30 TRIC/HOP TS/(TS+TM) abb/(abb+aaa) Classe Test mode: split 80% train, remainder test === Classifier model (full training set) === Sigmoid Node 0 Inputs Weights Threshold -0.049752525790958964 Node 7 -0.8424114144775107 Node 8 5.18649905689059 Node 9 -9.32425982786762 Node 10 -3.049290078562609 Node 11 -1.1702915665279914 Node 12 -5.324758790749755 Sigmoid Node 1 Inputs Weights Threshold -11.565000507635098

272

Node 7 -2.575863563137251 Node 8 7.16032165780363 Node 9 6.956244951152518 Node 10 -0.886684138183685 Node 11 -1.5099437593082483 Node 12 -7.477573772190344 Sigmoid Node 2 Inputs Weights Threshold -3.818660184675406 Node 7 -3.801416524458505 Node 8 -1.8264093921758489 Node 9 -4.191833869556042 Node 10 8.20976299104109 Node 11 -5.2437199747569565 Node 12 5.1070913035992165 Sigmoid Node 3 Inputs Weights Threshold -6.257169234796776 Node 7 -1.228103412778129 Node 8 1.0382012197244657 Node 9 1.0445825166391394 Node 10 -10.66444451418534 Node 11 -1.7570449242972446 Node 12 10.099129194939659 Sigmoid Node 4 Inputs Weights Threshold -6.467253696626296 Node 7 1.7059566762419947 Node 8 -2.6887957585330913 Node 9 1.2937583117942424 Node 10 -9.029957775691953 Node 11 8.825865476347152 Node 12 -1.995664351160344 Sigmoid Node 5 Inputs Weights Threshold 1.562821615612675 Node 7 -4.168398500502434 Node 8 -9.579162067705258 Node 9 3.863158881101844 Node 10 -2.6325822206418046 Node 11 -7.134612482130173 Node 12 -5.042450691615515 Sigmoid Node 6 Inputs Weights Threshold -4.361129887013478 Node 7 3.687699533030704 Node 8 -2.6228991383852787 Node 9 -6.923934808046346 Node 10 4.528439636298259 Node 11 1.769065360420865 Node 12 -3.6263182172654584 Sigmoid Node 7 Inputs Weights Threshold -0.21689957514213054 Attrib PRI/PHY -0.0283315760002158 Attrib PHY/NC18 0.7041825219555058

273

Attrib p_ NSO 1.1630610399335397 Attrib delC13 0.011338006005646177 Attrib 19/23TRI 0.9363338941226528 Attrib 20S/(20S+20R) St -0.11095133519801523 Attrib 21/23TRI -0.9748970998640477 Attrib 24/25TRI -1.598198536024068 Attrib 26/25TRI -0.788876955072066 Attrib 27/29BBS218 1.64366106467493 Attrib DIA30/C27AA 0.026330836034092767 Attrib DITERP/H30 -0.06339670660635723 Attrib GAM/H30 2.099747413753721 Attrib H28/H29 -0.06983599175807603 Attrib H28/H30 -0.06823726913515196 Attrib H28/TR23 0.36639200209216916 Attrib H29/C29TS -0.5302004752005612 Attrib H29/H30 0.28149790235888733 Attrib HOP/STER 0.2514448149495759 Attrib TET24/26TRI 1.254890853297484 Attrib TPP -0.16520560518393643 Attrib TR23/H30 -0.37434016483177995 Attrib TRIC/HOP 0.014820132573752146 Attrib TS/(TS+TM) 0.5694989895523146 Attrib abb/(abb+aaa) 0.3485482858867941 Sigmoid Node 8 Inputs Weights Threshold 0.16592157641760935 Attrib PRI/PHY 1.5253409177600603 Attrib PHY/NC18 0.6316483079827226 Attrib p_ NSO 0.7262201297477249 Attrib delC13 -2.1772184292737378 Attrib 19/23TRI 1.1810655963892756 Attrib 20S/(20S+20R) St 3.5004997745867055 Attrib 21/23TRI 1.8664566574414516 Attrib 24/25TRI 0.7808384564676939 Attrib 26/25TRI 0.5216614770533609 Attrib 27/29BBS218 -0.12388325829623684 Attrib DIA30/C27AA -1.6858739456350742 Attrib DITERP/H30 0.743397954941699 Attrib GAM/H30 -1.7347185822989117 Attrib H28/H29 0.7789157290322641 Attrib H28/H30 0.8350527942693093 Attrib H28/TR23 -0.5085799217431365 Attrib H29/C29TS -2.7908180904013835 Attrib H29/H30 -0.9751076486353714 Attrib HOP/STER 1.1880303047657337 Attrib TET24/26TRI -0.19140725622383173 Attrib TPP 1.308635618436827 Attrib TR23/H30 -0.3177958153510346 Attrib TRIC/HOP 0.2088709329451812 Attrib TS/(TS+TM) 2.177665642757916 Attrib abb/(abb+aaa) -1.7776594239064738 Sigmoid Node 9 Inputs Weights Threshold -2.614203183525373 Attrib PRI/PHY -2.4127031928259433 Attrib PHY/NC18 -0.6806180630085785

274

Attrib p_ NSO 3.164211202804544 Attrib delC13 0.997082459669615 Attrib 19/23TRI -6.676862604115012 Attrib 20S/(20S+20R) St 3.3678992670290007 Attrib 21/23TRI 2.163431858465823 Attrib 24/25TRI 1.0453832282057187 Attrib 26/25TRI -2.9955312269334295 Attrib 27/29BBS218 0.9831389834350098 Attrib DIA30/C27AA 1.2801025459801125 Attrib DITERP/H30 1.2503858291905945 Attrib GAM/H30 2.61695813899969 Attrib H28/H29 1.3834193039066531 Attrib H28/H30 1.364372370410249 Attrib H28/TR23 -1.775154449323443 Attrib H29/C29TS -3.750379503685798 Attrib H29/H30 -2.341296236524157 Attrib HOP/STER -4.012562787690464 Attrib TET24/26TRI -4.815098297307348 Attrib TPP 0.2699166463826922 Attrib TR23/H30 0.7793588509569481 Attrib TRIC/HOP -0.25001936662279073 Attrib TS/(TS+TM) -0.5266484350909527 Attrib abb/(abb+aaa) 2.9443314948233015 Sigmoid Node 10 Inputs Weights Threshold 0.03283422127626954 Attrib PRI/PHY 0.6271220353444203 Attrib PHY/NC18 0.757621420765089 Attrib p_ NSO -2.5652775669529824 Attrib delC13 -1.5336800083884674 Attrib 19/23TRI 0.010399143361265146 Attrib 20S/(20S+20R) St -6.452716627775394 Attrib 21/23TRI -2.8604770389996315 Attrib 24/25TRI -1.9056890698004665 Attrib 26/25TRI 1.665005787389313 Attrib 27/29BBS218 0.4349928002223028 Attrib DIA30/C27AA 1.657549724457745 Attrib DITERP/H30 0.658131693649395 Attrib GAM/H30 1.0998828446217623 Attrib H28/H29 0.4980941683290848 Attrib H28/H30 0.5318238324165581 Attrib H28/TR23 1.5669931603013771 Attrib H29/C29TS 6.839018367541382 Attrib H29/H30 0.7055232047330999 Attrib HOP/STER 3.887914336348324 Attrib TET24/26TRI 2.4180819398030544 Attrib TPP 1.36100830582192 Attrib TR23/H30 1.2349295573653267 Attrib TRIC/HOP 2.3041582730691466 Attrib TS/(TS+TM) -4.06084288634596 Attrib abb/(abb+aaa) -4.394213540940383 Sigmoid Node 11 Inputs Weights Threshold -1.3107380072766697 Attrib PRI/PHY -0.28059008177775474 Attrib PHY/NC18 2.6299036324084426

275

Attrib p_ NSO 2.9039354836348585 Attrib delC13 0.5286009956546944 Attrib 19/23TRI 1.1753145349664162 Attrib 20S/(20S+20R) St -0.46885468292634264 Attrib 21/23TRI -1.3733696861789981 Attrib 24/25TRI -3.6734301082677887 Attrib 26/25TRI -2.24653936816302 Attrib 27/29BBS218 3.638531072481811 Attrib DIA30/C27AA 0.8806190687412496 Attrib DITERP/H30 -0.5362289380165132 Attrib GAM/H30 5.137792425853093 Attrib H28/H29 -0.6849384278635491 Attrib H28/H30 -0.736036481970668 Attrib H28/TR23 -0.8296884148756778 Attrib H29/C29TS -0.2471060432561547 Attrib H29/H30 1.5554591723594509 Attrib HOP/STER 0.6695345646527545 Attrib TET24/26TRI 2.8286662399859397 Attrib TPP -0.8848077631078594 Attrib TR23/H30 -0.7157984002351455 Attrib TRIC/HOP -0.29578557347050627 Attrib TS/(TS+TM) -0.15617514844869324 Attrib abb/(abb+aaa) -0.06260721786285962 Sigmoid Node 12 Inputs Weights Threshold -0.6227125605589352 Attrib PRI/PHY 4.187421423332748 Attrib PHY/NC18 0.8362927447900399 Attrib p_ NSO 1.677950967965408 Attrib delC13 -5.408641451983809 Attrib 19/23TRI -0.4350178011967723 Attrib 20S/(20S+20R) St -10.994558872174686 Attrib 21/23TRI -0.6679285667152854 Attrib 24/25TRI -3.3954885487813025 Attrib 26/25TRI 5.822207988291832 Attrib 27/29BBS218 -1.5997081582024189 Attrib DIA30/C27AA 7.300866360735356 Attrib DITERP/H30 -1.9929490971816806 Attrib GAM/H30 -3.0562899315246868 Attrib H28/H29 -0.6363199607651325 Attrib H28/H30 -0.6380320946874453 Attrib H28/TR23 2.6231606243358296 Attrib H29/C29TS 7.2892856287373755 Attrib H29/H30 1.5960480496575298 Attrib HOP/STER 5.56575425625323 Attrib TET24/26TRI 0.7185451563666083 Attrib TPP 4.049768611452137 Attrib TR23/H30 2.9013170604592218 Attrib TRIC/HOP 0.4702552501319078 Attrib TS/(TS+TM) -1.4730373406579722 Attrib abb/(abb+aaa) 0.1270543950477507 Class LAC_SIL_A Input Node 0 Class LAC_SIL_B Input

276

Node 1 Class LAC_A Input Node 2 Class LAC_B Input Node 3 Class MIST_T_CAR Input Node 4 Class MIST_T_ARB Input Node 5 Class MAR_EVP Input Node 6 Time taken to build model: 8.68 seconds === Evaluation on test split === === Summary === Correctly Classified Instances 34 94.4444 % Incorrectly Classified Instances 2 5.5556 % Kappa statistic 0.9345 Mean absolute error 0.0207 Root mean squared error 0.1223 Relative absolute error 8.5525 % Root relative squared error 34.6088 % Total Number of Instances 36 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class 0.833 0 1 0.833 0.909 LAC_SIL_A 0.5 0.029 0.5 0.5 0.5 LAC_SIL_B 1 0 1 1 1 LAC_A 1 0.032 0.833 1 0.909 LAC_B 1 0 1 1 1 MIST_T_CAR 1 0 1 1 1 MIST_T_ARB 1 0 1 1 1 MAR_EVP === Confusion Matrix === a b c d e f g <-- classified as 5 1 0 0 0 0 0 | a = LAC_SIL_A 0 1 0 1 0 0 0 | b = LAC_SIL_B 0 0 6 0 0 0 0 | c = LAC_A 0 0 0 5 0 0 0 | d = LAC_B 0 0 0 0 5 0 0 | e = MIST_T_CAR 0 0 0 0 0 6 0 | f = MIST_T_ARB 0 0 0 0 0 0 6 | g = MAR_EVP

277

=== Re-evaluation on test set === User supplied test set Relation: Dados sel var erica visual 21 Instances: 21 Attributes: 26 === Summary === Correctly Classified Instances 21 100 % Incorrectly Classified Instances 0 0 % Kappa statistic 1 Mean absolute error 0.0109 Root mean squared error 0.0355 Total Number of Instances 21 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure Class 1 0 1 1 1 LAC_SIL_A 1 0 1 1 1 LAC_SIL_B 1 0 1 1 1 LAC_A 1 0 1 1 1 LAC_B 1 0 1 1 1 MIST_T_CAR 1 0 1 1 1 MIST_T_ARB 1 0 1 1 1 MAR_EVP === Confusion Matrix === a b c d e f g <-- classified as 3 0 0 0 0 0 0 | a = LAC_SIL_A 0 3 0 0 0 0 0 | b = LAC_SIL_B 0 0 3 0 0 0 0 | c = LAC_A 0 0 0 3 0 0 0 | d = LAC_B 0 0 0 0 3 0 0 | e = MIST_T_CAR 0 0 0 0 0 3 0 | f = MIST_T_ARB 0 0 0 0 0 0 3 | g = MAR_EVP

Folha de rosto - coc.ufrj.br

Documents