Top Banner
© 2009, Pentaho. All Rights Reserved. Pentaho Data Integration Pedro José
25

Pentaho data integration

Jun 19, 2015

Download

Documents

Pedro Neto

Palestra realizada na Universidade Tiradentes.
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Pentaho Data Integration

Pedro José

Page 2: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Quem sou

Pedro José

Técnico em desenvolvimento de sistemas

Graduando em ciências da computação

Sócio da empresa Moobi

Programador do Tribunal de Justiça

Page 3: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Roteiro

O que é ETL?

Algumas ferramentas para ETL

Por que usar o pentaho?

Um pouco mais sobre o pentaho

Desmistificando o pentaho data integration

Interface gráfica

Demonstração

Problemas?

Page 4: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

O que é ETL?

“Extração, transformação e carga(ETL), é o núcleo do processo de

integração de dados. É tipicamente associado com data warehousing.”

Page 5: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Ferramentas de ETL

Integration services(Microsoft)

Talend

Oracle warehouse builder

DataStage (IBM)

Pentaho Data Integration

Programador/DBA

Page 6: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Por que usar o PDI?

Alternativa livre

Multiplataforma

Pequena curva de aprendizado

Extensível

Integrada com diversas outras ferramentas do mercado

Access

Excel

LDAP

SAP

Salesforce

Json, Yaml, RSS, etc...

Page 7: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Por que comecei a usar o PDI?

Treinamento

Suíte Pentaho

Dores de cabeça de todo programador

Migração entre servidores

Migração entre diferentes versões de sistema

Rotinas de carga em bases de dados

Page 8: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Um pouco mais sobre o PDI

Inicialmente chamado de Kettle(Kettle Tranformation Transportation

Loading Environment)

Criada em 2001 a partir da frustação com outras ferramentas de ETL,

com foco na facilidade de utilização e na facilidade de manutenção

Em 2005 tornou-se open source ganhando colaboradores

Adquirida pela Pentaho em 2006

“Boom” em 2007. Adição de novos recursos, suporte a processamento

paralelo e diversos outros recursos para programadores

Page 9: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Componentes do PDI

Spoon – interface gráfica para criação de tranformations e jobs

Pan – ferramenta de linha de comando para execução de

tranformations

Kitchen – ferramenta de linha de comando para execução de jobs

Carte – servidor web para execução remota de tranformations e jobs

Page 10: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Instalação

Instale o Java Runtime Environment(JRE) versão 5.0 ou superior

http://www.java.com/pt_BR/download/

Faça o download da versão comunitária do PDI

http://sourceforge.net/projects/pentaho/files/Data%20Integration/

Descompacte o arquivo do PDI

Execute o Spoon

caso windows => spoon.bat

caso linux => spoon.sh

OBS: Alguns bancos de dados não possuem seus respectivos drivers no

pacote básico. Caso queria adicionar um driver que esteja faltando ou

substituir um existente, acesse a pasta “libext\JDBC”

Page 11: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Conceitos básicos

Tranformations - Sequência lógica de passos para realizar alguma

tranformação.

Page 12: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Conceitos básicos

Jobs - Forma de chamar e controlar a execução de uma sequência de

tranformations. Geralmente, jobs são agendados e executados em lote

de forma automática.

Page 13: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Conceitos básicos

Repositórios

Local onde as informações sobre as tranformations/jobs ficarão armazenadas.

Steps

Corresponde a um passo de uma determinada transformação. Este passo poderá ser a criação, leitura, escrita ou manipulação de alguma informação. Uma transformation é composta de um ou mais steps.

Page 14: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Tipos de step (Tranformation)

Input – entrada de dados

Output – saída de dados

Tranform – transformações nos

dados

Flow – fluxo da informações

Utility – utilitários

Scripting – execução de scripts

Lookup – consulta de dados

Joins – junções entre fontes

Validation – validação

Data warehouse – armazém de

dados

Page 15: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - INPUT

Input

Access input

CSV input

Excel input

Generate random values

Generate rows

Json input

LDAP input

RSS input

Table input

Page 16: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - OUTPUT

Output

Access output

Delete

Excel output

Json output

LDAP output

RSS output

Table output

SQL output

XML output

Page 17: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - TRANSFORM

•Tranform

Add constants

Replace in string

Unique rows

Value mapper

Split fields

Add sequence

Strings cut

Calculator

Page 18: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - UTILITY

Utility

Change file encoding

Run SSH commands

Write to log

Execute a process

Send message to syslog

Mail

Page 19: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - FLOW

Flow

Blocking step

Filter rows

Abort

Dummy (do nothing)

Java filter

Switch / case

Page 20: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - SCRIPTING

Scripting

Execute SQL script

Execute row SQL script

Modified Java script value

Regex Evaluation

User defined Java class

Page 21: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Steps básicos (Tranformation) - LOOKUP

Lookup

Web services lookup

Check if ws is available

Call DB procedure

Database join

Database lookup

Table exists

File exists

HTTP Post

Page 22: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Interface gráfica / Demonstrações

Page 23: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Links e livros

Site da comunidade [ http://kettle.pentaho.org/ ]

Fórum [ http://forums.pentaho.org/forumdisplay.php?f=69 ]

Mais informação [ http://pentahobrasil.blogspot.com ]

Mais informação [ http://blog.professorcoruja.com/ ]

Page 24: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Problemas?

Page 25: Pentaho data integration

© 2009, Pentaho. All Rights Reserved.

Dúvidas

Pedro José <[email protected]>