Top Banner
9 Octobre 2009 Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique
10

Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

Jan 01, 2016

Download

Documents

Jerry Calhoun

Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique. Plan. Intégration de données Définition Pourquoi ? Les outils . L’ETL TOS : Qu’est-ce ? Pourquoi ? Travaux dirigés Découverte. Intégration de données. Définition - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Intégration de données / ETL

(Talend Open Studio)

Séminaire CATI Ecoinformatique

Page 2: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

• Intégration de donnéesIntégration de données – DéfinitionDéfinition

– Pourquoi ?Pourquoi ?

– Les outilsLes outils..

• L’ETL TOS :L’ETL TOS :– Qu’est-ce ?Qu’est-ce ?

– Pourquoi ?Pourquoi ?• Travaux dirigésTravaux dirigés

– DécouverteDécouverte

Plan

Page 3: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Intégration de donnéesIntégration de données

• Définition Définition – Ensemble des processus par lesquels les données Ensemble des processus par lesquels les données

provenant de différentes parties du système provenant de différentes parties du système d'information sont déplacées, combinées et d'information sont déplacées, combinées et consolidées.consolidées.

– Ces processus consistent habituellement à extraire des données de différentes sources (bases de données, fichiers, applications, Services Web, emails, etc.), à leur appliquer des transformations (jointures, lookups, déduplication, calculs, etc.), et à envoyer les données résultantes vers les systèmes cibles

Page 4: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Intégration de donnéesIntégration de données

• Pourquoi ?Pourquoi ?– Synchronisation de différents SI :Synchronisation de différents SI :

• Alimentation de bases par des fichiers à platAlimentation de bases par des fichiers à plat

• Alimentation d’entrepôts de données.Alimentation d’entrepôts de données.

• Systèmes répliqués.Systèmes répliqués.

– Migration de S.IMigration de S.I

Page 5: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Intégration de donnéesIntégration de données

• Outils Outils – Développement spécifiques (moulinettes) Développement spécifiques (moulinettes)

• Difficulté de maintenance.Difficulté de maintenance.

• Manque de cohérence.Manque de cohérence.

• Peu de documentation.Peu de documentation.

– Outils dédiés (ETL : Extract – Transform – Load)Outils dédiés (ETL : Extract – Transform – Load)• Facilité de maintenance.Facilité de maintenance.

• Meilleure productivité.Meilleure productivité.

Page 6: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

ETL TOSETL TOS

Qu’est-ce que c’est ?Qu’est-ce que c’est ?– Atelier de développement :Atelier de développement :

• Une interface graphiqueUne interface graphique

• Des composants spécialisés (plusieurs centaines) prêt à l’emploi.Des composants spécialisés (plusieurs centaines) prêt à l’emploi.

• Facilité de documentationFacilité de documentation

– Générateur de programme (Java et Perl)Générateur de programme (Java et Perl)

– Basé sur Eclipse :Basé sur Eclipse :• MultiplateformeMultiplateforme

Page 7: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

ETL TOSETL TOS

Pourquoi ?Pourquoi ?– Solution libre dans la version de base :Solution libre dans la version de base :

– Communauté grandissante.Communauté grandissante.

– Une démarche non isolée (URGI – ISIE – DSI …)Une démarche non isolée (URGI – ISIE – DSI …)

– Un outil accessible même aux non informaticiensUn outil accessible même aux non informaticiens

Page 8: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Travaux dirigésTravaux dirigés

TD1 : Alimentation fichier CSVTD1 : Alimentation fichier CSV– Création d’un JobCréation d’un Job

– Création d’un schéma (métadonnées)Création d’un schéma (métadonnées)

– Création / Liaison / Configuration de composantsCréation / Liaison / Configuration de composants

– Exécution du jobExécution du job

– Génération du programme indépendantGénération du programme indépendant

– Génération de la documentationGénération de la documentation

Page 9: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Travaux dirigésTravaux dirigés

TD1 : ScénarioTD1 : Scénario

Tableau enrichi

Page 10: Intégration de données / ETL (Talend Open Studio) Séminaire CATI Ecoinformatique

9 Octobre 2009

Fin

Merci de votre attention

• Intégration de données Intégration de données – DéfinitionDéfinition– Pourquoi ?Pourquoi ?– Les outils.Les outils.

• L’ETL TOS :L’ETL TOS :– Qu’est-ce ?Qu’est-ce ?– Pourquoi ?Pourquoi ?

• Travaux dirigésTravaux dirigés– DécouverteDécouverte