PMML (Predictive Model Markup Language) Nicolas DULIAN [email protected]KXEN-Confidential Agenda ! Présentation de PMML (Predictive Model Markup Language ! Le contenu du standard PMML ! L’architecture des modèles PMML ! Exemple/Pratique: _ Outils datamining utilisant le PMML _ Applications datamining…
9
Embed
PrÇsentation PMML fr - lipn.univ-paris13.frlipn.univ-paris13.fr/~bennani/tmpc/Presentation_PMML_fr.pdf · PMML (Predictive Model Markup Language) Nicolas DULIAN [email protected]
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
! Présentation de PMML (Predictive Model Markup Language! Le contenu du standard PMML! L’architecture des modèles PMML! Exemple/Pratique:
_ Outils datamining utilisant le PMML_ Applications datamining…
KXEN-Confidential
PMML: le projet
! Qui?_ Consortium
! Pour Qui?_ Cible
! Quand?_ Dates clefs
! Pourquoi?_ Motivations/Objectifs
! Quoi?_ Définition XML pour le transport de modèle
! Ou?_ Site principal http://www.dmg.org_ Forum publique http://sourceforge.net/forum/?group_id=56177_ Project http://sourceforge.net/projects/pmml
KXEN-Confidential
Cible
! Architecte_ Chez un vendeur de logiciel métier (CRM, SCM, …), il peut intégrer des
fonctions de scoring/prévision par importation des modèles_ Chez un vendeur d’outil d’analyse de données, il peut exporter des
modèles destinés à être intégrer dans des environnements de scoring_ Dans une communauté ‘open-source’, il peut implémenter une version
gratuite et/mais standard de l’analyse de données
! Étudiant_ Connaissance des standards du marché et de leurs fournisseurs
KXEN-Confidential
Consortium
! Membres principaux (PMML 3.0)_ IBM_ KXEN_ Microsoft_ MicroStrategy Inc._ National Center of Data Mining_ Open Data_ Oracle Corporation_ PrudSys AG_ Salford Systems_ Sas Inc._ SPSS_ StatSoft
! Membres associés_ NCR_ SAP_ …
KXEN-Confidential
Dates clefs
! Novembre 1998_ Première présentation (Supercomputing 1998)_ PMML 0.9_ Implémentation de référence
! Aout 1999_ Création d’un consortium_ PMML 1.0 (KDD-1999)
! 2000_ Oracle, IBM et Microsoft rejoigne le consortium_ Généralisation de PMML (statistiques et data mining)_ PMML 1.1
! 2001_ PMML 2.0_ Amélioration de PMML pour le data mining
" Transformations" Agrégations
! 2002_ KXEN rejoint le consortium
! 2004_ PMML 3.0
! 2005_ PMML 3.1
KXEN-Confidential
Motivations/Objectifs
! Complémentarité_ Respecte les autres normes (JDM, SQL-MM, CWM)
! Uniformité_ Création d’un standard_ Homogénéisation des concepts_ Format d’échange (XML)
! Intégration_ Format standard (XML)_ Schéma de référence
KXEN-Confidential
PMML transporte des modèles issusd’algorithmes
! PMML 2.1:_ Régression lineaire/logistique_ Clustering KMeans_ Règles d’association_ Réseaux de neuronnes_ Arbre de décision_ Séquence
! PMML 3.0:_ + SVM et Text mining
KXEN-Confidential
Architecture d’un modèle PMML
! Définition des dictionnaires:_ Nom_ Type_ Valeur
! Déclaration des transformations_ Encodage des variables
! Modèles_ Decision tree_ Naive Bayes_ Support Vector Machine_ …
KXEN-Confidential
Définition des dictionnaires
! Variable d’entrée_ Nom de la variable_ Type de variable
" Categorical
" Ordinal
" Continuous
_ Type de données" Number
" String
_ Valeurs de la variable" Liste des catégories possibles
" Liste des valeurs manquantes
" Intervalle de la variable
KXEN-Confidential
Définition des transformations
! Encodage de la Variable d’entrée_ Association d’une valeur numérique à une entrée
" Transformation linéaire
" Association d’une valeur à une catégorie
" Agrégation
KXEN-Confidential
Définition des modèles
! Choix du modèle_ Définition des variables utilisées
" Rôle
" Définition des comportements (outlier, traitement des valeurs manquantes)
" Définition de l’intervalle de validité
_ Définition des cibles_ Définition des statistiques_ Définition des transformations locales
" Propre à chaque type de modèle
_ Définition du calcul
KXEN-Confidential
Outils utilisant le PMML
! 2 catégories d’outils pour le PMML_ Outils générant du PMML
" Modélisation en PMML– KXEN
– …
_ Outils intégrant du PMML" Exécution et simulation de fichier PMML