Apprentissage automatique pour l'extraction de réseaux de régulation géniques à partir d'articles DigiCosme ‐ Groupe de travail D2K Dialekti VALSAMOU ‐ 8 juin 2015 0
Apprentissage automatique pourl'extraction de réseaux de régulation
géniques à partir d'articlesDigiCosme ‐ Groupe de travail D2K
Dialekti VALSAMOU ‐ 8 juin 2015
0
Plan de la présentation1. Du texte aux connaissances
Un cas typique d'IE : du texte à l'ontologie2. Le cas d'IE pour l'extraction d'un réseau, exemples de la vraievieChallenge BioNLP '13, ma thèse, ...
3. Approfondir en IEUn système complet : du 0 au réseau (ou presque)Apprentissage pour l'extraction de relations
Du texte aux connaissancesUn exemple sur les bacteries
Du texte aux connaissancesUn exemple sur les bacteries
Du texte aux connaissancesUn exemple sur les bacteries
IE pour l'extraction d'un réseauChallenge BioNLP '13 : Tâche GRN, extraction d'un réseau
de régulation génique
IE pour l'extraction d'un réseauChallenge BioNLP '13 : Tâche GRN, extraction d'un réseau
de régulation génique
IE pour l'extraction d'un réseauChallenge BioNLP '13 : Tâche PC, Pathway curation
Réseau de régulation ailleurs :
IE pour l'extraction d'un réseauArabidopsis thaliana
Gene regulatory network for secondary cell wall biosynthesis in Arabidopsis root xylem. (Interactions)
IE pour l'extraction d'un réseauArabidopsis thaliana
Modèle de connaissance pour le réseau de régulation de la phasede développement de la graine
Un cycle complet d' IEComposantes
Un cycle complet d'IEArchitecture de la suite Alvis
Un cycle complet d'IEEditeur en ligne d'annotations
Un cycle complet d'IESchéma et Modèle A.thaliana
Modèle de connaissance pour le réseau de régulation de la phasede développement de la graine
Un cycle complet d'IEApprentissage Automatique
1. Traitement linguistique :lemmmatisation,segmentation,POS tagginganalyse syntactique,...
2. Extraction d'Entités Nommées3. Résolution d'anaphores et coréférences4. Extraction de relations (binaire) et événements (n‐naire)
Un cycle complet d'IEApprentissage Automatique
1. Traitement linguistique2. Extraction d'Entités Nommées :
terminologies (source ou résultat),ontologies, (source, alignement..)règles,apprentissage, ...
3. Résolution d'anaphores et coréférences4. Extraction de relations (binaire) et événements (n‐naire)
Un cycle complet d'IEApprentissage Automatique
1. Traitement linguistique2. Extraction d'Entités Nommées3. Résolution d'anaphores et coréférences :
systèmes de règles4. Extraction de relations (binaire) et événements (n‐naire)
Un cycle complet d'IEApprentissage Automatique
1. Traitement linguistique2. Extraction d'Entités Nommées3. Résolution d'anaphores et coréférences4. Extraction de relations (binaire) et événements (n-naire) :
rel. binaires : entre deux arguments (entités)événements : relations plus complèxes
approches à features ou à noyau (fonctions de similarité)plusieurs type d'informations exploitéespre‐traitement des données : syntaxe, surface, ..sources et outils externes (semantique distributionnelle)
Un cycle complet d'IEExtraction de Relations par AlvisRE
Approche à noyau, basée sur informations syntaxiques etsémantiques1. Preparation de la représentation
Calcul de co‐occurrencesChemin entre arguments sur le graphe de dépencencessyntaxiques
2. Calcul de matrice de similaritéFonction de similarité: alignement global de séquence
3. ClassificationSVM linéaire (Empirical Kernel Map)
Un cycle complet d'IEExtraction de Relations par AlvisRE
Combine l'intuition d'une fonction de similarité...Pas besoin de feature engineering
.. avec une représentation vectoriellecompatible avec les features supplémentaires
Chaque instance est représentée parUn vecteur composé de la similarité entre cette instance ettous les instances d'entraînement
Représentation
Un cycle complet d'IEExtraction de Relations par AlvisRE
Représentation
Un cycle complet d'IEExtraction de Relations par AlvisRE
Représentation
Un cycle complet d'IEExtraction de Relations par AlvisRE
Représentation
Un cycle complet d'IEExtraction de Relations par AlvisRE
Représentation
Un cycle complet d'IEExtraction de Relations par AlvisRE
Représentation
Un cycle complet d'IEExtraction de Relations par AlvisRE
Alignement
Un cycle complet d'IEExtraction de Relations par AlvisRE
Results on Benchmarks
Un cycle complet d'IEExtraction de Relations par AlvisRE
Corpus "Concurrence" AlvisRE‐‐ PRE REC F1 PRE REC F1LLL 70,9 95,4 79,7 63,3 77,1 69,5BB 28 82 42 70 51 59
Un cycle complet d'IEMoteur de recherche sémantique
merci!