UN PEU DE NUANCE DANS UNE LOGIQUE DE BRUTES LA QUESTION DU SENS EN LINGUISTIQUE INFORMATIQUE Christian RETORÉ Equipe-Projet SIGNES (Université de Bordeaux, INRIA Bordeaux Sud Ouest & LaBRI-CNRS) Unithé ou café 17 décembre 2010 13:00 INRIA Bordeaux Salle Ada Lovelace Ch. Retoré 17 déc. 2010 1 Unithé: logique, linguistique informatique
48
Embed
UN PEU DE NUANCE DANS UNE LOGIQUE DE BRUTESretore/PRESENTATIONS/unithe_dec... · 2010-12-18 · UN PEU DE NUANCE DANS UNE LOGIQUE DE BRUTES LA QUESTION DU SENS EN LINGUISTIQUE INFORMATIQUE
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UN PEU DE NUANCE DANS UNE LOGIQUE DE BRUTES
LA QUESTION DU SENS EN LINGUISTIQUE INFORMATIQUE Christian RETORÉ Equipe-Projet SIGNES
(Université de Bordeaux, INRIA Bordeaux Sud Ouest & LaBRI-CNRS)
Unithé ou café 17 décembre 2010 13:00 INRIA Bordeaux Salle Ada Lovelace
Ch. R
etoré 17 déc. 2010
1
Unithé: logique, linguistique inform
atique
PAS DE DÉMOS: LES FORMULES POUR LES ORDINATEURS, ET NON POUR LES HUMAINS QUI CONÇOIVENT LES PROGRAMMES MANIPULANT LES DITES FORMULES
Tout élève suit un cours de langue.
Ch. R
etoré 17 déc. 2010
2
Unithé: logique, linguistique inform
atique
PLAN
Historique Traitement Automatique des Langues
(quelques applications) Les domaines de la linguistique Grammaire générative, principes,
hiérarchie, acquisition
Logique et sémantique richesse des questions classiques
Quelques aspects cognitifs
Ch. R
etoré 17 déc. 2010
3
Unithé: logique, linguistique inform
atique
LINGUISTIQUE ET INFORMATIQUE: UNE LONGUE HISTOIRE
1949 Machine Translation The flesh is weak but the spirit is willing (russian) The meat is rotten but the vodka is strong La chair est faible mais l'esprit est fort.
Nom du domaine: Linguistique informatique Traitement automatique des langues Linguistique computationnelle
Ch. R
etoré 17 déc. 2010
4
Unithé: logique, linguistique inform
atique
TRAITEMENT
AUTOMATIQUE DES
LANGUES Le versant applicatif
Ch. R
etoré 17 déc. 2010
5
Unithé: logique, linguistique inform
atique
QUELQUES APPLICATIONS
Le Graal: la traduction automatique (il faut savoir tout traiter pour y parvenir)
Aide à la traduction: domaine spécifique propose pour chaque mot ou expression des
traductions les assemble avec les choix du lecteur (éviter au maximum la représentation des
connaissances)
Ch. R
etoré 17 déc. 2010
6
Unithé: logique, linguistique inform
atique
QUELQUES APPLICATIONS
L'interface homme/machine en langue naturelle par exemple: interrogation de base de données en langage naturel Quels sont les films des années cinquante qui passent
actuellement à Bordeaux?
Ch. R
etoré 17 déc. 2010
7
Unithé: logique, linguistique inform
atique
QUELQUES APPLICATIONS
Correcteurs orthographiques : Synapse Word (souligné vert: français, italien,…) Quels livres crois-tu qu'il sait que je pense que tu as
luS ? (exemple un peu irréaliste)
Génération automatique de bulletins météo, de comptes-rendus,..
Résumé automatique: deux techniques contrastées
Ch. R
etoré 17 déc. 2010
8
Unithé: logique, linguistique inform
atique
QUELQUES APPLICATIONS
Recherche d'information (notamment sur Internet) production laitière / production de lait production minière / production de mine(s) ???
Reconnaissance de la parole (par ex. pour sous-titrage) nécessite une analyse morpho-syntaxique pour fonctionner en temps réel
Ch. R
etoré 17 déc. 2010
9
Unithé: logique, linguistique inform
atique
DES APPLICATIONS AVEC PEU D’UTILISATEURS
U<100; 42%
100≤U<1000; 11%
1000≤U; 47%
Nombre d'utilisateurs U
U<100
100≤U<1000
1000≤U
Ch. R
etoré 17 déc. 2010
10
Unithé: logique, linguistique inform
atique
UN DOMAINE INTERDISCIPLINAIRE
Mathématiques Logique Théorie des langages, grammaires formelles Probabilités
Informatique Algorithmique Génie logiciel
Linguistique Descriptions linguistiques Linguistique formelle Philosophie du langage
Ch. R
etoré 17 déc. 2010
11
Unithé: logique, linguistique inform
atique
DES OBJECTIFS VARIÉS
Réalisation d'outils de traitement des langues
Formalisation des théories linguistiques, vérification ou réfutation d’hypothèses
Développement des théories informatiques et mathématiques pour elles-mêmes, éventuellement pour d'autres objectifs (par ex. grammaire du génome)
Ch. R
etoré 17 déc. 2010
12
Unithé: logique, linguistique inform
atique
UN APERÇU DES DOMAINES DE LA LINGUISTIQUE Diviser pour comprendre
Ch. R
etoré 17 déc. 2010
13
Unithé: logique, linguistique inform
atique
ANALYSE GLOBALE: MISSION IMPOSSIBLE
« Elle remplace Marie-Claire avec le supplément. »
Questions: Qui est « elle »? S’agit-il de magazines ou de personnes? Supplément: magazine, heures,… « remplace avec le supplément d’heures» ou
« Marie Claire avec supplément »….
Ch. R
etoré 17 déc. 2010
14
Unithé: logique, linguistique inform
atique
« COMPRENDRE » ?
Construire une représentation du sens utilisable par un ordinateur
Sous tâches: Trouver la structure de la phrase Interpréter les unités de base Assembler ces sens en suivant la structure de la
phrase
Ch. R
etoré 17 déc. 2010
15
Unithé: logique, linguistique inform
atique
NIVEAUX D’ANALYSE (1/4)
Phonétique: son, production et réception Phonologie: sons comme système
Bali et Paris identiques pour un japonais Prosodie: peu formalisée, mais importante
pour l’acquisition et le sens. « Je serai très heureux de venir parler au LaBRI,
laboratoire auquel je dois ma formation initiale en informatique, par exemple sur la lambda-DRT. »
Formation initiale sur … Parler sur …
Ch. R
etoré 17 déc. 2010
16
Unithé: logique, linguistique inform
atique
NIVEAUX D’ANALYSE (2/4)
Morphologie structure des mots Flexionnelle, sans changement de catégorie:
cheval -> chevaux manger -> mangerons
Dérivationnelle: maison-> maisonnette carpe->carpette?? plier-pliage, laver-lavage, porte-manteau, lave vaisselle,
Ch. R
etoré 17 déc. 2010
17
Unithé: logique, linguistique inform
atique
NIVEAUX D’ANALYSE (3/4)
Syntaxe: structure de la phrase (cf. ci-après) Sémantique (sens)
Des mots, système conceptuel (cf. ci-après) De la phrase, du discours: logique, compositionnalité:
Le sens du tout est fonction du sens des parties et du mode de composition. Le chat de la voisine dort sur le toit d’une voiture rouge. Léger problème: Si un paysan possède un âne, il le bât.
Ch. R
etoré 17 déc. 2010
18
Unithé: logique, linguistique inform
atique
NIVEAUX D’ANALYSE (4/4)
Pragmatique, énonciation Sens par l’usage, en situation: discours,
dialogue et du contexte linguistique et extra linguistique: Allons plutôt dans ce restaurant. Ce n’est pas grave.
Dit par une fillette de 6 ans: grave=???
Ch. R
etoré 17 déc. 2010
19
Unithé: logique, linguistique inform
atique
GRAMMAIRE Un aspect relativement maitrisé
Ch. R
etoré 17 déc. 2010 U
nithé: logique, linguistique informatique
20
PRINCIPES
Langage: Ensemble fini de règles inconscientes
Les enfants disent faisez même sans l’avoir entendu 1) Il aime trois livres que Chomsky a écrits. 2) Combien de livre que Chomsky a écrits aime-t-il? 1) il ≠ Chomsky 2) possiblement, il = Chomsky
Analysable rapidement Apprenables à partir d’exemple positifs.
Performance / compétence La chèvre que le loup a dévoré avait mangé le chou. ?? Le passeur auquel le chou que la chèvre que le loup a
dévoré avait mangé appartenait possède plusieurs bateaux.
Ch. R
etoré 17 déc. 2010
21
Unithé: logique, linguistique inform
atique
EXEMPLE DE GRAMMAIRE
s sn sv sn det n | np | det n rel _s | det n rel _o | np rel _s | n p rel
_o rel _s pro_s sv rel _o pro_o sn vt sv vi | vt sn pro_o que pro_s qui vt regard e | regardent | mange | mangent vi dort | dorment | tombe | tombent det une | un | la | le | des | les n pommes | pomme | femme | femmes np pierre | marie
Ch. R
etoré 17 déc. 2010
22
langage: modéles inform
atiques et cognitifs
LANGUES ET LANGAGES ANALYSABLES ET APPRENABLES
Ch. R
etoré 2 déc. 2010
23
langage: modéles inform
atiques et cognitifs
apprenables
Grammaires formelles: bons modèles de la compétence Performance? Apprentissage?
LINGUISTIQUE ET LOGIQUE Une longue tradition (Antiquité, Moyen-Âge)
Vers un calcul informatique ou cognitif du “sens”.
Ch. R
etoré 17 déc. 2010
24
Unithé: logique, linguistique inform
atique
COMPRENDRE LES PHRASES ANALYSÉES
Arbres, structures calculées automatiquement, mais ensuite, comment leur associer des formules manipulables par une machine?
Quels problèmes rencontre-t-on? Ils sont très classiques … mais pas faciles.
Ch. R
etoré 17 déc. 2010
25
Unithé: logique, linguistique inform
atique
LOGIQUE ET GRAMMAIRE: 23 SIÈCLES D’HISTOIRE
Depuis l’antiquité (Aristote, Denis de Thrace) puis au Moyen-Âge (scholastique), au 18e(Port-Royal)...
La phrase a une structure logique, importante en pratique. Les enfants prendront une pizza Chaque enfant prend une pizza pour lui seul? Ils partagent la même?
Ch. R
etoré 17 déc. 2010
26
Unithé: logique, linguistique inform
atique
RICHESSE LOGIQUE DES LANGUES Un, des, certains,
tous, tous les, tout, chaque + d’autres quantificateurs:
la plupart, les, un grand nombre de, un petit nombre de, La plupart des étudiants travaillent.
Les nombres: encore des quantificateurs: Mettre huit gouttes
dans trois cuillèrées à soupe d’eau. 3x8=24 gouttes? 8 gouttes?
Ch. R
etoré 17 déc. 2010
27
Unithé: logique, linguistique inform
atique
PROPRIÉTÉS DE PROPRIÉTÉS
Une fraise rouge vermillon Rouge propriété, vermillon propriété de
propriétés Adjectif “Bon”
Tous les médecins sont des conducteurs Déduction correcte:
Tous les médecins bordelais sont des conducteurs bordelais
Déduction incorrecte: Tous les bons médecins sont des bons conducteurs
Ch. R
etoré 17 déc. 2010
28
Unithé: logique, linguistique inform
atique
PROBLÈMES DE PORTÉES, SUITE
Lectures de re et de dicto James Bond croit que l’un des chercheurs du
laboratoire est un espion. Il existe un chercheur dont JB croit qu’il est un
espion: JB pense que le chercheur Blofeld est un espion.
JB croit qu’il existe un espion dans le laboratoire, mais il ne soupçonne personne en particulier: JB a trouvé un microfilm dans le laboratoire.
Ch. R
etoré 17 déc. 2010
29
Unithé: logique, linguistique inform
atique
PROBLÈMES DE PORTÉE, ENCORE ET TOUJOURS
Il va souvent dans une station de ski des Pyrénées. C’est toujours la même, il y a un appartement
(bien qu’on ne précise pas laquelle) La station varie suivant les fois où il va skier.
Il aime bien changer.
Ch. R
etoré 17 déc. 2010
30
Unithé: logique, linguistique inform
atique
ATTENTION À NE PAS S’ÉCARTER DE CE QUI EST DIT
J’avais trois trombones dans ma poche, je les ai tous perdus sauf un. Je le range dans un tiroir.
J’avais trois trombones dans ma poche, j’en ai perdu deux. * Je le range dans un tiroir.
Pourtant, d’un point de vue purement logique, la situation est identique.
Ch. R
etoré 17 déc. 2010
31
Unithé: logique, linguistique inform
atique
LIEN AVEC LA SYNTAXE
Groupes nominaux: individus Le chien de ma voisine.
Verbes, propriétés 1 arguments X dort, X regarde Marie 2 arguments X regarde Y 3 arguments: X donne Y à Z
ni des prédicats, ni des individus: modifient des propriétés
Ch. R
etoré 17 déc. 2010
32
Unithé: logique, linguistique inform
atique
ASPECTS COGNITIFS: QUELQUES EXEMPLES Notre utilisation quotidienne du langage:
Les modèles peuvent-ils prédire nos difficultés.
Ch. R
etoré 17 déc. 2010
33
Unithé: logique, linguistique inform
atique
EXPÉRIENCES
Phrase, image: la phrase est-elle vraie dans l’image?
1. La poule lit le journal. 2. La poule fait du shopping. 3. La poule ne lit pas le journal. 4. La poule ne fait pas de shopping.
Mémoire à court terme: 4 est le pire: imaginer, comparer. 20% d’erreurs. pour enfants dyslexiques 50% oui - 50% non
Confirmations: La baleine n’est pas un poisson. La baleine n’est pas un oiseau. Temps de réaction plus élevé.
Ch. R
etoré 17 déc. 2010
34
Unithé: logique, linguistique inform
atique
Figure 2: An example of Exp. 1
QUANTIFICATION NATURELLE PLUS RICHE QUE LA QUANTIFICATION LOGIQUE
La plupart…la majorité…. Modèle usuel: cardinal |{x|A(x)}| < |{x|¬A(x)| Ce modèles est très contestable. Tests: La plupart des nombres sont premiers. NON La plupart des nombres ne sont pas premiers. OUI
Le langage contient des quantificateurs de Henkin. Invérifiable (complexité), pourtant on en entend! Un membre de chaque conseil de labo connaît membre de
chaque conseil municipal de la CUB.
L’analyse formelle en terme d’ensembles et de cardinalité est très contestable. Il vaut revenir au point de vue Aristotélicien, Avicennien … L’usage, preuves et réfutations, dialectique (jeux).
Ch. R
etoré 17 déc. 2010
35
Unithé: logique, linguistique inform
atique
LA SIMPLE QUANTIFICATION EST ELLE AUSSI SIMPLE
Tout chien aboie. Un chien, ça aboie. Objet générique, universel (scholastique)…
Tous les chiens aboient. Chaque chien aboie. Collection vérifiant le prédicats.
Ça dépend: Latifa, Myriam et Nabil ont tous réussi. Mes enfants ont tous déjà eu la varicelle. Tous les étudiants ont réussi. Toutes les étoiles meurent. Tout nombre entier est la somme de quatre carrés. Tout homme est mortel.
Ch. R
etoré 17 déc. 2010
36
Unithé: logique, linguistique inform
atique
PLAN RAPPROCHÉ: SÉMANTIQUE LEXICALE DANS UN CADRE COMPOSITIONNEL
Un peu de subtilité dans un modèle trop carré
Ch. R
etoré 17 déc. 2010 U
nithé: logique, linguistique informatique
37
COMPOSITIONNALITÉ SÉMANTIQUE LOGIQUE
Tout barbier se rase lui même. Je le crois. Tu ne finis jamais un livre. Cela m’énerve. Avantages:
qui fait quoi logique d’ordre supérieur,… références, coréférences, quantifications,…
Inconvénients pas de lien entre barbier et raser (pour ex. 1, ça va) ni entre livre et les prédicats lire, écrire, imprimer et c’est un problème pour ex. 2.
Ch. R
etoré 17 déc. 2010
38
Unithé: logique, linguistique inform
atique
SÉMANTIQUE LEXICALE SENS DES MOTS, SYSTÈME CONCEPTUEL LANGAGIER
Rôle thématiques: Une cigarette rapide. Un sourire moqueur.
Glissement de sens, contenant, contenu, associations d’idées: Boire un verre. Je suis garé en face. Le 10 est un as. La table 2 prendra un pichet de rouge.
Ch. R
etoré 17 déc. 2010
39
Unithé: logique, linguistique inform
atique
LES FACETTES EN SÉMANTIQUE LEXICALE
Une facette Un livre lourd. Un bon livre. Un dîner sympathique. Un dîner exquis. Sète est une ville portuaire. Paris envoie des soldats en Afghanistan. Bordeaux a battu Marseille. Un délicieux saumon. Un saumon vif et rapide.
Ch. R
etoré 17 déc. 2010
40
Unithé: logique, linguistique inform
atique
LES FACETTES EN SÉMANTIQUE LEXICALE
Coprédication sur plusieurs facettes. Un livre lourd mais intéressant. Une ville portuaire et cosmopolite. Le dîner était délicieux mais a duré des heures. ? Un saumon rapide mais délicieux. ? Washington borde le Potomac et a attaqué l’Irak. ? Bordeaux est sur la Garonne et a battu Marseille.
Ch. R
etoré 17 déc. 2010
41
Unithé: logique, linguistique inform
atique
FACETTES, RÉFÉRENCE, QUANTIFICATION
Etagère avec les livres de Flaubert deux copies de Madame Bovary, trois de l’Education sentimentale, un volume contenant les Trois contes
Expérience…. J’ai lu tous les livres de l’étagère. Je vais les monter au grenier. Combien de livres ai-je lus? Combien de livres vais-je porter?
Ch. R
etoré 17 déc. 2010
42
Unithé: logique, linguistique inform
atique
TYPES ET ONTOLOGIES CONTRE IDIOSYNCRASIES LANGAGIÈRES
Ma voiture est crevée. (une roue, pas une durite)
* Ma voiture est bouchée. (pourtant toutes les voitures ont un carburateur, des
injecteurs etc. susceptibles de se boucher)
Le langage agit comme un filtre. Il n’est pas l’ontologie. Le langage instancie certains liens conceptuels.
Vice-versa le langage crée des liens conceptuels. Par exemple girouette: rencontre en Normandie de girare (tourner en latin) et de veðr (vent, temps en islandais), puis notion qui prend un sens figuré…
Ch. R
etoré 17 déc. 2010
43
Unithé: logique, linguistique inform
atique
ACQUISITION DU LEXIQUE
Structure argumentale et sens avant sa syntaxe. Sur machine construction de graphes de mots
associés, recherche de proximités sur Internet « Jeux de mots » (LIRMM) sur Internet
Extraction de sens (composantes très connexes)
Problèmes: mot-prédicat mot-argument comment trouver les sens spécifiques associés, et les probabilités des liaisons: commencer un livre, voiture crevée,…
Ch. R
etoré 17 déc. 2010
44
Unithé: logique, linguistique inform
atique
CONCLUSIONS ET PERSPECTIVES Au delà de cet aperçu morcelé