-
Les Outils Informatiques au Service de
la Terminologie Saussurienne Ruimy, Nilda, Piccini, Silvia &
Giovannetti, Emiliano
Istituto di Linguistica Computazionale Antonio Zampolli
Consiglio Nazionale delle Ricerche
Pise - Italie {nilda.ruimy silvia.piccini et
emiliano.giovannetti}@ilc.cnr.it
1 Introduction
Ferdinand de Saussure (1857-1913) est universellement reconnu
comme le pre fondateur de la linguistique moderne. Sa pense et son
uvre ont eu un impact considrable dans le domaine des sciences
humaines et sociales et en particulier en linguistique et en
philosophie du langage. Un trait remarquable de la personnalit de
cet minent savant est en effet lclectisme de sa curiosit
intellectuelle. La multiplicit de ses intrts la amen conduire
dimportantes recherches dans de nombreux et divers champs du
savoir. Nanmoins, Ferdinand de Saussure na jamais publi ses crits
sur des thmes de linguistique gnrale, et bien que son uvre ait t
largement diffuse travers le monde, sa pense a t en grande partie
reconstruite et interprte par ses tudiants et ses disciples.
Louvrage qui la rendu clbre, le Cours de Linguistique Gnrale, fut
en effet rdig partir de notes prises par certains de ses tudiants
durant les trois cours de linguistique gnrale que Saussure tint
lUniversit de Genve, de 1907 1911. Le livre fut publi titre
posthume, en 1916, par deux de ses disciples et collgues, Charles
Bally et Albert Sechehaye qui laborrent ces notes, non sans y
ajouter des commentaires personnels pouvant parfois dtourner le
lecteur de lenseignement saussurien. Ces interventions ditoriales
de Bally et Sechehaye furent mises en vidence dans louvrage
exgtique de Robert Godel Les sources manuscrites (1957), ainsi que
dans celui de Rudolf Engler Cours de linguistique gnrale
(1968-1974) qui mit en parallle le CLG, les notes des tudiants et
les crits originaux de Saussure.
En ralit, la pense saussurienne est beaucoup plus subtile et
moins catgorique quelle ne parat dans le Cours: dune part, Saussure
confesse souvent ses doutes sur des points cruciaux et fait de ces
doutes mmes son heuristique; dautre part, il lutte contre labsence
dune rflexion pistmologique de la linguistique de son poque et
propose parfois mme une relecture des concepts fondamentaux. Ces
deux ples apparaissent clairement dans les notes et les crits
autographes du matre genevois. Cest pourquoi, afin de saisir
pleinement la pense de Saussure, il est ncessaire de fonder sa
recherche sur des crits authentiques.
Concernant ces crits, Charles Bally et Lopold Gautier publirent
en 1922 le Recueil des publications scientifiques de Ferdinand de
Saussure contenant des manuscrits dont la version finale avait t
valide par lauteur lui-mme. En 2002, sous le titre de crits de
linguistique gnrale, Rudolf Engler et Simon Bouquet publirent des
documents autographes dcouverts en 1996 dans lorangerie de la
maison familiale de Saussure, Genve. Parmi eux figurait une premire
rdaction manuscrite, intitule De l'essence double du langage, du
livre sur la linguistique gnrale auquel le linguiste genevois avait
souvent fait allusion, mais qui semblait dfinitivement perdue.
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1043
-
Bien que fragmentaires, les crits authentiques de Saussure
revtent une importance fondamentale car ils rvlent la complexit du
systme philosophique et smiologique labor par leur auteur. Ils
mettent galement en lumire lattention toute particulire que
Saussure accorde la terminologie dont il dplore le manque de
rigueur dans le domaine linguistique, son poque. Lui-mme utilise
souvent un vocabulaire trs particulier afin dexprimer des ides et
des thses qui ont eu une porte rvolutionnaire dans le domaine de la
linguistique. Il forge des nologismes ou confre un sens nouveau des
mots existants, il emploie quelques termes de faon phmre, change la
dnotation de certains concepts au fil du temps, crant ainsi une
terminologie qui lui est propre et qui, de nos jours encore,
caractrise fortement sa pense et la contribution fondamentale quil
a apporte la linguistique moderne.
La terminologie de Saussure a fait l'objet de plusieurs tudes.
La documentation la plus complte en la matire remonte cependant
1968. Il s'agit d'une publication de 57 pages intitule Lexique de
la terminologie saussurienne, rdige par Rudolf Engler. Cet opuscule
fournit les dfinitions de 441 termes, assorties de citations mais
aussi de commentaires qui, selon Cristina Vallini (2006) pourraient
fourvoyer le lecteur. Prs d'un demi-sicle plus tard, et la lumire
des manuscrits de lorangerie, il semble donc opportun d'actualiser
l'tude de la terminologie saussurienne.
Le travail que nous nous proposons dillustrer dans cet article
sinscrit dans le cadre dun Projet de Recherche dIntrt National
(PRIN) financ par le gouvernement italien et dirig par le
Professeur Daniele Gambarara. Ce projet, intitul Per un'edizione
digitale dei manoscritti di Ferdinand de Saussure 1, a pour
objectif la cration dun prototype ddition numrique des textes de F.
de Saussure, ralis partir dune slection de ses manuscrits. A cet
effet, chaque manuscrit est numris, class et dot dun lien
hypertextuel qui renvoie sa transcription ainsi qu sa traduction
italienne. Un systme de gestion de textes permet de consulter,
dannoter et daccomplir nombre dtudes philologiques et critiques sur
le corpus de documents numriss. Les concordances par forme et par
lemme produites pour lensemble des textes fournissent, entre
autres, une slection de nouveaux termes spcifiques dont la
smantique est dcrite dans un thsaurus-lexique.
2 Un nouveau thsaurus
Un des aspects novateurs de ce projet consiste prcisment dans la
cration du premier thsaurus-lexique lectronique de la terminologie
linguistique saussurienne. Lemploi du terme thsaurus-lexique
sexplique par le fait que, comme nous le verrons, la base de
connaissances en cours de ralisation offre infiniment plus
dinformations quun thsaurus traditionnel. La population de ce
lexique est constitue par une nomenclature mise jour, comprenant
tous les termes proposs par Godel (1957) et Engler (1968) ainsi
quun ensemble de mots-cls extraits des crits de linguistique
gnrale. La nouvelle terminologie extraite des manuscrits
actuellement ltude y sera galement intgre. travers ce lexique, nous
nous proposons de fournir une reprsentation structure de la
terminologie saussurienne, de dfinir le contenu smantique de chacun
des termes ainsi que la nature et limportance des relations qui les
unissent.
De nos jours, lapplication des technologies informatiques dans
les sciences humaines nous permet denvisager cette tche dune faon
bien diffrente que ne la t la compilation manuelle du lexique,
ralise par Engler. partir des annes 70, un nouveau paradigme de
lexiques et thsaurus sest en effet progressivement dvelopp grce aux
instruments et aux mthodes informatiques qui permettent dacqurir,
de mmoriser, traiter et diter des quantits de donnes lexicales
inconcevables pour la constitution manuelle dun thsaurus ou dun
dictionnaire.
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1044
-
Un thsaurus est gnralement dfini comme un rpertoire alphabtique
de termes relis par des relations hirarchiques, associatives et
synonymiques. Ces termes constituent le lexique dun domaine de la
connaissance et sont utiliss pour lindexation des textes et la
recherche dinformation dans ce domaine. Quelques thsaurus
lectroniques ont t crs, parmi lesquels il convient de signaler le
Thesaurus mediae et recentioris latinitatis, labor Rome lIstituto
del Lessico Intellettuale Europeo e Storia delle Idee du Consiglio
Nazionale delle Ricerche, et qui est consacr au lexique
philosophique des XVII et XVIII sicles et la liste des termes du
haut Moyen-ge. Le Thesaurus Diplomaticus, une base de donnes de
textes et images de documents diplomatiques en latin, ainsi que le
Thesaurus formarum totius latinitatis a Plauto usque ad saeculum
XXum contenant des formes latines annotes, ont t tous deux raliss
lUniversit Catholique de Louvain. Le Thesaurus Linguae Grecae,
dvelopp la California University, Irvine, contient, quant lui, la
quasi totalit des textes grecs du VII sicle av. J.-C. lan 1453 apr.
J.-C.
Les thsaurus peuvent sappuyer sur un systme de classification
unidimensionnelle ou multidimensionnelle. Ces derniers, appels
thsaurus facettes, sont plus flexibles que ceux structure
monohirarchique puisquils fournissent une multiplicit de points
daccs linformation et donc plus de possibilits de recherches sur
les donnes saisies. Notre but tant, ici, de dvelopper un
thsaurus-lexique, nous nous sommes tourns vers ltude de modles
lexicaux.
Durant les quinze dernires annes, de remarquables modles
lexicaux ont t conus pour le dveloppement de grandes ressources
lexicales informatises. Certains de ces modles, tels que Wordnet
(Fellbaum, 1998), EuroWordNet (Vossen, 1999), et ItalWordNet
(Roventini et al., 2003) sont bass sur des rseaux conceptuels ;
dautres comme par exemple FrameNet (Fillmore et al., 2003) et
Pattern Dictionary (Hanks et Pustejovsky, 2005) sur des patrons
smantiques ; dautres encore conjuguent classification ontologique
et description de la valence syntaxique et smantique, c'est le cas
du modle SIMPLE (Lenci et al., 2000) et de Brandeis Semantic
Ontology (Pustejovsky et al., 2006).
3 Le choix dun modle lexical
Utiliser un modle existant en ladaptant aux exigences dun
domaine de la connaissance est, sans aucun doute, loption la plus
avantageuse en matire de cot et de temps mais aussi et surtout en
matire de qualit des rsultats. Aprs un examen attentif des
diffrents types de modles susnomms, nous avons opt pour le modle
smantique SIMPLE en raison de ses remarquables caractristiques, et
lavons customis en vue du dveloppement du thsaurus-lexique
lectronique de la terminologie saussurienne.
3.1 Le modle de base
Le modle lexical SIMPLE fut adopt consensuellement au plan
europen en 1998 en vue de crer douze lexiques smantiques
monolingues harmoniss, pour autant de langues europennes. Ds sa
conception, il sest impos comme standard de facto et a ainsi inspir
de manire dterminante le standard international ISO pour les
lexiques du Traitement Automatique des Langues, le mtamodle Lexical
Markup Framework2 (Francopoulo, 2007). Dans le panorama de la
Lexicographie Computationnelle, le modle SIMPLE se distingue par
certains aspects particulirement novateurs.
Lapproche thorique qui sous-tend la reprsentation de
linformation smantique est fortement inspire des principes
fondamentaux de la thorie du Lexique Gnratif (Pustejovsky, 1995 ;
2001). Larchitecture
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1045
-
flexible du modle ainsi que la mthodologie de construction du
lexique permettent dencoder dans les entres lexicales une vaste
gamme dinformations hautement structures couvrant les principaux
aspects de la smantique lexicale des mots ; ceci de manire
cohrente, et au degr de granularit souhait. La structuration
conceptuelle du lexique est confie une ontologie linguistique
mettant en relief le caractre multidimensionnel du sens lexical.
Lontologie SIMPLE est forme de types smantiques indpendants des
langues et a t conue en prvision dexpansions ou de spcialisations
visant satisfaire aux exigences de domaines dintrt
particuliers.
Outre la classification ontologique et un certain nombre de
traits smantiques, les units lexicales sont caractrises par un
rseau de relations smantiques qui sont en majeure partie le fruit
dune relecture de la Structure des Qualia (Qualia Structure) que
Pustejovsky emprunte Moravcsik (1975)3. La structure des qualia,
qui est un des quatre niveaux de reprsentation smantique4 dans la
thorie du Lexique Gnratif, est compose de quatre rles. Ceux-ci
permettent respectivement de situer lentit dnote parmi dautres (rle
formel), den indiquer la fonction (rle tlique), lorigine (rle
agentif) et la composition (rle constitutif). La structure des
qualia fournit donc un langage formel pour modliser laspect
componentiel du sens dun mot. Les relations qualia permettent de
reprsenter linformation concernant les diffrentes composantes
smantiques qui concourent dfinir la structure interne dune unit
lexicale quelle que soit sa catgorie syntaxique. Elles explicitent
ses liens paradigmatiques : hyperonymiques, hyponymiques,
mronymiques et holonymiques mais aussi, sur laxe syntagmatique, les
liens aux diffrents prdicats qui contribuent clairer son sens ; ces
derniers renseignent en particulier sur lorigine et la fonction de
lentit dnote. Outre les relations qualia, dautres liens tels que la
synonymie, la polysmie logique et la drivation morphologique sont
galement dfinis. Les lexmes prdicatifs - verbes, noms prdicatifs et
adjectifs - sont de surcrot caractriss par le scnario smantique
dans lequel ils sont impliqus. Celui-ci est dcrit en termes de
classe aspectuelle et de structure argumentale du prdicat, avec
indication du rle smantique et des restrictions de slection
smantique de chacun des arguments.
4 La customisation du modle : de SIMPLE SIMPLE_FdS
Le modle SIMPLE offre donc, pour la structuration du lexique, un
cadre riche mais cependant flexible, dans lequel de nombreux lments
sont paramtrables. Lontologie a t conue tant de manire permettre
llimination des types smantiques les plus spcifiques figurant au
bas de la hirarchie, quen vue dune expansion globale ou
sectorielle. La structure qualia se prte aisment une rduction, une
extension ou une customisation des relations, afin de mieux saisir
lorganisation conceptuelle dun domaine particulier ou de rpondre
aux besoins spcifiques dune application. Lintroduction de traits
smantiques ainsi que de relations non qualia supplmentaires est,
quant elle, autorise.
4.1 Lontologie de domaine
La premire phase du processus de customisation du modle de base
sest focalise sur la conception dune ontologie lexicale de domaine
permettant de structurer la terminologie saussurienne. Pour lusage
du terme ontologie, nous nous rfrons la dfinition la plus rpandue
en linguistique et en informatique : An ontology is an explicit
specification of a conceptualization. [] An ontology defines
(specifies) the concepts, relationships, and other distinctions
that are relevant for modelling a domain. 5 (Gruber, 1993 :
200).
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1046
-
Construire une ontologie, cest modliser et reprsenter le schma
conceptuel dun domaine de la connaissance, en vue de partager une
reprsentation formelle de ses lments constitutifs et des relations
quils entretiennent. En loccurrence, notre source dinspiration tant
le systme de types smantiques du modle SIMPLE, lontologie de
domaine a t ralise conformment larchitecture et aux principes de
conception de notre archtype. Celui-ci refltant un prcepte
fondamental de la thorie du Lexique Gnratif selon lequel les units
lexicales sont des entits multidimensionnelles qui diffrent en degr
de complexit vhicul par leur smantique lexicale, lontologie de
domaine a donc t, elle aussi, conue de faon reprsenter ces
diffrences de complexit interne du sens des mots.
4.1.1 Identification des classes conceptuelles
La premire tape dans la cration de lontologie SIMPLE_FdS a t
didentifier un ensemble de classes smantiques partir de leurs
instances. Lextraction de nouveaux termes des manuscrits ltude
ntant pas acheve, nous avons analys les termes recueillis par Godel
et Engler termes indubitablement fondamentaux dans la pense
saussurienne. Chaque sens dun terme a reu un classement smantique
prliminaire et parfois mme approximatif. De cette classification
ont merg les classes conceptuelles les plus pertinentes de la
future ontologie. Ces concepts, souvent situs un niveau
intermdiaire de lontologie, ont ensuite t dfinis et organiss en une
hirarchie. Puis, dans un processus toujours en cours, ils ont t
gnraliss ou spcialiss travers la cration de classes smantiques plus
vastes ou de sous-classes, en combinant les approches ascendante et
descendante. cet gard, nous avons pris soin dviter tant une trop
grande gnralisation que des distinctions trop fines et qui se
rvlent souvent peu utiles.
Ltape successive a t consacre la dfinition de la structure
interne des classes (ou types) smantiques : a) leurs proprits
(attributs et valeurs), en distinguant celles qui sont communes
toutes les instances dun type smantique et qui en sont donc un
trait dfinitoire (attribut obligatoire) de celles qui ne
caractrisent quun sous-ensemble des termes appartenant un type
(attribut autoris); b) les valeurs possibles des attributs : valeur
boolenne, caractres, liste, chiffre, ainsi que leur cardinalit (le
nombre minimal et maximal de valeurs distinctes autorises).
4.1.2 La structuration des concepts
En accord avec notre modle dontologie, le systme de types
smantiques SIMPLE_FdS est fond sur des relations conceptuelles tant
hirarchiques que non hirarchiques, selon le principe de lhritage
orthogonal6 (Pustejovsky et Boguraev, 1993). Il est donc constitu
de types unidimensionnels ainsi que de types multidimensionnels.
Les premiers sont pleinement caractrisables par une relation
hyperonymique ; ainsi, le type smantique Natural_Entity est
correctement dfini comme un sous-type de Concrete_Entity. Les types
multidimensionnels traduisent, quant eux, la multidimensionnalit du
sens travers la combinaison dune relation de subsomption et la
rfrence dautres dimensions de sens. Ces dimensions de sens sont
exprimes au moyen de la structure des qualia, qui est inspire de la
notion aristotlicienne de modes dexplication (Aitiai) ; ainsi, le
type smantique Artifactual_Entity ne peut tre dfini que comme un
sous-type de Concrete_Entity englobant galement une dimension
agentive et une dimension tlique. Dans le cadre de lontologie, les
rles qualia dfinissent les proprits distinctives des types
smantiques et diffrencient leur constitution smantique interne.
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1047
-
Graphique 1 : Visualisation de lontologie SIMPLE_FdS (version
0.2) avec le logiciel Protg
Il nest pas surprenant de constater que dans lontologie de
domaine, les types smantiques les plus levs dans la hirarchie, qui
sont les plus gnriques et consensuels puisquils expriment des
concepts trs gnraux, refltent en grande partie ceux de lontologie
SIMPLE. Au plus haut niveau de lontologie de domaine figurent en
effet outre les types Constitutif, Agentif et Tlique qui permettent
de fournir une reprsentation smantique dentits dont le rle formel
est indfinissable et qui ninstancient lexicalement que le rle
Constitutif, Agentif ou Tlique, ex. : ensemble, origine du langage
ou objet linguistique les types Concrete_Entity, Abstract_Entity,
Property et Event. De mme, une portion de lontologie gnrale a
inspir la construction de hirarchies de types pour la description
du mtalangage linguistique.
Cette ontologie de domaine, constitue de 47 types smantiques, a
t conue tant dans le respect des principes gnraux de construction
dune ontologie que dans celui des contraintes spcifiques imposes
par le modle lexical adopt. Nous nous sommes efforcs dadhrer aux
principes de compltude et de
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1048
-
cohrence et de prvoir la possibilit dextensions ou raffinements.
Notre objectif principal a t de tendre vers une modlisation la plus
consensuelle possible des concepts et des relations constitutives
propres notre domaine de la connaissance, ceci dans le but de
permettre une recherche dinformation efficace et exhaustive et
lacquisition de connaissances lexicales partir de textes.
Le rseau de classes smantiques ainsi conu ne reprsente, il est
clair, quune des modlisations possibles du domaine de la
terminologie saussurienne. Le dveloppement dune ontologie est en
effet un processus cratif dans lequel un facteur de subjectivit
sinscrit invitablement ; en dpit de tout effort de consensus, une
ontologie reflte toujours un point de vue. Nous assumons donc
pleinement la responsabilit du choix et de la dfinition des
concepts qui caractrisent la connaissance du domaine, de leurs
relations, ainsi que du niveau de spcification du schma conceptuel
tout entier. Dautre part, la version actuelle de lontologie
pourrait tre sujette volution, et en particulier des raffinements
visant une dfinition plus prcise des types smantiques ainsi qu des
extensions pour lintroduction de nouveaux concepts. Il est en effet
possible que, dans une phase plus avance du dveloppement du
lexique, nous soyons confronts des instances de concepts non
reprsents dans lontologie. Cette volution doit, bien videmment,
seffectuer de manire ne pas invalider les contraintes du modle et
dans le respect de la cohrence du systme tout entier.
Lontologie SIMPLE_FdS a t traduite dans le langage de
reprsentation dontologie Web OWL (Web Ontology Language). Disposer
dune version OWL de lontologie offre un triple avantage : 1) OWL
tant bas sur une smantique formelle, il est possible deffectuer un
grand nombre de tests sur lontologie et sa cohrence (restrictions
doubles, parents multiples, etc.) ; 2) il existe une srie de
plugins de visualisation pour lditeur dontologies Protg qui
simplifient ldition et la consultation ; 3) OWL est le standard
propos depuis 2004 par le W3C pour la reprsentation et le partage
dontologies sur le Web. Lontologie reprsente dans le graphique 1 a
t dite avec Protg-OWL, une plate-forme open-source qui fournit une
srie doutils pour la cration dontologies.
4.2 Traits et relations smantiques
Outre lontologie, deux autres composants du modle SIMPLE_FdS,
i.e., un groupe de traits smantiques et un vaste ensemble de
relations smantiques, permettent dexprimer une large typologie
dinformations caractrisant le contenu smantique des mots.
Les traits smantiques expriment des informations telles que le
domaine dusage dune unit lexicale, ex. : Semantics, Morphology ;
certaines proprits distinctives transversales la hirarchie des
types et qui permettent donc de regrouper les termes, ex. :
Plus_Conventional, quelle que soit leur classification ontologique
; ou encore des dimensions de sens qui sont clairement perues dans
le contenu smantique dun mot mais ne peuvent tre exprimes du point
de vue lexical au moyen dune relation smantique Agentive_yes,
Telic_yes.
Les relations smantiques jouent, quant elles, un rle fondamental
dans la modlisation des donnes lexicales. Elles expriment, sous
forme de triplets , une relation binaire entre des acceptions.
Elles proviennent en grande partie de la Extended Qualia Structure
du modle SIMPLE, qui est elle-mme, comme prcdemment observ, le
fruit dune relecture de la structure des qualia. Les relations de
lExtended Qualia permettent de fournir une reprsentation structure
de la multidimensionnalit dun sens et de saisir la nature des
relations (intra- et extracatgorielles) existant entre les units
lexicales, travers la base de donnes. Lensemble des
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1049
-
relations dont dispose le modle SIMPLE_FdS permet donc, en rsum,
de relier une entit-objet une entit plus gnrique, ses proprits, son
origine, sa fonction, ses lments constitutifs ou au tout dont elle
fait partie ; une entit-vnement, peut, quant elle, tre relie son
agent, patient, instrument, ventuel lieu daction, ainsi qu son
effet ou rsultat. Dautres types de relations sont galement
reprsentes, parmi lesquelles la synonymie et lantonymie.
Dans le modle SIMPLE_FdS, les traits et relations smantiques du
modle de base jugs appropris pour rendre compte de la terminologie
saussurienne ont t retenus. Dautres traits et relations spcifiques
ont t crs afin dexprimer des proprits et des liens qui caractrisent
les termes et plus gnralement lorganisation conceptuelle de ce
domaine particulier de la connaissance.
Seize nouveaux traits smantiques ont t introduits, qui expriment
de nouveaux domaines dusage, renseignent sur la source, la frquence
doccurrence et la priode dattestation dun terme ainsi que sur le
caractre cognitif de lentit quil dnote.
ce jour, seize relations smantiques ont t cres dans le but de
reprsenter a) diffrents types de changements terminologiques
(hasPrevious / hasSubsequent / hasOther_Denomination) exprimant
soit la volont de Saussure lui-mme (signifiant
hasPreviousDenomination image acoustique) soit celle de lditeur
(chanon isEdSubstitutedWith fragment) (fragment substitutesFor
chanon) ; b) une relation de quasi-synonymie (diachronie
hasNearSynonym volution) ; c) une opposition (consonante
isOpposedto sonante) ; d) lappartenance une sphre spcifique
(smantique pertainsTo linguistique), (mtaplasme belongsTo
diachronie) ; e) un trait fondamental de la pense saussurienne
(parole duality langue) ; f) diffrents types dimplication rciproque
(signifiant directlyImplies signifi), (image auditive
indirectlyImplies ide) ; g) une implication non rciproque, inspire
de (Cruse, 1986 : 123) (parasme hasEndonym sme), dans laquelle le
terme conteneur (ici, lunit smantique source) englobe le sens du
terme reprsent par lunit smantique cible ; h) un ordre linaire ou
temporel (frontire syllabique precedes explosion) (suffixe follows
racine) ; i) un lieu abstrait (trsor hasAbstractLocation
pense).
5 Le niveau terminologique
Le modle conceptuel une fois tabli, la phase successive consiste
reprsenter formellement la smantique lexicale des instances des
concepts ontologiques. Les moyens descriptifs qui ont t prsents
permettent la cration dentres lexicales (cf. tableaux 1 et 2)
particulirement riches dinformations.
Une entre smantique dcrit une seule acception dun lexme simple
ou complexe. Le sens analys y est dfini par un ensemble
dinformations structures couvrant un large ventail daspects
smantiques : classification ontologique ; domaine dusage ;
dfinition fournie par Saussure lui-mme7 et par Engler et Godel ;
collocations ; type dvnement dnot, i.e. tat, procs, transition ;
traits smantiques distinctifs particuliers (source, frquence et
priode dattestation dun terme) ; relation de synonymie et
dantonymie ; relation de drivation morphologique; relations de la
Extended Qualia Structure ; structure argumentale du prdicat avec
indication du rle smantique ainsi que des restrictions smantiques
de ses arguments. Une attention particulire est donc rserve aux
liens existant entre les diffrentes units smantiques. Les relations
smantiques tablissent un lien entre le sens dcrit et un certain
nombre dvnements ou dentits qui lui sont strictement lis ; leur
nature explicite permet, de surcrot, de dfinir le rle de ces
vnements ou entits dans la smantique lexicale du mot dcrit.
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1050
-
id = "USem4514uni-spatialit" Naming = "uni-spatialit" Saussure
definition = "Principe de l'uni-spatialit (si l'on considre le sme)
ayant pour consquence dans le sme la divisibilit par tranches
(toujours dans le mme sens et par coupures identiques) [] au lieu
de la divisibilit pluriforme quon aurait par exemple dans un systme
visuel direct." 3317.2. Il faut s'astreindre dire uni-spatialit du
signe linguistique chaque fois, afin de faire sentir que ce n'est
pas un caractre gnral du sme." 3318.1. Definition = "Linarit du
signifiant [l'opposition entre deux smes se rgle au moyen de
tranches allant dans le mme sens et n'arrivant qu'une une].
"(Engler, 51). Semfeaturelist= " SemanticType Property SuperType
Thing Domain LINGUISTICS " Relations: semr = "isa" target =
"USemD2841propriet" (Property) semr = "isaPropertyOf" target =
"USemD24signifiant" (Concrete_Entity) semr = "isaPropertyOf" target
= "USemD4057syntagme" (Complex_Element) semr = "isaPropertyOf"
target = "USemD06chane_de_la_parole" (Speech_Act) semr =
"belongsTo" target = "USemD4058parole" (Speech_Act) semr =
"hasSynonym" target = "USemD76linarit" (Property) semr =
"deadjectivalNoun" target = "USemD9224spatial" (Physical_Property)
Predicative Representation: predicate = "PREDspatial#1" typeoflink
= "AdjectiveNominalization" Arguments: id = "ARG0spatial#1"
semanticrole = "Role_Underspecified" semanticrestriction = "
SemanticType Thing"
id = "USemD9066temps_homogne" Naming = "temps_homogne" Saussure
definition = "Espace (de temps) acoustiquement homogne,
correspondant l'articulation d'un phonme." 748 (3335,1). Definition
= "Correspondance d'un temps acoustique et d'un temps articulatoire
749> E 65/64-66/65. Dans le Cours III, Saussure dira moment
("des moments, pas des temps" 725)" (Engler, 50). "Espace homogne
dans la chane acoustique; acte articulatoire qui lui correspond."
(Godel, 279). Semfeaturelist= " SemanticType Time SuperType
Abstract_Entity Domain LINGUISTICS Domain PHONOLOGY
DurationUnderspecified" Relations: semr = "isa" target =
"USemD9120espace_temporel" (Time) semr = "concerns" target =
"USemD2865chane_phonique" (Group) semr = "Hasproperty" target =
"USemD9122homognit" (Property) semr = "isRelatedTo" target =
"USem8phonme" (Basic_Element) semr = "belongsTo" target =
"USemD4058parole" (Speech_Act) semr = "pertainsTo" target =
"USem14phonologie" (Domain_of_Knowledge) semr =
"hasSubsequentDenomination" target = "USemD89121moment" (Time)
id = "USemD4058parole" Naming = "parole" Definition = "Excution
du langage travers le code de la langue (le langage moins la
langue). " (CLG, Engler, 38). "Tout ce qui est amen sur les lvres
par le besoin du discours et par une opration particulire (IR2.24).
Acte de l'individu ralisant sa facult du langage au moyen de la
convention sociale qui est la langue (IIR6-7)." (Godel, 271).
Semfeaturelist=" SemanticType Speech_Act SuperType Act Domain
LINGUISTICS
id = "USem11morphologie" Naming = "morphologie" Saussure
definition = "Science qui traite des units de son correspondant une
partie de lide, et du groupement de ces units. Le vrai nom de la
morphologie serait: la thorie des signes, et non des formes." 3293
&2. Definition = "Dans les subdivisions de la grammaire (au
sens traditionnel), la morphologie s'oppose essentiellement la
phontique, tandis qu'il est difficile de la distinguer de la
syntaxe: "Etude des formes et des fonctions, c'est la mme chose"
2136 (Engler, 35) (Godel, 269).
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1051
-
EventType Process IntentionalityYes" Relations: semr = "isa"
target = "USemD2892excution" (Speech_Act) semr = "concerns" target
= "USemD4037langage" (Property) semr = "hasInstrument" target =
"USemD402langue" (Linguistic_System) semr = "hasProperty" target =
"USemD76linarit" (Property) semr = "isTypicalOf" target =
"USemD8383sujet_parlant" (Human) semr = "duality" target =
"USemD402langue" (Linguistic_System) semr = "hasSynonym" target =
"USemD9223langue_discursive" (Speech_Act) semr = "hasSynonym"
target = "USemD33discours" (Speech_Act)
Collocations = "morphologie historique; - rtrospective"
Semfeaturelist=" SemanticType Domain_of_Knowledge SuperType
Abstract_Entity Domain LINGUISTICS Domain MORPHOLOGY" Relations:
semr = "isa" target = "USemD15science" (Abstract_Entity) semr =
"concerns" target = "USemD12forme" (Relational_Entity) semr =
"concerns" target = "USemD17unit_morphologique" (Basic_Element)
semr = "belongsTo" target = "USemD22synchronie" (State) semr =
"pertainsTo" target = "USem12grammaire" (Domain_of_Knowledge) semr
= "hasPurpose" target = "USemD18groupement"
(Cause_Change_Cognitive_Event) semr = "hasOtherDenomination" target
= "USemD19thorie_des_signes" (Domain_of_Knowledge)
Tableaux 1 et 2 - Exemples dentres lexicales
Privilgiant les termes dj rpertoris provenant des crits
authentiques de Saussure, 375 entres lexicales ont t cres ce jour,
parmi lesquelles 284 noms simples ou complexes, 70 adjectifs et 21
verbes. Ces entres sont mmorises dans une base de donnes gre par un
systme qui permet un accs facile et simultan pour la cration, le
stockage, la consultation et la modification des entres lexicales.
Le systme de gestion de la base de connaissances comprend un
ensemble de requtes en SQL (Structured Query Language), un langage
de programmation dclaratif cr pour le contrle et la manipulation de
donnes mmorises dans les bases de donnes relationnelles. Ces
requtes permettent deffectuer des contrles de qualit sur la
cohrence formelle des informations mmorises. Le systme supporte en
outre des fonctions de requtes avances permettant une recherche
dinformation lexicale rapide, efficace et complte et qui fournit
des rsultats trs fins. titre dexemple, une requte concernant lusage
dune relation smantique dtermine, ex. : resultingFrom (avec une
ventuelle restriction sur lunit smantique cible, ex. : association)
restitue tous les couples de termes lis par cette relation. travers
une requte concernant une unit lexicale, ex. : signifiant,
lensemble des termes qui lui sont associs sont slectionns et classs
selon le type de relation quils entretiennent avec le mot cl. Une
requte portant sur un trait smantique, ex. plus_sound, saisit en
revanche toutes les units smantiques concernes, indpendamment de
leur classification ontologique.
Source Semantic Unit Naming Semantic Type Sem. Relation Target
Semantic Unit
USemD9838analogie analogie Mental_CreationresultingFrom
USemD4039association
USemD9839novation_analogiquenovation_analogiqueMental_CreationresultingFrom
USemD4039association
USemD2854paradigme paradigme Relational_State resultingFrom
USemD4039association
USem4453rapport_associatif rapport_associatif Relational_State
resultingFrom USemD4039association
Tableau 3 - Requte portant sur une relation smantique spcifique
associe un mot cible dtermin
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1052
-
Target Semantic Unit Semantic Relation Source Semantic Unit
USemD24signifiant hasPart USemD31onymique
USemD24signifiant hasPart USemD36sme
USemD24signifiant hasPart USem5signe
USemD24signifiant hasPart USemD27signe_linguistique
USemD24signifiant directlyImplies USemD35signifi
USemD24signifiant indirectlyImplies USemD23sens
USemD24signifiant indirectlyImplies USem35pense
USemD24signifiant isa USem4forme
USemD24signifiant isPartOf USem8phonme
USemD24signifiant isPropertyOf USemD76linarit
USemD24signifiant isPropertyOf USem4514uni-spatialit
USemD24signifiant hasOtherDenomination
USemD4050image_verbale
USemD24signifiant hasOtherDenomination USemD26son
USemD24signifiant hasOtherDenomination
USemD9010image_auditive
USemD24signifiant hasOtherDenomination
USemD9007impression_acoustique
USemD24signifiant hasSubsequentDenomination
USemD34image_acoustique
USemD24signifiant hasSynonym USem10signe_linguistique
USemD24signifiant hasSynonym USem139sme
USemD24signifiant hasSynonym USemD25aposme
Tableau 4 - Requte sur un mot cible dans lensemble des relations
auxquelles il est associ
Semantic Unit Semantic Type Semantic Feature
USemD2892excution Speech_Act Plus_sound
USemD60008systme_phonologique Group Plus_sound
USemD60012unit_phonatoire Basic_Element Plus_sound
USemD60011unit_phonique Basic_Element Plus_sound
USemD2860fragment Basic_Element Plus_sound
USem4414sonorit Constitutive Plus_sound
USemD2861anneau Basic_Element Plus_sound
USemD2885ralisation Speech_Act Plus_sound
USem32acte_linguistique Speech_Act Plus_sound
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1053
-
USemD33discours Speech_Act Plus_sound
USemD4031chane_parle Speech_Act Plus_sound
USemD4058parole Speech_Act Plus_sound
USemD60006chane_de_la_parole Speech_Act Plus_sound
USemD60024phonation Speech_Act Plus_sound
USemD2863articulation Speech_Act Plus_sound
USemD2889chane_significative Speech_Act Plus_sound
USemD2869circuit_de_la_parole Speech_Act Plus_sound
USem4forme Concrete_entity Plus_sound
USemD26son Concrete_entity Plus_sound
Tableau 5 - Requte sur les units lexicales associes un trait
smantique
6 Conclusions et perspectives
Le thsaurus-lexique lectronique que nous avons prsent est bas
sur un modle lexical qui allie la complexit et la rigueur des
traits innovants. Une ressource lexicale ainsi structure et
formalise offre de nombreux avantages. En phase de cration, elle
permet un dveloppement collaboratif rigoureux, mme distance ; elle
favorise une reprsentation systmatique de gnralisations concernant
des phnomnes linguistiques ; enfin, elle assure la cohrence et la
compltude de linformation saisie. En matire de maintenance, elle
permet de raliser des contrles de cohrence formelle de linformation
et deffectuer des modifications ou corrections sur des ensembles de
donnes ; elle offre une grande facilit denrichissement de
linformation ainsi que dextension de la couverture lexicale. En ce
qui concerne son exploitation, outre ses caractristiques doutil de
description et de dsambigusation smantique trs efficace, cette
ressource lexicale permet de rechercher ou dinfrer une vaste gamme
dinformations. La structuration multidimensionnelle des concepts du
domaine de rfrence ainsi quune reprsentation smantique hautement
structure, riche, diversifie et expressive en font un outil de
recherche lexicale particulirement performant. Des requtes de
recherche dinformation peuvent en effet tre effectues trs
simplement et rapidement sur nimporte quel type de donnes mmorises,
i.e. relations, traits smantiques ou units smantiques, ces donnes
pouvant tre interroges tant singulirement quen combinaison.
Effectues dans un environnement formalis qui garantit la compltude
des rsultats obtenus, ce genre de recherche lexicale permet
dacqurir une vision plus approfondie de la nature componentielle et
relationnelle du sens des mots.
Le thsaurus-lexique smantique de la terminologie saussurienne en
cours de dveloppement et qui sera achev fin 2012 deviendra, notre
avis, un outil essentiel pour les tudes saussuriennes.
Lorganisation structure de la connaissance lexicale qui y est
propose favorise la recherche smantique et devrait donc contribuer
de manire significative mieux matriser le vocabulaire saussurien
et, partant, clairer certains aspects originaux de la pense du
grand linguiste genevois.
Les outils informatiques et les mthodologies adopts pour le
dveloppement de ce thsaurus lectronique sont entirement portables
et sont destins tre utiliss dans des domaines similaires pour
tudier luvre dautres crivains, philosophes et savants. En fait,
dans le cadre dun ERC Advanced Project8, un
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1054
-
thesaurus lectronique de termes reprsentatifs extraits de la
pseudo-Thologie dAristote est actuellement en cours de
dveloppement. Il est fond sur une version customise de notre modle
de base.
Rfrences bibliographiques
Cabr, M.T. (1999). Terminology. Theory, methods and
applications. Sager, J.C. (d.). Amsterdam/Philadelphia : John
Benjamins Publishing Company.
Cruse, D. A. (1986). Lexical Semantics. Cambridge : Cambridge
University Press.
Engler, R. (1968). Lexique de la terminologie saussurienne.
Comit international permanent des linguistes. Publication de la
commission de terminologie. Utrecht-Anvers : Spectrum.
Fellbaum, C. (1998). WordNet. An Electronic Lexical Database.
Cambridge, MA : The MIT Press.
Fillmore, C.J. et al. (2003). Background to FrameNet.
International Journal of Lexicography, 16 (3), 235-250.
Francopoulo, G. et al. (2007). Lexical Markup Framework: ISO
standard for semantic information in NLP lexicons. Proceedings of
Lexical-semantic and Ontological Resources Workshop at Gesellschaft
fr linguistische Datenverarbeitung, Biennal Spring Conference,
Tubingen.
Godel, R. (1957). Les sources manuscrites du Cours de
linguistique gnrale de Ferdinand de Saussure. Genve : Droz.
Gruber, T. R. (1993). A translation approach to portable
ontologies. Knowledge Acquisition, 5(2), 199-220.
Guarino, N. (1998). Some Ontological Principles for Designing
Upper Level Lexical Resources. Proceedings of the First
International Conference on Language resources and Evaluation,
Granada.
Guarino, N., Oberle, D., Staab, S. (2009). What Is an Ontology?
In S. Staab and R. Studer (ds.) Handbook on Ontologies, Second
Edition, International Handbooks on Information Systems, Springer
Verlag: 1-17.
Hanks, P., Pustejovsky, J. (2005). A pattern dictionary for
natural language processing. Revue Franaise de Linguistique
Applique 10(2), 63-82.
Lenci, A., F. Busa, N. Ruimy, E. Gola, M. Monachini, N.
Calzolari, A. Zampolli et al. (2000). SIMPLE Linguistic
Specifications LE4-8346 SIMPLE, Deliv. D2.1 & D2.2. Pisa : ILC
and University of Pisa.
Lenci, A. et al. (2000). SIMPLE: A General Framework for the
development of Multilingual Lexicons. International Journal of
Lexicography, special issue, Dictionaries, Thesauri and
Lexical-Semantic Relations 13(4), 249-263.
Moravcsik, J. M. (1975). Aitia as Generative Factor in
Aristotles Philosophy. Dialogue, 14, 622-36.
Pustejovsky, J. (1995). The Generative Lexicon. Cambridge, MA. :
The MIT Press.
Pustejovsky, J. (2001). Type Construction and the Logic of
Concepts. In Bouillon, P. et Busa, F. (ds.), The Language of Word
Meaning, Cambridge, MA : Cambridge University Press, 91-123.
Pustejovsky, J. et al. (2006). Towards a Generative Lexical
Resource: The Brandeis Semantic Ontology. CD-ROM Proceedings Fifth
International Conference on Language resources and Evaluation,
Genova.
Pustejovsky, J., Boguraev, B. (1993). Lexical Knowledge
Representation and Natural Language Processing, Artificial
Intelligence, LXIII, 193-223.
SHS Web of Conferences 1 (2012)DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)
1055
-
Rosati,L. (2003). La classificazione a faccette fra Knowledge
Management e Information Architecture, itconsult.it.
http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM.pdf
Roventini A. et al. (2003). ItalWordNet: Building a Large
Semantic Database for the Automatic Treatment of Italian. In
Zampolli et al. (ds.), Computational Linguistics in Pisa, Special
Issue, Vol. XVIII-XIX, Tomo II, Pisa-Roma : IEPI, 745-792.
Ruimy, N. et al. (2003). A computational semantic lexicon of
Italian: SIMPLE. In Zampolli et al. (ds.), Computational
Linguistics in Pisa, Special Issue, Vol. XVIII-XIX, Tomo II,
Pisa-Roma : IEPI, 821-864.
Saussure, F. de (1916). Cours de linguistique gnrale. Bally, C.
et Sechehaye, A. (ds). Lausanne-Paris : Payot.
Saussure, F. de (1968-1974). Cours de linguistique gnrale.
Engler, R. (d.). Vol. 1 et 2. Wiesbaden : Otto Harrassowitz.
Saussure, F. de (1922). Recueil des publications scientifiques
de Ferdinand de Saussure. In Bally, Ch. et Gautier, L. (ds.).
Lausanne : Payot.
Saussure, F. de (2002). crits de linguistique gnrale. Bouquet,
S. et Engler, R. (ds.). Paris : Gallimard.
Sowa, J. F. (2002). Building, Sharing, and Merging Ontologies.
http://www.jfsowa.com/ontology/ontoshar.htm
Vallini, C. (2006). Il metalinguaggio di Saussure fra vecchie e
nuove scienze. In Gensini, S. e Martone, A. (ds.), Il linguaggio:
Teoria e storia delle teorie, in onore di Lia Formigari, Napoli :
Liguori Editore.
Vossen, P. (d.) (1999). Eurowordnet. A multilingual database
with lexical semantic networks. Dordrecht : Kluwer.
1 Pour une dition numrique des manuscrits de Ferdinand de
Saussure .
2 ISO-24613:2008.
3 Moravcsik, quant lui, fournit une interprtation des quatre
causes aristotliciennes .
4 Les trois autres niveaux tant: la structure argumentale, la
structure vnementielle et la structure dhritage lexical.
5 Une ontologie est une spcification explicite dune
conceptualisation. [] Une ontologie dfinit (spcifie) les concepts,
les relations ainsi que dautres distinctions pertinentes pour la
reprsentation dun domaine.
6 Selon ce principe, les diffrentes facettes du sens dune unit
lexicale peuvent tre hrites de nuds diffrents mais une proprit
donne est hrite dun unique parent.
7 Dans les crits autographes de Saussure, la dfinition dun terme
nest pas toujours donne de manire explicite. Dans ce cas, seules
les dfinitions fournies par Engler et Godel sont reportes dans
lentre lexicale.
8 ERC Ideas Advanced Grant 249431 Greek into Arabic.
Philosophical Concepts and Linguistic Bridges.
SHS Web of Conferences 1 (2012)DOI
10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012
Congrs Mondial de Linguistique Franaise CMLF 2012SHS Web of
Conferences
Article en accs libre plac sous licence Creative Commons
Attribution 2.0
(http://creativecommons.org/licenses/by/2.0)1056