Top Banner
Langue française Dérivations sémantiques et collocations dans le DiCo/LAF Alain Polguère, Igor Mel'cuk Citer ce document / Cite this document : Polguère Alain, Mel'cuk Igor. Dérivations sémantiques et collocations dans le DiCo/LAF. In: Langue française, n°150, 2006. Collocations, corpus, dictionnaires. pp. 66-83. http://www.persee.fr/doc/lfr_0023-8368_2006_num_150_2_6854 Document généré le 21/10/2015
19

Polguère, Mel'cuk (2006)

Jan 28, 2016

Download

Documents

Dérivations sémantiques et collocations dans le DiCo/LAF
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Polguère, Mel'cuk (2006)

Langue française

Dérivations sémantiques et collocations dans le DiCo/LAFAlain Polguère, Igor Mel'cuk

Citer ce document / Cite this document :

Polguère Alain, Mel'cuk Igor. Dérivations sémantiques et collocations dans le DiCo/LAF. In: Langue française, n°150,

2006. Collocations, corpus, dictionnaires. pp. 66-83.

http://www.persee.fr/doc/lfr_0023-8368_2006_num_150_2_6854

Document généré le 21/10/2015

Page 2: Polguère, Mel'cuk (2006)

Alain Polguère & Igor Mel'cukUniversité de MontréalOLST - Département de linguistique et de traduction

Dérivations sémantiqueset collocations dans le DiCo/LAF

I. INTRODUCTION

Au moins deux questions se posent à qui veut décrire les collocationsd'une laneue : comment les collecter et comment les décrire ? Afin derépondre à ces deux questions, nous allons présenter l'approche originaleadoptée dans le projet lexicographique DiCo/LAF (Polguère 2000). Pour lacollecte des collocations, nous utilisons la grille d'analyse fournie par les fonc¬tions lexicales (dorénavant FL) de la théorie Sens-Texte. Le système des FLstandard nous sert de guide pour la recherche des principales collocationscontrôlées par chaque lexie décrite. Bien entendu, cette approche issue de lathéorie s'accompagne aussi du recours à l'observation directe sur corpus. Laréponse à la deuxième question... encore les FL. Nous utilisons un doubleencodage des liens collocationnels. 11 est basé, d'une part, sur des formules dulangage formel des FL, et d'autre part, sur des « vulgarisations » (c'est-à-diredes francisations) de ces formules. Ces vulgarisations sont particulièrementintéressantes puisque, fondées sur un métalangage contrôlé, elles sont directe¬ment interprétables par toute personne possédant une connaissance approxi¬mative du français, sans qu'aucune connaissance du modèle linguistiquesous-jacent ne soit nécessaire.

Le DiCo est une base lexicale centrée sur la modélisation des liens lexicauxdu français ; le LAF (acronyme de Lexique actif du français) est un dictionnairegrand public entièrement produit par extraction et formatage des données duDiCo. Après avoir résumé le travail sur le DiCo/LAF, nous nous concentre¬rons sur deux points méthodologiques :

1. la nécessité de modéliser les liens collocationnels contrôlés par les lexies entenant compte de la structure actancielle de ces lexies ainsi que de leurcombinatoire syntaxique ;

66

Alain Polguère & Igor Mel'cukUniversité de MontréalOLST - Département de linguistique et de traduction

Dérivations sémantiqueset collocations dans le DiCo/LAF

I. INTRODUCTION

Au moins deux questions se posent à qui veut décrire les collocationsd'une laneue : comment les collecter et comment les décrire ? Afin derépondre à ces deux questions, nous allons présenter l'approche originaleadoptée dans le projet lexicographique DiCo/LAF (Polguère 2000). Pour lacollecte des collocations, nous utilisons la grille d'analyse fournie par les fonc¬tions lexicales (dorénavant FL) de la théorie Sens-Texte. Le système des FLstandard nous sert de guide pour la recherche des principales collocationscontrôlées par chaque lexie décrite. Bien entendu, cette approche issue de lathéorie s'accompagne aussi du recours à l'observation directe sur corpus. Laréponse à la deuxième question... encore les FL. Nous utilisons un doubleencodage des liens collocationnels. 11 est basé, d'une part, sur des formules dulangage formel des FL, et d'autre part, sur des « vulgarisations » (c'est-à-diredes francisations) de ces formules. Ces vulgarisations sont particulièrementintéressantes puisque, fondées sur un métalangage contrôlé, elles sont directe¬ment interprétables par toute personne possédant une connaissance approxi¬mative du français, sans qu'aucune connaissance du modèle linguistiquesous-jacent ne soit nécessaire.

Le DiCo est une base lexicale centrée sur la modélisation des liens lexicauxdu français ; le LAF (acronyme de Lexique actif du français) est un dictionnairegrand public entièrement produit par extraction et formatage des données duDiCo. Après avoir résumé le travail sur le DiCo/LAF, nous nous concentre¬rons sur deux points méthodologiques :

1. la nécessité de modéliser les liens collocationnels contrôlés par les lexies entenant compte de la structure actancielle de ces lexies ainsi que de leurcombinatoire syntaxique ;

66

Page 3: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

2. la nécessité d'une approche « globale » de la modélisation des liens lexi¬caux, approche qui s'intéresse simultanément aux liens syntagmatiquescollocationnels et aux liens paradigmatiques contrôlés par chaque lexie.

Nous illustrerons notre propos en présentant la modélisation DiCo desdifférentes acceptions du vocable DÉBAT.

Rappelons que, dans la terminologie Sens-Texte, une lexie est une unitélexicale, c'est-à-dire un « mot » associé à un sens bien spécifique et devant êtredécrit par un article de dictionnaire ; un vocable est un regroupement delexies formellement identiques qui se distinguent sémantiquement, tout enpartageant une composante de sens non triviale. Chaque lexie d'un vocablecorrespond donc à une acception d'un mot polysémique.

2. LE PROJET LEXICOGRAPHIQUE DICO/LAF

2.1. Base lexicale DiCo et produits dérivés du DiCo

Le projet lexicographique DiCo/LAF se distingue d'autres projets de lexi¬cographie informatisée, tel WordNet (Fellbaum 1998), du point de vue desphénomènes linguistiques décrits et du point de vue des structures dedonnées qu'il vise à produire. Nous allons commencer par expliciter ces deuxaspects de notre travail. Même s'il pourrait sembler que nous dévions ici duthème à traiter - les collocations -, il est essentiel de partir du contexte plusgénéral du projet DiCo/LAF pour faire apparaître la particularité de notremodélisation lexicographique des phénomènes collocationnels.

Nous ferons dorénavant référence au DiCo et au LAF comme à des modé¬lisations uniques, clairement spécifiées dans leurs formats et leur mode deprésentation des données. Cependant, il s'agit en fait de deux cas particuliersde produits lexicographiques. Le DiCo nous intéressera en tant que type parti¬culier de base de données représentative de ce que doit être une base lexicalefondée sur les principes de la lexicologie explicative et combinatoire (Mel'cuket al. 1995) ; le LAF n'est qu'un type particulier de produit dérivé d'une tellebase (Polguère 2000). La principale distinction entre ces deux produits est quele premier relève du travail du lexicographe comme tel, alors que le secondest extrait du premier pour une utilisation autre que l'activité lexicogra¬phique : la consultation. Dans ce qui suit, nous désignerons par DiCo la basede données lexicale développée selon nos principes, par LAF, un produitdictionnairique grand public dérivé d'une telle base, et par DiCo/LAF, le projetlexicographique visant la production d'un DiCo et d'un LAF.

Nous commencerons par présenter les deux familles de phénomèneslinguistiques visés par le DiCo : les dérivations sémantiques et les colloca¬tions. Nous expliquerons ensuite pourquoi, selon nous, ces deux phénomènesdoivent être considérés simultanément en lexicologie et lexicographie. Finale¬ment, nous présenterons les autres propriétés des unités lexicales qui sont-prises en compte dans la base de données DiCo, de façon périphérique à lamodélisation des dérivations sémantiques et des collocations.

LANGUE FRANÇAISE : : :, 67

Dérivations sémantiques et collocations dans le DiCo/LAF

2. la nécessité d'une approche « globale » de la modélisation des liens lexi¬caux, approche qui s'intéresse simultanément aux liens syntagmatiquescollocationnels et aux liens paradigmatiques contrôlés par chaque lexie.

Nous illustrerons notre propos en présentant la modélisation DiCo desdifférentes acceptions du vocable DÉBAT.

Rappelons que, dans la terminologie Sens-Texte, une lexie est une unitélexicale, c'est-à-dire un « mot » associé à un sens bien spécifique et devant êtredécrit par un article de dictionnaire ; un vocable est un regroupement delexies formellement identiques qui se distinguent sémantiquement, tout enpartageant une composante de sens non triviale. Chaque lexie d'un vocablecorrespond donc à une acception d'un mot polysémique.

2. LE PROJET LEXICOGRAPHIQUE DICO/LAF

2.1. Base lexicale DiCo et produits dérivés du DiCo

Le projet lexicographique DiCo/LAF se distingue d'autres projets de lexi¬cographie informatisée, tel WordNet (Fellbaum 1998), du point de vue desphénomènes linguistiques décrits et du point de vue des structures dedonnées qu'il vise à produire. Nous allons commencer par expliciter ces deuxaspects de notre travail. Même s'il pourrait sembler que nous dévions ici duthème à traiter - les collocations -, il est essentiel de partir du contexte plusgénéral du projet DiCo/LAF pour faire apparaître la particularité de notremodélisation lexicographique des phénomènes collocationnels.

Nous ferons dorénavant référence au DiCo et au LAF comme à des modé¬lisations uniques, clairement spécifiées dans leurs formats et leur mode deprésentation des données. Cependant, il s'agit en fait de deux cas particuliersde produits lexicographiques. Le DiCo nous intéressera en tant que type parti¬culier de base de données représentative de ce que doit être une base lexicalefondée sur les principes de la lexicologie explicative et combinatoire (Mel'cuket al. 1995) ; le LAF n'est qu'un type particulier de produit dérivé d'une tellebase (Polguère 2000). La principale distinction entre ces deux produits est quele premier relève du travail du lexicographe comme tel, alors que le secondest extrait du premier pour une utilisation autre que l'activité lexicogra¬phique : la consultation. Dans ce qui suit, nous désignerons par DiCo la basede données lexicale développée selon nos principes, par LAF, un produitdictionnairique grand public dérivé d'une telle base, et par DiCo/LAF, le projetlexicographique visant la production d'un DiCo et d'un LAF.

Nous commencerons par présenter les deux familles de phénomèneslinguistiques visés par le DiCo : les dérivations sémantiques et les colloca¬tions. Nous expliquerons ensuite pourquoi, selon nous, ces deux phénomènesdoivent être considérés simultanément en lexicologie et lexicographie. Finale¬ment, nous présenterons les autres propriétés des unités lexicales qui sont-prises en compte dans la base de données DiCo, de façon périphérique à lamodélisation des dérivations sémantiques et des collocations.

LANGUE FRANÇAISE : : :, 67

Page 4: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

2.2. Phénomènes linguistiques visés par le DiCo

Les projets lexicographiques « traditionnels » visent la production dedictionnaires dont les articles tournent autour d'un type de donnée bien spéci¬fique : la définition lexicographique. On peut ainsi immédiatement identifierun dictionnaire « spécial » par le fait que la définition n'est pas au cur de sesarticles : dictionnaires de prononciation, de dérivations, de synonymes, decollocations, etc. Le DiCo/LAF est un projet lexicographique spécial puisqu'ilvise avant tout la modélisation des dérivations sémantiques et des colloca¬tions du français. Attention cependant : contrairement aux autres diction¬naires spéciaux, et notamment aux dictionnaires de collocations, le DiCoprésuppose dans chacun de ses articles une définition rigoureuse (sinoncomplète) des lexies. Cela deviendra clair à la toute fin de notre exposé(section 4.).

Dans cette section, nous allons préciser les notions de dérivation séman¬tique et de collocation, telles qu'elles doivent être comprises dans le cadre dela lexicologie explicative et combinatoire.

2.2.1. Les dérivations sémantiques

La notion traditionnelle de dérivation est bien connue. Elle correspond à

des relations sémantiques et formelles entre deux lexies, relations du typeFUMER -» FUMEUR (nom d'agent), COMPTER -> COMPTAGE (nom d'action), NOIR

-> NOIRCIR (verbe causatif), etc. Le DiCo s'attache à une notion de dérivationplus large, à savoir la dérivation sémantique.

Une dérivation sémantique est une relation entre deux lexies basée surune parenté de sens. Plus précisément, une lexie L2 est dite sémantiquementdérivée d'une lexie L^ si et seulement si les trois conditions suivantes sontsatisfaites :

- L2 entretient une relation sémantique avec L[. Dans le cas plus typique, L2

se définit en terme de L,.Par exemple, la lexie HACHE [= L2] est définie en terme de COUPER [= L,],car le sens 'hache' - 'artefact servant à couper...'.

- La relation sémantique entre L2 et L-j est récurrente dans la langue.Par exemple, la relation entre HACHE et COUPER, 'artefact servant à...", estrécurrente en français : FRAPPER -» MARTEAU, OUVRIR [une porte] -> CLÉ,

FUMER -> PIPE, etc.

- La relation entre L-j et L2 s'exprime fréquemment de façon morphologique.Par exemple, pour la relation 'artefact servant à...", on trouve en françaisles dérivations suffixales suivantes : bouch(-er) -> bouch+on, ras(-er) -»ras+oir, décapsul(-er) » décapsul+eur, etc.

Puisque la relation sémantique qui lie HACHE à COUPER satisfait les troisconditions ci-dessus, nous pouvons dire que la lexie HACHE est sémantique¬ment dérivée de COUPER.

Remarquons qu'un lien de dérivation sémantique qui est marqué explicite¬ment par un moyen morphologique correspond à une dérivation au sens

68

Collocations, corpus, dictionnaires

2.2. Phénomènes linguistiques visés par le DiCo

Les projets lexicographiques « traditionnels » visent la production dedictionnaires dont les articles tournent autour d'un type de donnée bien spéci¬fique : la définition lexicographique. On peut ainsi immédiatement identifierun dictionnaire « spécial » par le fait que la définition n'est pas au cur de sesarticles : dictionnaires de prononciation, de dérivations, de synonymes, decollocations, etc. Le DiCo/LAF est un projet lexicographique spécial puisqu'ilvise avant tout la modélisation des dérivations sémantiques et des colloca¬tions du français. Attention cependant : contrairement aux autres diction¬naires spéciaux, et notamment aux dictionnaires de collocations, le DiCoprésuppose dans chacun de ses articles une définition rigoureuse (sinoncomplète) des lexies. Cela deviendra clair à la toute fin de notre exposé(section 4.).

Dans cette section, nous allons préciser les notions de dérivation séman¬tique et de collocation, telles qu'elles doivent être comprises dans le cadre dela lexicologie explicative et combinatoire.

2.2.1. Les dérivations sémantiques

La notion traditionnelle de dérivation est bien connue. Elle correspond à

des relations sémantiques et formelles entre deux lexies, relations du typeFUMER -» FUMEUR (nom d'agent), COMPTER -> COMPTAGE (nom d'action), NOIR

-> NOIRCIR (verbe causatif), etc. Le DiCo s'attache à une notion de dérivationplus large, à savoir la dérivation sémantique.

Une dérivation sémantique est une relation entre deux lexies basée surune parenté de sens. Plus précisément, une lexie L2 est dite sémantiquementdérivée d'une lexie L^ si et seulement si les trois conditions suivantes sontsatisfaites :

- L2 entretient une relation sémantique avec L[. Dans le cas plus typique, L2

se définit en terme de L,.Par exemple, la lexie HACHE [= L2] est définie en terme de COUPER [= L,],car le sens 'hache' - 'artefact servant à couper...'.

- La relation sémantique entre L2 et L-j est récurrente dans la langue.Par exemple, la relation entre HACHE et COUPER, 'artefact servant à...", estrécurrente en français : FRAPPER -» MARTEAU, OUVRIR [une porte] -> CLÉ,

FUMER -> PIPE, etc.

- La relation entre L-j et L2 s'exprime fréquemment de façon morphologique.Par exemple, pour la relation 'artefact servant à...", on trouve en françaisles dérivations suffixales suivantes : bouch(-er) -> bouch+on, ras(-er) -»ras+oir, décapsul(-er) » décapsul+eur, etc.

Puisque la relation sémantique qui lie HACHE à COUPER satisfait les troisconditions ci-dessus, nous pouvons dire que la lexie HACHE est sémantique¬ment dérivée de COUPER.

Remarquons qu'un lien de dérivation sémantique qui est marqué explicite¬ment par un moyen morphologique correspond à une dérivation au sens

68

Page 5: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

traditionnel. La dérivation au sens traditionnel est donc un cas particulier dedérivation sémantique.

On peut identifier trois grandes familles de dérivations sémantiquescorrespondant aux trois cas de figure ci-dessous.

1 . Les deux lexies possèdent (approximativement) le même sens. 11 s'agit icid'une dérivation sémantique (quasi) vide, qui correspond aux cas bienconnus suivants :

-synonymie exacte ou approximative (bicyclette -> vélo; interdire -»défendre) ;

- conversion exacte ou approximative (X précède Y -> Y suit X ; X donne Y aZ^Z reçoit Y de X) ;

- changement de partie du discours (marchander -> marchandage, vendre ->vente, frapper -^ coup ; terrestre est l'adjectif pour [relatif à la] terre, paternelpour [relatif au] père, urbain pour [relatif à la] ville).

Par convention, on inclut également dans cette première famille les termesgénériques (cours d'eau pour rivière, légume pour haricot...).

2. Les deux lexies possèdent des sens opposés (interdire et autoriser, petit etgrand...). 11 s'agit ici de l'antonymie exacte ou approximative.

3. Une des deux lexies désigne un élément de la situation désignée parl'autre. 11 peut s'agir d'un participant (nager -» nageur, envoyer [qqch. par laposte] -» destinataire, accident -» victime...), d'un circonstant (dormir -> ///,patiner -> patinoire...) ou d'une caractéristique d'un participant ou circons¬tant (s'irriter -> irritable, comprendre -> compréhensible...).

1.1.1. Les collocations

La notion de collocation, telle que nous l'entendons, correspond à celleprésentée dans Hausmann (1979), et qui a été clairement mise en avant sous lenom de série phraséologique dans Bally (1909) L Elle est au centre du présentnuméro de Langue française et notre perspective sur cette notion n'est pas radi¬calement différente de celle de la plupart des auteurs qui participent à cettepublication. Nous allons néanmoins présenter la collocation selon nos proprestermes, notamment afin de mieux établir la connexion théorique et descriptiveentre le phénomène des collocations et celui des dérivations sémantiques, quivient juste d'être examiné.

Pour expliciter la notion de « collocation », nous commencerons par quel¬ques exemples. Supposons qu'afin de caractériser une entité physique quel¬conque un locuteur cherche à exprimer le sens 'dont le volume physique estplus important que la moyenne'. Pour exprimer le sens en question, le locu¬teur a à sa disposition l'adjectif gros. Peu importe l'entité, il pourra presquetoujours utiliser gros : un gros cheval, une grosse mouche, un gros sandwich... Siune lexie française sert à désigner une entité physique ayant un volume, elle

1. Pour une définition rigoureuse, faite dans le cadre de la théorie Sens-Texte, cf. Mel'cuk (1995 :

1S2 sq), Mel'cuk (2003a : 23 sq) ou Mel'cuk (2003b : 24 sq).

LANGUE FRANÇAISE \H 69

Dérivations sémantiques et collocations dans le DiCo/LAF

traditionnel. La dérivation au sens traditionnel est donc un cas particulier dedérivation sémantique.

On peut identifier trois grandes familles de dérivations sémantiquescorrespondant aux trois cas de figure ci-dessous.

1 . Les deux lexies possèdent (approximativement) le même sens. 11 s'agit icid'une dérivation sémantique (quasi) vide, qui correspond aux cas bienconnus suivants :

-synonymie exacte ou approximative (bicyclette -> vélo; interdire -»défendre) ;

- conversion exacte ou approximative (X précède Y -> Y suit X ; X donne Y aZ^Z reçoit Y de X) ;

- changement de partie du discours (marchander -> marchandage, vendre ->vente, frapper -^ coup ; terrestre est l'adjectif pour [relatif à la] terre, paternelpour [relatif au] père, urbain pour [relatif à la] ville).

Par convention, on inclut également dans cette première famille les termesgénériques (cours d'eau pour rivière, légume pour haricot...).

2. Les deux lexies possèdent des sens opposés (interdire et autoriser, petit etgrand...). 11 s'agit ici de l'antonymie exacte ou approximative.

3. Une des deux lexies désigne un élément de la situation désignée parl'autre. 11 peut s'agir d'un participant (nager -» nageur, envoyer [qqch. par laposte] -» destinataire, accident -» victime...), d'un circonstant (dormir -> ///,patiner -> patinoire...) ou d'une caractéristique d'un participant ou circons¬tant (s'irriter -> irritable, comprendre -> compréhensible...).

1.1.1. Les collocations

La notion de collocation, telle que nous l'entendons, correspond à celleprésentée dans Hausmann (1979), et qui a été clairement mise en avant sous lenom de série phraséologique dans Bally (1909) L Elle est au centre du présentnuméro de Langue française et notre perspective sur cette notion n'est pas radi¬calement différente de celle de la plupart des auteurs qui participent à cettepublication. Nous allons néanmoins présenter la collocation selon nos proprestermes, notamment afin de mieux établir la connexion théorique et descriptiveentre le phénomène des collocations et celui des dérivations sémantiques, quivient juste d'être examiné.

Pour expliciter la notion de « collocation », nous commencerons par quel¬ques exemples. Supposons qu'afin de caractériser une entité physique quel¬conque un locuteur cherche à exprimer le sens 'dont le volume physique estplus important que la moyenne'. Pour exprimer le sens en question, le locu¬teur a à sa disposition l'adjectif gros. Peu importe l'entité, il pourra presquetoujours utiliser gros : un gros cheval, une grosse mouche, un gros sandwich... Siune lexie française sert à désigner une entité physique ayant un volume, elle

1. Pour une définition rigoureuse, faite dans le cadre de la théorie Sens-Texte, cf. Mel'cuk (1995 :

1S2 sq), Mel'cuk (2003a : 23 sq) ou Mel'cuk (2003b : 24 sq).

LANGUE FRANÇAISE \H 69

Page 6: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

peut toujours être modifiée par gros (ou grosse). Les combinaisons ^rus cheval,grosse mouche, gros sandxoich... sont, donc, des combinaisons « libres » delexies. Pour les construire, le locuteur se contente de sélectionner des lexiesexprimant chacune un sens donné, puis de les combiner en se conformantsimplement aux règles grammaticales de la langue.

Examinons maintenant un cas de figure tout différent. Supposons que lelocuteur veuille exprimer auprès d'un sens lexical donné un sens beaucoupplus vague comme 'très, intense, important", c'est-à-dire l'intensification. 11

existe une foule de lexies pouvant exprimer ce sens, mais le choix de la lexieappropriée n'est pas libre : il dépend de la lexie dont le locuteur veut intensi¬fier le sens. Ainsi, il dira

- pour argument : argument massue, de poids... ;

- pour brouillard : brouillard dense, épais, opaque, à couper au couteau ;

- pour méchant : méchant comme la gale, comme une teigne ;

- pour dormir : dormir comme un loir, à poings fermés.. .

Ce sont ces expressions que nous appelons collocations et qui, avec les déri¬vations sémantiques, sont au c de la description lexicographique du DiCo.De façon non formelle, on pourrait définir la collocation de la façon suivante :

Une collocation est une combinaison de lexies qui est construite en fonction decontraintes bien particulières : elle est constituée d'une base, que le locuteur choisitlibrement en fonction de ce qu'il veut exprimer (argument, brouillard, méchant...), etd'un collocatif (massue pour argument, dense pour brouillard, connue une teigne pourméchant...), choisi pour exprimer un sens donné (ici, 'intense') en fonction de la base.

Notons qu'un collocatif n'est pas nécessairement un lexème (lexie mono¬lexicale). 11 peut être une locution (à couper au couteau, comme une teigne...) ;

cela est même très souvent le cas, notamment pour les collocatifs à valeurmétaphorique.

Les collocations décrites dans le DiCo peuvent correspondre à l'expressionde sens aussi variés que, par exemple :

- l'atténuation (c'est-à-dire, l'opposé de l'intensification) : un sommeil léger ;

- l'évaluation positive : une phrase bien faite, bien tournée, élégante ;

- l'évaluation négative : une phrase mal faite, mal tournée, maladroite.Dans un nombre élevé de collocations d'un type fort différent - colloca¬

tions de verbes supports - le collocatif ne sert pas à exprimer un sens donnémais à « supporter syntaxiquement » le nom qui est la base de la collocation.Ainsi, pour exprimer verbalement le groupe nominal la résistance de Jean face à

Pierre on peut dire Jean oppose une résistance à Pierre. Si l'on veut un verbesupport qui prenne Pierre, et non Jean, comme sujet grammatical, on diraPierre se heurte à la résistance de Jean.

Voici deux autres exemples présentant le même type de contraste :

Jean apporte son aide à Pierre. ~ Pierre reçoit de l'aide de Jean.

Jean donne un cours à Pierre. ~ Pierre suit un cours de Jean.

Ces exemples donnent une idée intuitive de ce que recouvre la notion de« collocation », dans notre perspective. C'est un phénomène omniprésent

70

Collocations, corpus, dictionnaires

peut toujours être modifiée par gros (ou grosse). Les combinaisons ^rus cheval,grosse mouche, gros sandxoich... sont, donc, des combinaisons « libres » delexies. Pour les construire, le locuteur se contente de sélectionner des lexiesexprimant chacune un sens donné, puis de les combiner en se conformantsimplement aux règles grammaticales de la langue.

Examinons maintenant un cas de figure tout différent. Supposons que lelocuteur veuille exprimer auprès d'un sens lexical donné un sens beaucoupplus vague comme 'très, intense, important", c'est-à-dire l'intensification. 11

existe une foule de lexies pouvant exprimer ce sens, mais le choix de la lexieappropriée n'est pas libre : il dépend de la lexie dont le locuteur veut intensi¬fier le sens. Ainsi, il dira

- pour argument : argument massue, de poids... ;

- pour brouillard : brouillard dense, épais, opaque, à couper au couteau ;

- pour méchant : méchant comme la gale, comme une teigne ;

- pour dormir : dormir comme un loir, à poings fermés.. .

Ce sont ces expressions que nous appelons collocations et qui, avec les déri¬vations sémantiques, sont au c de la description lexicographique du DiCo.De façon non formelle, on pourrait définir la collocation de la façon suivante :

Une collocation est une combinaison de lexies qui est construite en fonction decontraintes bien particulières : elle est constituée d'une base, que le locuteur choisitlibrement en fonction de ce qu'il veut exprimer (argument, brouillard, méchant...), etd'un collocatif (massue pour argument, dense pour brouillard, connue une teigne pourméchant...), choisi pour exprimer un sens donné (ici, 'intense') en fonction de la base.

Notons qu'un collocatif n'est pas nécessairement un lexème (lexie mono¬lexicale). 11 peut être une locution (à couper au couteau, comme une teigne...) ;

cela est même très souvent le cas, notamment pour les collocatifs à valeurmétaphorique.

Les collocations décrites dans le DiCo peuvent correspondre à l'expressionde sens aussi variés que, par exemple :

- l'atténuation (c'est-à-dire, l'opposé de l'intensification) : un sommeil léger ;

- l'évaluation positive : une phrase bien faite, bien tournée, élégante ;

- l'évaluation négative : une phrase mal faite, mal tournée, maladroite.Dans un nombre élevé de collocations d'un type fort différent - colloca¬

tions de verbes supports - le collocatif ne sert pas à exprimer un sens donnémais à « supporter syntaxiquement » le nom qui est la base de la collocation.Ainsi, pour exprimer verbalement le groupe nominal la résistance de Jean face à

Pierre on peut dire Jean oppose une résistance à Pierre. Si l'on veut un verbesupport qui prenne Pierre, et non Jean, comme sujet grammatical, on diraPierre se heurte à la résistance de Jean.

Voici deux autres exemples présentant le même type de contraste :

Jean apporte son aide à Pierre. ~ Pierre reçoit de l'aide de Jean.

Jean donne un cours à Pierre. ~ Pierre suit un cours de Jean.

Ces exemples donnent une idée intuitive de ce que recouvre la notion de« collocation », dans notre perspective. C'est un phénomène omniprésent

70

Page 7: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

dans la langue. 11 relève, en outre, d'une compétence linguistique difficile à

acquérir. En effet, pour un grand nombre de lexies de la langue, le locuteur estamené à mémoriser des séries de collocatifs, qui s'opposent parfois par desdistinctions sémantiques fines et qui ont des comportements syntaxiques trèsspécifiques. Ainsi, pour le nom fortune, il est possible de dire faire fortune, sansarticle, alors que l'article est obligatoire lorsque l'on utilise le verbe accumuler :

accumuler une fortune vs ^accumuler fortune.

Nous allons maintenant aborder l'aspect véritablement original de lamodélisation des collocations faite dans le DiCo (et dans toute modélisationexplicative et combinatoire) en explicitant ce qui réunit logiquement les deuxnotions de « dérivation sémantique » et de « collocation ».

2.3. Dérivations sémantiques et collocations comme manifestationsd'un même phénomène conceptuel

Ce qui caractérise véritablement la modélisation d'une base lexicale du typeDiCo est le fait que les notions en question sont vues comme reposant toutesdeux sur la notion beaucoup plus générale de lien lexical orienté.

- Une dérivation sémantique est une relation particulière entre deux lexies :

une lexie de départ et une lexie « sémantiquement construite » à partir decelle-ci. 11 s'agit donc d'un lien lexical orienté : de la base de la dérivationvers le dérivé.

- Une collocation est une expression linguistique constituée de deux lexies,dont l'une - la base - contrôle l'emploi de l'autre - le collocatif. Une collo¬cation n'est donc pas une relation. Cependant, chaque collocation présup¬pose une relation particulière de « contrôle » entre les deux lexies qui laconstituent : la base contrôle le choix du collocatif. Ce contrôle est éçale-ment un lien lexical orienté : de la base de la collocation vers le collocatif.

Puisque dans les deux cas nous sommes en présence de liens lexicauxorientés, il est possible de modéliser les deux phénomènes au moyen d'unmême outil descriptif. 11 s'agit de pointeurs qui, pour chaque lexie décritedans un article de dictionnaire, spécifient ses dérivés sémantiques et ses collo¬catifs ; par exemple :

couper - instrument -» hacheméchant - intensificateur > comme la valeméchant - intensificateur > comme une teigne

La description des liens lexicaux offerte par le DiCo - comme par toutemodélisation du type Dictionnaire explicatif et combinatoire (Mel'cuk et al. 1984,1988, 1992, 1999) - s'appuie sur un ensemble restreint de patrons de liens lexi¬caux dérivationnels et collocationnels, qui sont des liens lexicaux standard.Chaque lien lexical standard est modélisé comme une « fonction », au sensmathématique, qui s'applique aux lexies pour retourner la liste de leursdérivés sémantiques ou de leurs collocatifs. On peut donc écrire, en s'inspi-rant du formalisme mathématique f (x) = y :

Lien lexical(lexie) = expressions possibles du lien

LANGUE FRANÇAISE M 71

Dérivations sémantiques et collocations dans le DiCo/LAF

dans la langue. 11 relève, en outre, d'une compétence linguistique difficile à

acquérir. En effet, pour un grand nombre de lexies de la langue, le locuteur estamené à mémoriser des séries de collocatifs, qui s'opposent parfois par desdistinctions sémantiques fines et qui ont des comportements syntaxiques trèsspécifiques. Ainsi, pour le nom fortune, il est possible de dire faire fortune, sansarticle, alors que l'article est obligatoire lorsque l'on utilise le verbe accumuler :

accumuler une fortune vs ^accumuler fortune.

Nous allons maintenant aborder l'aspect véritablement original de lamodélisation des collocations faite dans le DiCo (et dans toute modélisationexplicative et combinatoire) en explicitant ce qui réunit logiquement les deuxnotions de « dérivation sémantique » et de « collocation ».

2.3. Dérivations sémantiques et collocations comme manifestationsd'un même phénomène conceptuel

Ce qui caractérise véritablement la modélisation d'une base lexicale du typeDiCo est le fait que les notions en question sont vues comme reposant toutesdeux sur la notion beaucoup plus générale de lien lexical orienté.

- Une dérivation sémantique est une relation particulière entre deux lexies :

une lexie de départ et une lexie « sémantiquement construite » à partir decelle-ci. 11 s'agit donc d'un lien lexical orienté : de la base de la dérivationvers le dérivé.

- Une collocation est une expression linguistique constituée de deux lexies,dont l'une - la base - contrôle l'emploi de l'autre - le collocatif. Une collo¬cation n'est donc pas une relation. Cependant, chaque collocation présup¬pose une relation particulière de « contrôle » entre les deux lexies qui laconstituent : la base contrôle le choix du collocatif. Ce contrôle est éçale-ment un lien lexical orienté : de la base de la collocation vers le collocatif.

Puisque dans les deux cas nous sommes en présence de liens lexicauxorientés, il est possible de modéliser les deux phénomènes au moyen d'unmême outil descriptif. 11 s'agit de pointeurs qui, pour chaque lexie décritedans un article de dictionnaire, spécifient ses dérivés sémantiques et ses collo¬catifs ; par exemple :

couper - instrument -» hacheméchant - intensificateur > comme la valeméchant - intensificateur > comme une teigne

La description des liens lexicaux offerte par le DiCo - comme par toutemodélisation du type Dictionnaire explicatif et combinatoire (Mel'cuk et al. 1984,1988, 1992, 1999) - s'appuie sur un ensemble restreint de patrons de liens lexi¬caux dérivationnels et collocationnels, qui sont des liens lexicaux standard.Chaque lien lexical standard est modélisé comme une « fonction », au sensmathématique, qui s'applique aux lexies pour retourner la liste de leursdérivés sémantiques ou de leurs collocatifs. On peut donc écrire, en s'inspi-rant du formalisme mathématique f (x) = y :

Lien lexical(lexie) = expressions possibles du lien

LANGUE FRANÇAISE M 71

Page 8: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

Pour reprendre les séries d'exemples ci-dessus :

Instruirtent(coHUi'r) = hache...Intensif icate\ir(méchant) = comme la gale, comme une teigne...

Chaque FL standard modélisant un type de lien particulier porte un nomspécifique, que l'on retrouvera dans l'encodage du lien en question quelle quesoit la langue décrite par le dictionnaire explicatif et combinatoire. Ainsi, lafonction retournant les noms d'instruments s'appelle Sinstr ; celle retournantles collocatifs intensificateurs s'appelle Magn. Les formules ci-dessus peuventdonc se réécrire :

Sinstr(co»pc?") = hache...Ma.gn(méchant) = comme la gale, comme une teigne...

Tout lecteur connaissant les principes de base de la lexicologie explicative etcombinatoire reconnaîtra ici les formules d'encodage faisant appel aux FL.Rappelons que la lexie apparaissant entre parenthèses dans de telles formules(couper, méchant...) est appelée l'argument de la FL, et la liste de lexies ou delocutions qui suit le signe d'égalité est appelée la valeur retournée par l'appli¬cation de la FL à l'argument en question. Les FL standard forment un véritablesystème, à la structure très riche, qu'il ne nous appartient pas d'introduire ici- pour une courte introduction, cf. notamment Polguère (2003a : 129-142), etpour une présentation détaillée, cf. Mel'cuk et al. (1995 : 125-152).

Le système des FL est particulièrement puissant puisqu'il offre un mêmeoutil formel pour modéliser tous les types de liens lexicaux contrôlés par leslexies, et cela pour n'importe quelle langue. 11 permet de réunir des phéno¬mènes qui sont la plupart du temps considérés séparément - autant enlinguistique qu'en lexicographie ou en linguistique appliquée à l'enseigne¬ment - alors qu'en fait ils relèvent tous « en profondeur » de la notion de lienlexical. On remarque que, lorsque les dérivations sémantiques et les contrôlescollocationnels sont réunis dans la littérature linguistique sous la mêmenotion de lien lexical, c'est pour être traités séparément en tant que liens lexi¬caux paradigmatiques vs liens lexicaux syntagmatiques. Or, si nous adhéronsà cette distinction fondamentale (cf. les FL paradigmatiques î»s syntagmati¬ques), nous sommes convaincus que la frontière entre les deux types de liensn'est pas étanche par nature, et cela, pour au moins deux raisons.

Premièrement, l'activation des liens lexicaux en parole est au cur du fonc¬tionnement de la paraphrase linguistique - Mel'cuk (1992), Milicevic (2003).Or, les liens de paraphrase reposent très souvent sur des égalités de structuresqui mettent en jeu clés FL paradigmatiques et syntagmatiques. Par exemple,l'équivalence très générale suivante démontre le lien profond qui unit la notionde verbe support et celle de dérivation sémantique vide de type verbal :

Oper^D + L^V^L)

Cette « règle de paraphrasage » très simple permet de rendre compte deséquivalences sémantiques suivantes :

pousser\= Oper1(L)] un soupir\= L] = $oupirer[= V0(soupir)]commettre[- Oper^L)] un assassinal[= L] = assassiner[= vQ(assassinat)]

72

Collocations, corpus, dictionnaires

Pour reprendre les séries d'exemples ci-dessus :

Instruirtent(coHUi'r) = hache...Intensif icate\ir(méchant) = comme la gale, comme une teigne...

Chaque FL standard modélisant un type de lien particulier porte un nomspécifique, que l'on retrouvera dans l'encodage du lien en question quelle quesoit la langue décrite par le dictionnaire explicatif et combinatoire. Ainsi, lafonction retournant les noms d'instruments s'appelle Sinstr ; celle retournantles collocatifs intensificateurs s'appelle Magn. Les formules ci-dessus peuventdonc se réécrire :

Sinstr(co»pc?") = hache...Ma.gn(méchant) = comme la gale, comme une teigne...

Tout lecteur connaissant les principes de base de la lexicologie explicative etcombinatoire reconnaîtra ici les formules d'encodage faisant appel aux FL.Rappelons que la lexie apparaissant entre parenthèses dans de telles formules(couper, méchant...) est appelée l'argument de la FL, et la liste de lexies ou delocutions qui suit le signe d'égalité est appelée la valeur retournée par l'appli¬cation de la FL à l'argument en question. Les FL standard forment un véritablesystème, à la structure très riche, qu'il ne nous appartient pas d'introduire ici- pour une courte introduction, cf. notamment Polguère (2003a : 129-142), etpour une présentation détaillée, cf. Mel'cuk et al. (1995 : 125-152).

Le système des FL est particulièrement puissant puisqu'il offre un mêmeoutil formel pour modéliser tous les types de liens lexicaux contrôlés par leslexies, et cela pour n'importe quelle langue. 11 permet de réunir des phéno¬mènes qui sont la plupart du temps considérés séparément - autant enlinguistique qu'en lexicographie ou en linguistique appliquée à l'enseigne¬ment - alors qu'en fait ils relèvent tous « en profondeur » de la notion de lienlexical. On remarque que, lorsque les dérivations sémantiques et les contrôlescollocationnels sont réunis dans la littérature linguistique sous la mêmenotion de lien lexical, c'est pour être traités séparément en tant que liens lexi¬caux paradigmatiques vs liens lexicaux syntagmatiques. Or, si nous adhéronsà cette distinction fondamentale (cf. les FL paradigmatiques î»s syntagmati¬ques), nous sommes convaincus que la frontière entre les deux types de liensn'est pas étanche par nature, et cela, pour au moins deux raisons.

Premièrement, l'activation des liens lexicaux en parole est au cur du fonc¬tionnement de la paraphrase linguistique - Mel'cuk (1992), Milicevic (2003).Or, les liens de paraphrase reposent très souvent sur des égalités de structuresqui mettent en jeu clés FL paradigmatiques et syntagmatiques. Par exemple,l'équivalence très générale suivante démontre le lien profond qui unit la notionde verbe support et celle de dérivation sémantique vide de type verbal :

Oper^D + L^V^L)

Cette « règle de paraphrasage » très simple permet de rendre compte deséquivalences sémantiques suivantes :

pousser\= Oper1(L)] un soupir\= L] = $oupirer[= V0(soupir)]commettre[- Oper^L)] un assassinal[= L] = assassiner[= vQ(assassinat)]

72

Page 9: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

Deuxièmement, le contenu d'un collocatif, d'un Magn par exemple, peut toutà tait s'exprimer de façon fusionnée, c'est-à-dire au moyen d'une lexie quin'est pas un collocatif de l'argument de Magn mais plutôt un synonyme plusspécifique, incluant le sens d'intensification. Dans nos descriptions, nous indi¬quons une valeur fusionnée au moyen de l'opérateur //. Comparons, parexemple, les différentes valeurs de Magn de l'acception de base de PAUVRETÉci-dessous, que nous avons extraites du DiCo :

grande I antépos < absolue, extrême //misère.

Contrairement aux adjectifs grande, profonde, etc., le nom misère n'est pasun collocatif de pauvreté, mais un « substitut ». II s'agit d'une lexie qui entre¬tient un lien paradigmatique de quasi-synonymie avec PAUVRETÉ, tout enétant un Magn de cette lexie !

On voit à quel point le système des FL, appliqué à la lettre, nous force à consi¬dérer ensemble les notions de liens paradigmatiques et de liens syntagmatiques.Pour qui croit en la séparation profonde, conceptuelle, de ces deux notions, c'estclairement une tare du système en question. Mais pour celui qui, au contraire,pense que ces deux types de liens sont intrinsèquement liés du point de vue del'utilisation du code linguistique par le locuteur, c'est un bénéfice considérable.Cette remarque nous permet d'avancer ce qui est peut-être notre slogan quant à

la modélisation des collocations et des dérivations sémantiques.

Le système des FL standard, plus qu'un outil d'encodage, est un outil d'explora¬tion et de modélisation des liens lexicaux paradigmatiques et syntagmatiques,ces deux types de liens devant être considérés simultanément.

Une telle approche distingue radicalement le DiCo des dictionnaires decollocations proprement dits, même lorsqu'il s'agit de dictionnaires conçusselon une perspective très « linguistique » comme Benson et al. (1997) ouCrowther et al. (2002), pour l'anglais.

2.4. Autres propriétés lexicales décrites dans le DiCo

Le DiCo n'est pas un simple répertoire de dérivations sémantiques et de collo¬cations. 11 s'agit véritablement d'une base lexicographique décrivant les lexiesdu français. Même si cette base se focalise sur la description des liens de FLcontrôlés par les lexies, elle vise une modélisation de toutes leurs propriétésde combinatoire. A cette fin, on trouve dans le DiCo, outre les liens de FL,quatre autres types de propriétés associées à chaque lexie : ses caractéristiquesgrammaticales, son étiquette sémantique, sa forme propositionnelle et sonrégime syntaxique.

Caractéristiques grammaticales11 s'agit des propriétés de combinatoire qui sont avant tout d'ordre gram¬

matical comme la partie du discours, le genre grammatical (pour les noms),les restrictions liées à l'emploi du défini/indéfini ou du nombre (pour lesnoms), etc. On considère ici aussi les contraintes d'emploi de nature pluspragmatique, comme celles dont rendent compte les marques d'usage (formel,familier, vulgaire, etc.).

LANGUE FRANÇAISE 73

Dérivations sémantiques et collocations dans le DiCo/LAF

Deuxièmement, le contenu d'un collocatif, d'un Magn par exemple, peut toutà tait s'exprimer de façon fusionnée, c'est-à-dire au moyen d'une lexie quin'est pas un collocatif de l'argument de Magn mais plutôt un synonyme plusspécifique, incluant le sens d'intensification. Dans nos descriptions, nous indi¬quons une valeur fusionnée au moyen de l'opérateur //. Comparons, parexemple, les différentes valeurs de Magn de l'acception de base de PAUVRETÉci-dessous, que nous avons extraites du DiCo :

grande I antépos < absolue, extrême //misère.

Contrairement aux adjectifs grande, profonde, etc., le nom misère n'est pasun collocatif de pauvreté, mais un « substitut ». II s'agit d'une lexie qui entre¬tient un lien paradigmatique de quasi-synonymie avec PAUVRETÉ, tout enétant un Magn de cette lexie !

On voit à quel point le système des FL, appliqué à la lettre, nous force à consi¬dérer ensemble les notions de liens paradigmatiques et de liens syntagmatiques.Pour qui croit en la séparation profonde, conceptuelle, de ces deux notions, c'estclairement une tare du système en question. Mais pour celui qui, au contraire,pense que ces deux types de liens sont intrinsèquement liés du point de vue del'utilisation du code linguistique par le locuteur, c'est un bénéfice considérable.Cette remarque nous permet d'avancer ce qui est peut-être notre slogan quant à

la modélisation des collocations et des dérivations sémantiques.

Le système des FL standard, plus qu'un outil d'encodage, est un outil d'explora¬tion et de modélisation des liens lexicaux paradigmatiques et syntagmatiques,ces deux types de liens devant être considérés simultanément.

Une telle approche distingue radicalement le DiCo des dictionnaires decollocations proprement dits, même lorsqu'il s'agit de dictionnaires conçusselon une perspective très « linguistique » comme Benson et al. (1997) ouCrowther et al. (2002), pour l'anglais.

2.4. Autres propriétés lexicales décrites dans le DiCo

Le DiCo n'est pas un simple répertoire de dérivations sémantiques et de collo¬cations. 11 s'agit véritablement d'une base lexicographique décrivant les lexiesdu français. Même si cette base se focalise sur la description des liens de FLcontrôlés par les lexies, elle vise une modélisation de toutes leurs propriétésde combinatoire. A cette fin, on trouve dans le DiCo, outre les liens de FL,quatre autres types de propriétés associées à chaque lexie : ses caractéristiquesgrammaticales, son étiquette sémantique, sa forme propositionnelle et sonrégime syntaxique.

Caractéristiques grammaticales11 s'agit des propriétés de combinatoire qui sont avant tout d'ordre gram¬

matical comme la partie du discours, le genre grammatical (pour les noms),les restrictions liées à l'emploi du défini/indéfini ou du nombre (pour lesnoms), etc. On considère ici aussi les contraintes d'emploi de nature pluspragmatique, comme celles dont rendent compte les marques d'usage (formel,familier, vulgaire, etc.).

LANGUE FRANÇAISE 73

Page 10: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

Étiquette sémantiqueL'étiquette sémantique d'une lexie est un lexème ou un syntagme qui fonc¬

tionne comme genre prochain de sa définition lexicographique - cf. Polguère(2003b). Les étiquettes sont souvent utiles pour distinguer les différentesacceptions d'un vocable. Cependant, leur intérêt va bien au-delà. En effet,l'étiquette sémantique résume la « quintessence sémantique » de la lexie etpermet donc d'effectuer des prédictions très fortes quant aux liens de FL quecelle-ci peut contrôler. De plus, parce qu'il engendre une classification desunités lexicales, le système d'étiquetage du DiCo permet au lexicographe(comme à l'usager) de facilement récupérer les données sur les lexies ayantune forte parenté de sens.

Structure actancielleLa structure actancielle de la lexie est sa caractérisation en tant que

prédicat sémantique. 11 existe bien entendu une forte corrélation entre struc¬ture actancielle et étiquette sémantique. Par exemple, toute lexie étiquetéesentiment possédera au moins un premier actant correspondant à l'êtreanimé éprouvant le sentiment en question ; dans de très nombreux cas, il yaura aussi un deuxième actant, correspondant à la source du sentiment. Autreexemple : les lexies étiquetées confrontations d' idées - comme DÉ13AT1

[Un débat entre partisans et adversaires de la peine capitale agite la société.], dont ilsera question plus loin - ont typiquement une structure actancielle à troisactants "~ entre X et Y à propos de Z\

Régime syntaxiqueLe régime syntaxique de la lexie est la correspondance entre ses actants

sémantiques, syntaxiques profonds, syntaxiques de surface et leurs expres¬sions dans la phrase. Il s'agit donc de la façon dont une lexie contrôle l'expres¬sion de sa structure actancielle.

L'approche descriptive du DiCo et, plus généralement, de la lexicologieexplicative et combinatoire repose sur le postulat que toutes les propriétés quiviennent d'être énumérées sont interconnectées et doivent être considéréessimultanément dans le cadre de l'activité lexicographique. En fait, le travailsur un vocable particulier commence par une première hypothèse faite sur lastructure polysémique du vocable, qui s'accompagne d'une ébauche rapidede caractérisation de chaque acception en termes de propriétés grammati¬cales, étiquette sémantique, structure actancielle et régime. On commenceensuite à réunir autour de chaque lexie un premier ensemble de liens de FLqu'elle contrôle. Cela nous amène souvent à revenir sur nos hypothèsespremières, et la suite du travail va se faire par affinements successifs et correc¬tions sur les hypothèses de départ. On peut considérer qu'il s'établit une sortede dialogue entre toutes les caractéristiques d'une lexie décrite, qui fait qu'ilest pratiquement impossible de considérer une caractéristique spécifique defaçon isolée.

74

Collocations, corpus, dictionnaires

Étiquette sémantiqueL'étiquette sémantique d'une lexie est un lexème ou un syntagme qui fonc¬

tionne comme genre prochain de sa définition lexicographique - cf. Polguère(2003b). Les étiquettes sont souvent utiles pour distinguer les différentesacceptions d'un vocable. Cependant, leur intérêt va bien au-delà. En effet,l'étiquette sémantique résume la « quintessence sémantique » de la lexie etpermet donc d'effectuer des prédictions très fortes quant aux liens de FL quecelle-ci peut contrôler. De plus, parce qu'il engendre une classification desunités lexicales, le système d'étiquetage du DiCo permet au lexicographe(comme à l'usager) de facilement récupérer les données sur les lexies ayantune forte parenté de sens.

Structure actancielleLa structure actancielle de la lexie est sa caractérisation en tant que

prédicat sémantique. 11 existe bien entendu une forte corrélation entre struc¬ture actancielle et étiquette sémantique. Par exemple, toute lexie étiquetéesentiment possédera au moins un premier actant correspondant à l'êtreanimé éprouvant le sentiment en question ; dans de très nombreux cas, il yaura aussi un deuxième actant, correspondant à la source du sentiment. Autreexemple : les lexies étiquetées confrontations d' idées - comme DÉ13AT1

[Un débat entre partisans et adversaires de la peine capitale agite la société.], dont ilsera question plus loin - ont typiquement une structure actancielle à troisactants "~ entre X et Y à propos de Z\

Régime syntaxiqueLe régime syntaxique de la lexie est la correspondance entre ses actants

sémantiques, syntaxiques profonds, syntaxiques de surface et leurs expres¬sions dans la phrase. Il s'agit donc de la façon dont une lexie contrôle l'expres¬sion de sa structure actancielle.

L'approche descriptive du DiCo et, plus généralement, de la lexicologieexplicative et combinatoire repose sur le postulat que toutes les propriétés quiviennent d'être énumérées sont interconnectées et doivent être considéréessimultanément dans le cadre de l'activité lexicographique. En fait, le travailsur un vocable particulier commence par une première hypothèse faite sur lastructure polysémique du vocable, qui s'accompagne d'une ébauche rapidede caractérisation de chaque acception en termes de propriétés grammati¬cales, étiquette sémantique, structure actancielle et régime. On commenceensuite à réunir autour de chaque lexie un premier ensemble de liens de FLqu'elle contrôle. Cela nous amène souvent à revenir sur nos hypothèsespremières, et la suite du travail va se faire par affinements successifs et correc¬tions sur les hypothèses de départ. On peut considérer qu'il s'établit une sortede dialogue entre toutes les caractéristiques d'une lexie décrite, qui fait qu'ilest pratiquement impossible de considérer une caractéristique spécifique defaçon isolée.

74

Page 11: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

3. ENCODAGE DES DONNÉES DANS LE DICO

3.1. Structure des fiches lexicographiques du DiCo

Chaque lexie est décrite dans le DiCo au moyen d'une fiche lexicogra¬phique subdivisée en champs. La lexie décrite dans une fiche est appelée lemot-vedette de la fiche, et chaque champ contient un type d'information bienspécifique associé au mot-vedette.

Pour illustrer la structure et le contenu d'une fiche DiCo, nous utiliseronsla fiche de BOUILLIEll [Avec la chaleur, nos jolies pêches ne sont plus que de labouillie.], une des quatre acceptions du vocable BOUILLIE identifiée dans leDiCo2. Nous remettons à plus tard l'examen des données sur DÉBAT dans lamesure où les lexies de ce dernier vocable ont des fiches très riches etcomplexes, qu'il serait difficile d'utiliser pour simplement illustrer notreapproche. Voici donc le contenu des principaux champs de données lexicogra¬phiques de la fiche de BOUlLLlEÏl, telle qu'elle a été construite par les lexico¬graphes du DiCo.

Champ cg : caractéristiques grammaticalessinq, s'emploie surtout avec un modificateur

Champ Etiq. : étiquette sémantiqueentité physique endommagée

Champ fp : formule propositionnelle modélisant la structure actancielle du mot-vedette: [L'entité physique X EST DE LA] -

Champ tr : tableau de régime syntaxique

Champ nb : nota bene (ensemble assez hétérogène d'informations non encore formalisées)

Champ Syn : liens de FL associés à la synonymie (svnonvmes, quasi-svnonvmes, génériques, etc.)

{QSyn} nasse informe

Champ fl : tous les autres liens de FL (paradigmatiques et syntagmatiques){Epie} informe I postpos{Telle eue X est une partie eu corpsensanglantée} sanglante, sanguinolente I postpos

/* [X] être une B. */'{Operl} être [ART ~j , n'être eue [ART -]

/* i Qqn . /Qqch . ] causer que X sci't de la E.*/{CausOperl} réduire [N=X en AR? ~]

Champ ex : exemples d'emploi du mot-vedetteIl récuisit en une bouillie sanguinolente les entrailles ce la pauvrecréature. I Avec la chaleur, nos jolies pêches ne sont plus quede la bouillie.

Champ ph : émimération des phrasèmes complets (= locutions) construits avec le mot-vedette_en bouiliie_

Figure I : Fiche DiCo de la lexie BOUlLUEll

2. Les trois autres acceptions sont : BOUlU.IEI.l [11 mange nue bouillie d'avoine.], BOUILLIEI.2 |i/marchait dans une sorte de bouillie d'argile.] et BOUILUH1I1 [Si? thèse est nulle; c'est une bouillie d'idées

incohérentes.].

LANGUE FRANÇAIS! 75

Dérivations sémantiques et collocations dans le DiCo/LAF

3. ENCODAGE DES DONNÉES DANS LE DICO

3.1. Structure des fiches lexicographiques du DiCo

Chaque lexie est décrite dans le DiCo au moyen d'une fiche lexicogra¬phique subdivisée en champs. La lexie décrite dans une fiche est appelée lemot-vedette de la fiche, et chaque champ contient un type d'information bienspécifique associé au mot-vedette.

Pour illustrer la structure et le contenu d'une fiche DiCo, nous utiliseronsla fiche de BOUILLIEll [Avec la chaleur, nos jolies pêches ne sont plus que de labouillie.], une des quatre acceptions du vocable BOUILLIE identifiée dans leDiCo2. Nous remettons à plus tard l'examen des données sur DÉBAT dans lamesure où les lexies de ce dernier vocable ont des fiches très riches etcomplexes, qu'il serait difficile d'utiliser pour simplement illustrer notreapproche. Voici donc le contenu des principaux champs de données lexicogra¬phiques de la fiche de BOUlLLlEÏl, telle qu'elle a été construite par les lexico¬graphes du DiCo.

Champ cg : caractéristiques grammaticalessinq, s'emploie surtout avec un modificateur

Champ Etiq. : étiquette sémantiqueentité physique endommagée

Champ fp : formule propositionnelle modélisant la structure actancielle du mot-vedette: [L'entité physique X EST DE LA] -

Champ tr : tableau de régime syntaxique

Champ nb : nota bene (ensemble assez hétérogène d'informations non encore formalisées)

Champ Syn : liens de FL associés à la synonymie (svnonvmes, quasi-svnonvmes, génériques, etc.)

{QSyn} nasse informe

Champ fl : tous les autres liens de FL (paradigmatiques et syntagmatiques){Epie} informe I postpos{Telle eue X est une partie eu corpsensanglantée} sanglante, sanguinolente I postpos

/* [X] être une B. */'{Operl} être [ART ~j , n'être eue [ART -]

/* i Qqn . /Qqch . ] causer que X sci't de la E.*/{CausOperl} réduire [N=X en AR? ~]

Champ ex : exemples d'emploi du mot-vedetteIl récuisit en une bouillie sanguinolente les entrailles ce la pauvrecréature. I Avec la chaleur, nos jolies pêches ne sont plus quede la bouillie.

Champ ph : émimération des phrasèmes complets (= locutions) construits avec le mot-vedette_en bouiliie_

Figure I : Fiche DiCo de la lexie BOUlLUEll

2. Les trois autres acceptions sont : BOUlU.IEI.l [11 mange nue bouillie d'avoine.], BOUILLIEI.2 |i/marchait dans une sorte de bouillie d'argile.] et BOUILUH1I1 [Si? thèse est nulle; c'est une bouillie d'idées

incohérentes.].

LANGUE FRANÇAIS! 75

Page 12: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

11 est intéressant de s'arrêter brièvement sur le contenu du dernier champ(ph) de la fiche de BOUILLIEll. On voit que nous avons considéré qu'il existeune locution 'en BOUILLIE1. C'est cette locution qui est employée, par exemple,dans une phrase comme :

(1) Ce fui un horrible accident : ou l'a retrouvé en bouillie sur le bord de la route.

La modélisation de l'emploi de l'expression en bouillie dans la phrase ci-dessus ne relève pas de la fiche DiCo de BOUILLIEll, mais bien de celle de 'ENBOUILLIE1 (qui a d'ailleurs été rédigée dans le DiCo). L'expression en bouillieapparaissant en (1) ne doit pas être confondue avec celle apparaissant dans laphrase ci-dessous qui, elle, relève bien de la combinatoire de BOUILLIEll :

(2) Réduisez lotit d'abord les haricots rouges en une épaisse bouillie.

Le contenu de chacun des champs de la Figure 1 ainsi que le mode d'enco¬dage utilisé mériteraient d'être examinés en détail. Néanmoins, dans le cadredu présent article, nous devons nous concentrer sur la modélisation des liensde FL, c'est-à-dire sur le contenu des champs Syn et fl.

3.Z. Encodage des liens lexicaux

Les liens dérivationnels et collocationnels sont encodés dans le DiCo selonle schéma suivant :

'^Formule ce vulgarisation du lien ce fonction lexicaie>*/'(<Lien ce fonction lexicale>; 0.'ale::r>

Comme on peut le constater dans la Figure 1 ci-dessus, les formules devulgarisation décrivant les liens lexicaux sont basées sur un métalangagecompréhensible par tous - une sorte de français standardisé. Commentons unpeu plus en détail le contenu des champs Syn et fl de la Figure 1, en exami¬nant l'encodage de chaque lien de FL à tour de rôle.

Le premier lien encodé correspond à la quasi-synonymie :

\QSyr.} masse inferme

On notera que ce lien se présente sans formule de vulgarisation. En effet,nous ne vulgarisons pas les liens auxquels un dictionnaire grand publicdérivé du DiCo associerait toujours un même encodage vulgarisé, quelle quesoit la lexie. Par exemple, dans le LAF, les FL Syn et QSyn sont toujours trans¬crites par le symbole « '* ».

Nous quittons maintenant le champ des liens de nature synonymique,pour entrer dans celui contenant l'essentiel des liens de FL.

{Epit} informe I postpos

Epit désigne un modificateur redondant qui est un cliché langagier repre¬nant une composante sémantique du mot-vedette. En effet, bouillie informe estun pléonasme, qui est pourtant souvent utilisé et ne doit aucunement êtreconsidéré comme une erreur.

{Telle que X es: une partie du corpsensanglantée} sanglante, sanguinolente I postpos

Nous avons ici un lien de FL non standard qui encode une combinatoirecourante du mot-vedette. Les expressions bouillie sanglante et bouillie sanguino-

76

Collocations, corpus, dictionnaires

11 est intéressant de s'arrêter brièvement sur le contenu du dernier champ(ph) de la fiche de BOUILLIEll. On voit que nous avons considéré qu'il existeune locution 'en BOUILLIE1. C'est cette locution qui est employée, par exemple,dans une phrase comme :

(1) Ce fui un horrible accident : ou l'a retrouvé en bouillie sur le bord de la route.

La modélisation de l'emploi de l'expression en bouillie dans la phrase ci-dessus ne relève pas de la fiche DiCo de BOUILLIEll, mais bien de celle de 'ENBOUILLIE1 (qui a d'ailleurs été rédigée dans le DiCo). L'expression en bouillieapparaissant en (1) ne doit pas être confondue avec celle apparaissant dans laphrase ci-dessous qui, elle, relève bien de la combinatoire de BOUILLIEll :

(2) Réduisez lotit d'abord les haricots rouges en une épaisse bouillie.

Le contenu de chacun des champs de la Figure 1 ainsi que le mode d'enco¬dage utilisé mériteraient d'être examinés en détail. Néanmoins, dans le cadredu présent article, nous devons nous concentrer sur la modélisation des liensde FL, c'est-à-dire sur le contenu des champs Syn et fl.

3.Z. Encodage des liens lexicaux

Les liens dérivationnels et collocationnels sont encodés dans le DiCo selonle schéma suivant :

'^Formule ce vulgarisation du lien ce fonction lexicaie>*/'(<Lien ce fonction lexicale>; 0.'ale::r>

Comme on peut le constater dans la Figure 1 ci-dessus, les formules devulgarisation décrivant les liens lexicaux sont basées sur un métalangagecompréhensible par tous - une sorte de français standardisé. Commentons unpeu plus en détail le contenu des champs Syn et fl de la Figure 1, en exami¬nant l'encodage de chaque lien de FL à tour de rôle.

Le premier lien encodé correspond à la quasi-synonymie :

\QSyr.} masse inferme

On notera que ce lien se présente sans formule de vulgarisation. En effet,nous ne vulgarisons pas les liens auxquels un dictionnaire grand publicdérivé du DiCo associerait toujours un même encodage vulgarisé, quelle quesoit la lexie. Par exemple, dans le LAF, les FL Syn et QSyn sont toujours trans¬crites par le symbole « '* ».

Nous quittons maintenant le champ des liens de nature synonymique,pour entrer dans celui contenant l'essentiel des liens de FL.

{Epit} informe I postpos

Epit désigne un modificateur redondant qui est un cliché langagier repre¬nant une composante sémantique du mot-vedette. En effet, bouillie informe estun pléonasme, qui est pourtant souvent utilisé et ne doit aucunement êtreconsidéré comme une erreur.

{Telle que X es: une partie du corpsensanglantée} sanglante, sanguinolente I postpos

Nous avons ici un lien de FL non standard qui encode une combinatoirecourante du mot-vedette. Les expressions bouillie sanglante et bouillie sanguino-

76

Page 13: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

lente, bien que sémantiquement transparentes au niveau du décodage linguis¬tique, doivent être consignées dans le dictionnaire du fait de leur naturecollocationnelle. Elles représentent des clichés propres au français, que lelocuteur doit avoir appris.

/* [X] être une 3.*/{Operl} être [ART ~] , n'être que [ART ~:

/* [Qqn. /Qqch. ] causer que X soit de la B.*/{CausOperl} réduire [N=X en ART ~]

La FL Oper-L représente les verbes supports qui prennent le mot-vedettecomme complément et l'expression du premier actant de celui-ci comme sujet.CausOper-L encode un collocatif causatif, pour le même type de structuresyntaxique. On voit que les formules de vulgarisation qui précèdent les enco¬dages formels permettent de « court-circuiter » le recours aux formules de FLen paraphrasant les expressions décrites.

La technique de la vulgarisation des liens de FL, outre qu'elle facilite l'accèsaux données par le non-spécialiste, ouvre la voie à nombre de recherches sur lesystème des FL lui-même. En effet, les formules de vulgarisation, du faitqu'elles varient - pour une même FL - selon l'étiquette sémantique du mot-vedette, permettent de mettre en évidence les différentes facettes sémantiquesde chaque lien paradigmatique ou syntagmatique standard. Ce type d'infor¬mation est très utile, notamment, lorsqu'on explore les possibles connexionsentre les FL et la définition lexicographique des lexies auxquelles ces fonctionss'appliquent - cf. Kahane (2003) et lordanskaja & Polguère (2005).

Notons, pour conclure sur le sujet, que les liens de FL non standard sonttraditionnellement encodés dans les dictionnaires explicatifs et combinatoiresau moyen d'expressions non formalisées, qui fonctionnent comme des para¬phrases du lien en question. Ces expressions n'ont pas besoin d'être vulgari¬sées puisqu'elles sont immédiatement interprétables sans connaissance dusystème des FL standard. On trouve par exemple les liens non standardsuivants dans la fiche DiCo de DÉBAT2 [Elle participe à un débat télévisé sur le rôlede l'école dans la société.] :

{[Qqn.] contrôler le déroulement d'un D.} animer, diriger [ART -]{Individu qui contrôle le déroulement d'un D. } animateur ide ART ~]

{ Événement social X1

qui comprend un D. } K I D. en apposition [ "- Nous vous convions à

un dîner-débat . " j

Le lecteur aura remarqué que nous avons saupoudré notre présentation deréférences à DÉBAT, qui est le vocable que plusieurs auteurs du présentvolume ont décidé de prendre comme point de référence pour comparer leursapproches. Avant de passer à l'application de nos méthodes au cas spécifiquede ce vocable, nous allons brièvement aborder deux aspects essentiels del'organisation du projet DiCo/LAF : la modélisation des liens lexicaux fondéesur une stricte division des mots polysémiques en unités lexicales(section 3.3.) et l'extraction de nouvelles structures de données à partir duDiCo (section 3.4.).

LANGUE FRANÇAISE .' 77

Dérivations sémantiques et collocations dans le DiCo/LAF

lente, bien que sémantiquement transparentes au niveau du décodage linguis¬tique, doivent être consignées dans le dictionnaire du fait de leur naturecollocationnelle. Elles représentent des clichés propres au français, que lelocuteur doit avoir appris.

/* [X] être une 3.*/{Operl} être [ART ~] , n'être que [ART ~:

/* [Qqn. /Qqch. ] causer que X soit de la B.*/{CausOperl} réduire [N=X en ART ~]

La FL Oper-L représente les verbes supports qui prennent le mot-vedettecomme complément et l'expression du premier actant de celui-ci comme sujet.CausOper-L encode un collocatif causatif, pour le même type de structuresyntaxique. On voit que les formules de vulgarisation qui précèdent les enco¬dages formels permettent de « court-circuiter » le recours aux formules de FLen paraphrasant les expressions décrites.

La technique de la vulgarisation des liens de FL, outre qu'elle facilite l'accèsaux données par le non-spécialiste, ouvre la voie à nombre de recherches sur lesystème des FL lui-même. En effet, les formules de vulgarisation, du faitqu'elles varient - pour une même FL - selon l'étiquette sémantique du mot-vedette, permettent de mettre en évidence les différentes facettes sémantiquesde chaque lien paradigmatique ou syntagmatique standard. Ce type d'infor¬mation est très utile, notamment, lorsqu'on explore les possibles connexionsentre les FL et la définition lexicographique des lexies auxquelles ces fonctionss'appliquent - cf. Kahane (2003) et lordanskaja & Polguère (2005).

Notons, pour conclure sur le sujet, que les liens de FL non standard sonttraditionnellement encodés dans les dictionnaires explicatifs et combinatoiresau moyen d'expressions non formalisées, qui fonctionnent comme des para¬phrases du lien en question. Ces expressions n'ont pas besoin d'être vulgari¬sées puisqu'elles sont immédiatement interprétables sans connaissance dusystème des FL standard. On trouve par exemple les liens non standardsuivants dans la fiche DiCo de DÉBAT2 [Elle participe à un débat télévisé sur le rôlede l'école dans la société.] :

{[Qqn.] contrôler le déroulement d'un D.} animer, diriger [ART -]{Individu qui contrôle le déroulement d'un D. } animateur ide ART ~]

{ Événement social X1

qui comprend un D. } K I D. en apposition [ "- Nous vous convions à

un dîner-débat . " j

Le lecteur aura remarqué que nous avons saupoudré notre présentation deréférences à DÉBAT, qui est le vocable que plusieurs auteurs du présentvolume ont décidé de prendre comme point de référence pour comparer leursapproches. Avant de passer à l'application de nos méthodes au cas spécifiquede ce vocable, nous allons brièvement aborder deux aspects essentiels del'organisation du projet DiCo/LAF : la modélisation des liens lexicaux fondéesur une stricte division des mots polysémiques en unités lexicales(section 3.3.) et l'extraction de nouvelles structures de données à partir duDiCo (section 3.4.).

LANGUE FRANÇAISE .' 77

Page 14: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

3.3. Division des mots polysémiques en unités lexicales

C'est un fait bien connu qu'un mot polysémique (un vocable, dans notrejargon) doit être divisé, pour fins de description lexicographique, en accep¬tions correspondant chacune à une unité lexicale spécifique. Une unité dedescription lexicographique correspond donc à la modélisation d'une unitélexicale, pas à celle d'un mot polysémique. Cependant, lorsqu'il est questionde la description des dérivations sémantiques ou des collocations, on a

tendance à oublier celte vérité banale et à réunir dans une même énumérationles dérivations et les collocations de toutes les acceptions d'un vocable. C'estle défaut principal de plusieurs dictionnaires de collocations, qui les invalideà un degré significatif. Cela s'explique par le fait que la division d'un vocableen unités lexicales, c'est-à-dire la résolution de la polysémie, est une destâches les plus difficiles que doit affronter le lexicographe.

Cependant, les dérivations et les collocations sont très sensibles à la poly¬sémie. Tel dérivé ou telle collocation sera possible pour telle acception d'unmot polysémique, mais pas pour une autre. Ainsi, ÉLÉVATION est dérivéd'ÉLEVER 'porter à un rang supérieur", tandis que ÉLEVAGE vient d'ÉLEVER's'occuper des animaux" ; ATTAQUER 'commencer le combat" a le nomd'action ATTAQUE (une attaque des blindés), mais pas ATTAQUER "détruire lasubstance de qqch.' (*une attaque de l'acide) ; on dit que l'armée bat en retraite,mais on dit que l'employé en fin de carrière part à la retraite. Nous pourrionscontinuer à citer des exemples de ce type par milliers, mais point n'estbesoin de le faire : en théorie, tout le monde ou presque est d'accord sur lanécessité de résoudre la polysémie, même si en pratique on néglige souventde le faire.

Dans notre projet DiCo/LAF, une bonne division du vocable en unitéslexicales est une condition sine qttn non à une présentation valide des liens lexi¬caux. Nous ne nous permettons jamais de réunir dérivés sémantiques et collo¬cations sous un même mot-vedette sans égard pour sa polysémie éventuelle.Plus que cela, la différence des dérivés et des collocations sert souvent d'indi¬cateur sûr pour la distinction des acceptions.

3.4. Extraction de nouvelles structures de données à partir du DiCo

La problématique de l'extraction de données et de produits lexicographi-ques du DiCo a été au c de nos préoccupations depuis le début du projet.Nous avons commencé par mettre au point un formai possible de dictionnairepédagogique dérivé de la base, le LAF, que nous avons développé graduelle¬ment par transformation et reformatage manuels des fiches DiCo -cf. Polguère(2000).

Grâce à une Chaire Biaise Pascal accordée à 1. Mel'cuk et à une collabora-lion avec J. Steinlin (Paris 7) et S. Kahane (Paris 10), nous disposons depuistout récemment d'un « transmuteur » de DiCo qui compile l'ensemble defiches DiCo en un ensemble de tables de données interrogeables au moyen derequêtes SQL - cf. Steinlin et al. (2004). L'interface DiCouèbe est accessible surle site de l'Observatoire de linguistique Sens-Texte (OLST) à l'adresse

78

Collocations, corpus, dictionnaires

3.3. Division des mots polysémiques en unités lexicales

C'est un fait bien connu qu'un mot polysémique (un vocable, dans notrejargon) doit être divisé, pour fins de description lexicographique, en accep¬tions correspondant chacune à une unité lexicale spécifique. Une unité dedescription lexicographique correspond donc à la modélisation d'une unitélexicale, pas à celle d'un mot polysémique. Cependant, lorsqu'il est questionde la description des dérivations sémantiques ou des collocations, on a

tendance à oublier celte vérité banale et à réunir dans une même énumérationles dérivations et les collocations de toutes les acceptions d'un vocable. C'estle défaut principal de plusieurs dictionnaires de collocations, qui les invalideà un degré significatif. Cela s'explique par le fait que la division d'un vocableen unités lexicales, c'est-à-dire la résolution de la polysémie, est une destâches les plus difficiles que doit affronter le lexicographe.

Cependant, les dérivations et les collocations sont très sensibles à la poly¬sémie. Tel dérivé ou telle collocation sera possible pour telle acception d'unmot polysémique, mais pas pour une autre. Ainsi, ÉLÉVATION est dérivéd'ÉLEVER 'porter à un rang supérieur", tandis que ÉLEVAGE vient d'ÉLEVER's'occuper des animaux" ; ATTAQUER 'commencer le combat" a le nomd'action ATTAQUE (une attaque des blindés), mais pas ATTAQUER "détruire lasubstance de qqch.' (*une attaque de l'acide) ; on dit que l'armée bat en retraite,mais on dit que l'employé en fin de carrière part à la retraite. Nous pourrionscontinuer à citer des exemples de ce type par milliers, mais point n'estbesoin de le faire : en théorie, tout le monde ou presque est d'accord sur lanécessité de résoudre la polysémie, même si en pratique on néglige souventde le faire.

Dans notre projet DiCo/LAF, une bonne division du vocable en unitéslexicales est une condition sine qttn non à une présentation valide des liens lexi¬caux. Nous ne nous permettons jamais de réunir dérivés sémantiques et collo¬cations sous un même mot-vedette sans égard pour sa polysémie éventuelle.Plus que cela, la différence des dérivés et des collocations sert souvent d'indi¬cateur sûr pour la distinction des acceptions.

3.4. Extraction de nouvelles structures de données à partir du DiCo

La problématique de l'extraction de données et de produits lexicographi-ques du DiCo a été au c de nos préoccupations depuis le début du projet.Nous avons commencé par mettre au point un formai possible de dictionnairepédagogique dérivé de la base, le LAF, que nous avons développé graduelle¬ment par transformation et reformatage manuels des fiches DiCo -cf. Polguère(2000).

Grâce à une Chaire Biaise Pascal accordée à 1. Mel'cuk et à une collabora-lion avec J. Steinlin (Paris 7) et S. Kahane (Paris 10), nous disposons depuistout récemment d'un « transmuteur » de DiCo qui compile l'ensemble defiches DiCo en un ensemble de tables de données interrogeables au moyen derequêtes SQL - cf. Steinlin et al. (2004). L'interface DiCouèbe est accessible surle site de l'Observatoire de linguistique Sens-Texte (OLST) à l'adresse

78

Page 15: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

suivante3 : Jiitp://umm.oIst:umontreal.ca/dicouebe. Le DiCo compilé n'est plusvéritablement un ensemble de fiches lexicographiques, un dictionnaire sursupport informatique. Sa structure interne ressemble plutôt à la structure debases lexicales du type WordNet (même si l'information qu'il contient estbeaucoup plus riche que celle que l'on trouve habituellement dans ces bases).Le lexique y est modélisé comme un gigantesque réseau fait de connexionsétiquetées entre « entités lexicales ». Alors que le DiCo en fiches correspond à

une structure de données adaptée à l'activité de rédaction lexicographique, lastructure en réseau vise la consultation automatique et, de façon plus géné¬rale, le traitement informatique.

Nous allons maintenant, dans la dernière section, appliquer l'approche duDiCo/LAF au cas particulier du vocable DÉBAT.

4. MÉTHODOLOGIE LEXICOGRAPHIQUE : APPLICATION AU VOCABLE DÉBAT

4.1. Résumé du travail lexicographique effectué sur débat

La construction des fiches DiCo pour le vocable DÉBAT s'est faite en troisétapes piûncipales :

1 . ébauche de la structure du vocable ;

2. recherche d'exemples d'emplois de chaque acception ;

3. élaboration des fiches complètes (en commençant par l'unité lexicale debase du vocable).

Nous examinons maintenant brièvement ce qui caractérise chacune de ces

étapes.

4.1.1. Ébauche de la structure du vocable

Avant même d'entamer le véritable travail lexicographique sur DÉBAT, onpeut se rendre compte que l'on est en présence d'un vocable polysémique : ledébat qui « agite la société » n'est pas perçu comme étant le même débat quecelui qu'on organise à la fin d'une conférence4. 11 faut donc commencer parfaire une ébauche de la structure polysémique du vocable.

Bien entendu, nous ne pouvons pas expliquer ici exactement quelles ontété toutes nos réflexions et discussions ; contentons-nous de dire qu'elles nousont conduits à la structure suivante, où chaque acception est caractériséesémantiquement de façon très approximative et illustrée par un exemple :

DÉBAT] "confrontation d'idées avant lieu entre différents membres d'un groupesocial du fait d'un désaccord sur un sujet donné" |Ex. Un débat agile In

société.]

3. On peut télécharger à celle adresse une documentation détaillée présentant le DiCo, sa struc¬ture compilée et l'interface DiCouèbe : Jousse & Polguère (2005).

4. Il s'agit d'une façon volontairement naïve de présenter les choses. On pourrait tout à fait perce¬voir que l'on a affaire à deux situations concrètes différentes, et ensuite se rendre compte, à

l'examen du comportement linguistique de débat, que le français ne dispose ici que d'une lexievague, qui permet de désigner les deux situations en question.

[ANUE FRANÇAISE :

Dérivations sémantiques et collocations dans le DiCo/LAF

suivante3 : Jiitp://umm.oIst:umontreal.ca/dicouebe. Le DiCo compilé n'est plusvéritablement un ensemble de fiches lexicographiques, un dictionnaire sursupport informatique. Sa structure interne ressemble plutôt à la structure debases lexicales du type WordNet (même si l'information qu'il contient estbeaucoup plus riche que celle que l'on trouve habituellement dans ces bases).Le lexique y est modélisé comme un gigantesque réseau fait de connexionsétiquetées entre « entités lexicales ». Alors que le DiCo en fiches correspond à

une structure de données adaptée à l'activité de rédaction lexicographique, lastructure en réseau vise la consultation automatique et, de façon plus géné¬rale, le traitement informatique.

Nous allons maintenant, dans la dernière section, appliquer l'approche duDiCo/LAF au cas particulier du vocable DÉBAT.

4. MÉTHODOLOGIE LEXICOGRAPHIQUE : APPLICATION AU VOCABLE DÉBAT

4.1. Résumé du travail lexicographique effectué sur débat

La construction des fiches DiCo pour le vocable DÉBAT s'est faite en troisétapes piûncipales :

1 . ébauche de la structure du vocable ;

2. recherche d'exemples d'emplois de chaque acception ;

3. élaboration des fiches complètes (en commençant par l'unité lexicale debase du vocable).

Nous examinons maintenant brièvement ce qui caractérise chacune de ces

étapes.

4.1.1. Ébauche de la structure du vocable

Avant même d'entamer le véritable travail lexicographique sur DÉBAT, onpeut se rendre compte que l'on est en présence d'un vocable polysémique : ledébat qui « agite la société » n'est pas perçu comme étant le même débat quecelui qu'on organise à la fin d'une conférence4. 11 faut donc commencer parfaire une ébauche de la structure polysémique du vocable.

Bien entendu, nous ne pouvons pas expliquer ici exactement quelles ontété toutes nos réflexions et discussions ; contentons-nous de dire qu'elles nousont conduits à la structure suivante, où chaque acception est caractériséesémantiquement de façon très approximative et illustrée par un exemple :

DÉBAT] "confrontation d'idées avant lieu entre différents membres d'un groupesocial du fait d'un désaccord sur un sujet donné" |Ex. Un débat agile In

société.]

3. On peut télécharger à celle adresse une documentation détaillée présentant le DiCo, sa struc¬ture compilée et l'interface DiCouèbe : Jousse & Polguère (2005).

4. Il s'agit d'une façon volontairement naïve de présenter les choses. On pourrait tout à fait perce¬voir que l'on a affaire à deux situations concrètes différentes, et ensuite se rendre compte, à

l'examen du comportement linguistique de débat, que le français ne dispose ici que d'une lexievague, qui permet de désigner les deux situations en question.

[ANUE FRANÇAISE :

Page 16: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

DÉ13AT2 "discussion organisée entre différents participants à un événementsocial" |Ex. Ln conférence sera suivie d'un débat.]

DÉBATS.! "discussion organisée dans un corps législatif [Ex. Les députés se sont misd'accord nu terme d'un interminable début.]

DÉBAT3b 'discussion organisée durant une séance de tribunal" lEx. l'affaire feral'objet d'un débat contradictoire devant le tribunal correctionnel]

L'acception choisie comme unité lexicale de base - DÉBATi - a « mérité » cetteposition dans notre description à cause de tout un faisceau d'indices lexico-graphiques de sa prédominance. Citons notamment les trois indices suivants :

1. 11 s'agit du sens le plus général. Ainsi, un débatz peut être vu comme uneconcrétisation, ou spécialisation, du débati.

2. La lexie DÉBATi semblait a priori contrôler plus de liens lexicaux que lesautres, même si DÉBAT2 paraissait elle aussi très riche de ce point de vue.Cette dernière intuition a été confirmée au cours des étapes de traitementsubséquentes, puisque notre fiche finale de DiCo pour DÉBAT] contientenviron un tiers de liens de FL de plus que celle pour DÉBAT2.

3. Les deux dernières lexies du vocable, DÉBATSa et DÉBATSb, relèvent dedomaines de l'activité humaine très spécifiques (domaine parlementaire etdomaine juridique). II était d'ailleurs clair dès le début que dans le cas deDÉBAT3b, au moins, nous étions en présence d'une lexie « terminologique »

et qu'il nous serait impossible de la décrire de façon satisfaisante sansconsulter de la documentation sur le domaine juridique.Arrivés à ce niveau de description de DÉBAT, nous avons en fait construit

cinq fiches DiCo pratiquement vides : une fiche pour chacune des quatreacceptions et une fiche additionnelle, numérotée 0, qui contient toute l'infor¬mation pouvant être factorisée au niveau du vocable lui-même ; le champ cgde la fiche débat 3 0 contient l'indication que toutes les lexies du vocable sontdes noms masculins.

Nous consultons ensuite la hiérarchie d'étiquettes sémantiques du DiCo(Polguère 2003b) afin d'effectuer l'étiquetage sémantique de chaque accep¬tion. L'identification des étiquettes va éventuellement nous permettre derepérer des lexies sémantiquement proches déjà décrites dans la base. À la finde cette première étape de travail, nous avons obtenu la structure suivante :

débat -0cç r.on"i, ma se

débat * 1

Étiq. confrontation d'idéesSyn dialogue#2 ,- échange ; polémique

débat -.2

Etiq. discussion en public= débats 2 publicSyn _table i'cnde_ ; face-à-face ; "angl" panel ; dialogue#la

débat =-3 aEtiq. discussion en public= débat i\ 3a parlementaireSyn séance

débat=; 3 bEtiq. discussion en public

80

Collocations, corpus, dictionnaires

DÉ13AT2 "discussion organisée entre différents participants à un événementsocial" |Ex. Ln conférence sera suivie d'un débat.]

DÉBATS.! "discussion organisée dans un corps législatif [Ex. Les députés se sont misd'accord nu terme d'un interminable début.]

DÉBAT3b 'discussion organisée durant une séance de tribunal" lEx. l'affaire feral'objet d'un débat contradictoire devant le tribunal correctionnel]

L'acception choisie comme unité lexicale de base - DÉBATi - a « mérité » cetteposition dans notre description à cause de tout un faisceau d'indices lexico-graphiques de sa prédominance. Citons notamment les trois indices suivants :

1. 11 s'agit du sens le plus général. Ainsi, un débatz peut être vu comme uneconcrétisation, ou spécialisation, du débati.

2. La lexie DÉBATi semblait a priori contrôler plus de liens lexicaux que lesautres, même si DÉBAT2 paraissait elle aussi très riche de ce point de vue.Cette dernière intuition a été confirmée au cours des étapes de traitementsubséquentes, puisque notre fiche finale de DiCo pour DÉBAT] contientenviron un tiers de liens de FL de plus que celle pour DÉBAT2.

3. Les deux dernières lexies du vocable, DÉBATSa et DÉBATSb, relèvent dedomaines de l'activité humaine très spécifiques (domaine parlementaire etdomaine juridique). II était d'ailleurs clair dès le début que dans le cas deDÉBAT3b, au moins, nous étions en présence d'une lexie « terminologique »

et qu'il nous serait impossible de la décrire de façon satisfaisante sansconsulter de la documentation sur le domaine juridique.Arrivés à ce niveau de description de DÉBAT, nous avons en fait construit

cinq fiches DiCo pratiquement vides : une fiche pour chacune des quatreacceptions et une fiche additionnelle, numérotée 0, qui contient toute l'infor¬mation pouvant être factorisée au niveau du vocable lui-même ; le champ cgde la fiche débat 3 0 contient l'indication que toutes les lexies du vocable sontdes noms masculins.

Nous consultons ensuite la hiérarchie d'étiquettes sémantiques du DiCo(Polguère 2003b) afin d'effectuer l'étiquetage sémantique de chaque accep¬tion. L'identification des étiquettes va éventuellement nous permettre derepérer des lexies sémantiquement proches déjà décrites dans la base. À la finde cette première étape de travail, nous avons obtenu la structure suivante :

débat -0cç r.on"i, ma se

débat * 1

Étiq. confrontation d'idéesSyn dialogue#2 ,- échange ; polémique

débat -.2

Etiq. discussion en public= débats 2 publicSyn _table i'cnde_ ; face-à-face ; "angl" panel ; dialogue#la

débat =-3 aEtiq. discussion en public= débat i\ 3a parlementaireSyn séance

débat=; 3 bEtiq. discussion en public

80

Page 17: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

Nous indiquons ci-dessus en gras les lexies déjà décrites dans le DiCo, quel'on utilisera comme points de départ pour la description des acceptions deDÉBAT dont elles sont des quasi-synonymes.

4.1.2. Recherche d'exemples dans les corpus (et ailleurs)11 est essentiel à ce niveau de plonger dans les données linguistiques pour

récolter un maximum d'exemples d'emplois des acceptions que nous avonspostulées. Pour cela, nous avons bien entendu recours à des corpus électroni¬ques, notamment des corpus journalistiques. Nous utilisons aussi la recherchesur Internet, avec toutes les précautions d'usage. Notons à ce propos que toutcorpus est potentiellement dangereux s'il est utilisé sans discernement. Le butdu travail lexicographique est de construire une modélisation des connais¬sances linguistiques d'un locuteur idéalisé et non de construire une représen¬tation du contenu d'un corpus donné, aussi large et général soit-il.

L'examen des données, allié au recours à notre propre intuition linguistique,nous permet de collectionner un ensemble important d'exemples qui, une foisajustés et triés, vont être intégrés dans les champs ex des différentes fiches. Nousen profitons également pour « grappiller » les liens de FL que nous rencontronsen chemin. Cela nous permet de valider ou invalider nos hypothèses de départquant à la structure du vocable et à l'étiquetage sémantique des acceptions. Eneffet, les différents contextes d'emploi rencontrés dans les corpus sont des indi¬cateurs très forts du contenu sémantique d'une lexie et donc, par conséquent, desindicateurs de ce que doit être son étiquette sémantique.

4.1.3. Elaboration des fiches détailléesNous pouvons maintenant commencer le travail de description méthodique

des acceptions, en commençant par l'unité lexicale de base du vocable. 11 estimportant de commencer par cette lexie car, si notre hypothèse de départ estexacte, il sera ensuite plus facile de décrire les autres acceptions relativement à

celle-ci. Les étiquetages sémantiques nous indiquent en effet que les écartssémantiques entre acceptions sont somme toute assez faibles ; notamment, levocable ne semble contenir aucune acception de nature métaphorique.

Remarquons qu'il est beaucoup plus difficile d'effectuer la descriptiond'un vocable de ce type. En règle générale, plus les écarts sémantiques entreacceptions sont grands, plus il est aisé d'identifier, répartir et décrire lespropriétés de chaque acception. Dans le cas d'un vocable comme DÉBAT, aucontraire, on trouvera dans les corpus beaucoup d'interférences et, notam¬ment, de « greffes collocationnelles » effectuées sur une acception donnée à

partir de la combinatoire d'une autre acception - sur la notion de « greffecollocationnelle », cf. Polguère (à paraître).

Pour la description de la lexie de base, nous avons eu la chance de disposerd'une fiche DiCo finalisée pour une lexie possédant la même étiquette séman¬tique (confrontation d ' idées), la même structure actancielle et le mêmerégime syntaxique que DÉBATi : D1ALOGUE2 [Rien n'indique que toutes les partiesaccepteront de reprendre le dialogue.]. Nous nous sommes donc fortement inspirésde la description de cette dernière lexie pour développer notre nouvelle fiche.

LANGUI F R AN C A I S I : 81

Dérivations sémantiques et collocations dans le DiCo/LAF

Nous indiquons ci-dessus en gras les lexies déjà décrites dans le DiCo, quel'on utilisera comme points de départ pour la description des acceptions deDÉBAT dont elles sont des quasi-synonymes.

4.1.2. Recherche d'exemples dans les corpus (et ailleurs)11 est essentiel à ce niveau de plonger dans les données linguistiques pour

récolter un maximum d'exemples d'emplois des acceptions que nous avonspostulées. Pour cela, nous avons bien entendu recours à des corpus électroni¬ques, notamment des corpus journalistiques. Nous utilisons aussi la recherchesur Internet, avec toutes les précautions d'usage. Notons à ce propos que toutcorpus est potentiellement dangereux s'il est utilisé sans discernement. Le butdu travail lexicographique est de construire une modélisation des connais¬sances linguistiques d'un locuteur idéalisé et non de construire une représen¬tation du contenu d'un corpus donné, aussi large et général soit-il.

L'examen des données, allié au recours à notre propre intuition linguistique,nous permet de collectionner un ensemble important d'exemples qui, une foisajustés et triés, vont être intégrés dans les champs ex des différentes fiches. Nousen profitons également pour « grappiller » les liens de FL que nous rencontronsen chemin. Cela nous permet de valider ou invalider nos hypothèses de départquant à la structure du vocable et à l'étiquetage sémantique des acceptions. Eneffet, les différents contextes d'emploi rencontrés dans les corpus sont des indi¬cateurs très forts du contenu sémantique d'une lexie et donc, par conséquent, desindicateurs de ce que doit être son étiquette sémantique.

4.1.3. Elaboration des fiches détailléesNous pouvons maintenant commencer le travail de description méthodique

des acceptions, en commençant par l'unité lexicale de base du vocable. 11 estimportant de commencer par cette lexie car, si notre hypothèse de départ estexacte, il sera ensuite plus facile de décrire les autres acceptions relativement à

celle-ci. Les étiquetages sémantiques nous indiquent en effet que les écartssémantiques entre acceptions sont somme toute assez faibles ; notamment, levocable ne semble contenir aucune acception de nature métaphorique.

Remarquons qu'il est beaucoup plus difficile d'effectuer la descriptiond'un vocable de ce type. En règle générale, plus les écarts sémantiques entreacceptions sont grands, plus il est aisé d'identifier, répartir et décrire lespropriétés de chaque acception. Dans le cas d'un vocable comme DÉBAT, aucontraire, on trouvera dans les corpus beaucoup d'interférences et, notam¬ment, de « greffes collocationnelles » effectuées sur une acception donnée à

partir de la combinatoire d'une autre acception - sur la notion de « greffecollocationnelle », cf. Polguère (à paraître).

Pour la description de la lexie de base, nous avons eu la chance de disposerd'une fiche DiCo finalisée pour une lexie possédant la même étiquette séman¬tique (confrontation d ' idées), la même structure actancielle et le mêmerégime syntaxique que DÉBATi : D1ALOGUE2 [Rien n'indique que toutes les partiesaccepteront de reprendre le dialogue.]. Nous nous sommes donc fortement inspirésde la description de cette dernière lexie pour développer notre nouvelle fiche.

LANGUI F R AN C A I S I : 81

Page 18: Polguère, Mel'cuk (2006)

Collocations, corpus, dictionnaires

Faute de place, nous ne pouvons présenter ici le contenu des fiches décri¬vant les lexies de DÉBAT. La modélisation DiCo de ce vocable est cependantaccessible en ligne via l'interface DiCouèbe (mentionné plus haut). Si l'onconsulte les données sur DÉBATi, on noiera que le champ ph de sa fiche DiCocontient l'énumération des phrasèmes complets (= des locutions) 'débat deCONSCIENCE"1 et rDÉBAT INTÉRIEUR1. Cette information est très importante carelle indique que, selon nous, il n'existe pas d'autres acceptions de DÉBAT quicorrespondraient aux exemples ci-dessous :

(3) a. Gide n'a pas publié son ouvrage sans un cruel débat de conscience,

b. Racine a distribué sur deux personnages les pôles du débat intérieur.

Ces exemples mettent en effet en jeu des locutions du français, locutionsqui doivent être décrites dans leurs propres fiches de DiCo. On pourrarapprocher cette remarque de ce qui a été dit à la section 3.1. à propos deBOUILLIEll ï>s rEN BOUILLIE1.

Nous n'avons pas la place de commenter ici la description des trois autreslexies de DÉBAT. On notera simplement que DÉBAT2 se construit d'une part à

partir de DÉBATi, dont elle emprunte nombre de liens lexicaux, et d'autre partà partir de la fiche de DIALOGUEia {C'était clairement un dialogue entre deuxamants éperdument amoureux.], déjà disponible dans le DiCo. Notons que nousnous sommes volontairement abstenus, dans le cadre du présent exeirice, defaire des recherches dans des dictionnaires et répertoires de dérivationssémantiques et collocations pour compléter nos données.

4.2. Quelques remarques pour conclure sur l'approche DiCo/LAF

Nous avons déjà insisté en début d'article sur le fait que notre approche dutraitement des collocations se caractérise par sa nature « globale » : les lienscollocationnels sont un des axes d'analyse de la lexie, tous les axes d'analyseétant interconnectés. Il convient d'insister, pour conclure, sur l'omniprésencede la caractérisation sémantique de la lexie dans notre approche. Même si leDiCo ne contient pas, à proprement parler, de définition lexicographique,nous ne pouvons faire l'économie du recours à la définition pour effectuerl'encodage des liens paradigmatiques et syntagmatiques.

Le couple formé par l'étiquette sémantique et la forme propositionnelle(décrivant la structure actancielle) nous procure un squelette de définitionauquel nous avons sans cesse recours pour encoder les liens de FL (formelle¬ment et au moyen des formules de vulgarisation). De plus, les encodages duchamp fl de chaque fiche contiennent en filigrane le renvoi à des composantesde la définition, clairement identifiées au cours du travail lexicographique, etqui n'attendent que de trouver leur place dans une définition du type decelles du Dictionnaire explicatif et combinatoire5.

5. Un projet de construction de base de définition:- formelles - la BDéf - est en cours à l'OLST. Ceprojet n'a pas atteint la maturité du projet DiCo, mais notre but ultime est d'intégrer au DiCo devéritables définitions lexicogiaphiques construites selon les principes de la lexicologie explicativeet combinatoire. Pour une présentation du projet BDéf. cf. Allman fr Polguère (2003).

82

Collocations, corpus, dictionnaires

Faute de place, nous ne pouvons présenter ici le contenu des fiches décri¬vant les lexies de DÉBAT. La modélisation DiCo de ce vocable est cependantaccessible en ligne via l'interface DiCouèbe (mentionné plus haut). Si l'onconsulte les données sur DÉBATi, on noiera que le champ ph de sa fiche DiCocontient l'énumération des phrasèmes complets (= des locutions) 'débat deCONSCIENCE"1 et rDÉBAT INTÉRIEUR1. Cette information est très importante carelle indique que, selon nous, il n'existe pas d'autres acceptions de DÉBAT quicorrespondraient aux exemples ci-dessous :

(3) a. Gide n'a pas publié son ouvrage sans un cruel débat de conscience,

b. Racine a distribué sur deux personnages les pôles du débat intérieur.

Ces exemples mettent en effet en jeu des locutions du français, locutionsqui doivent être décrites dans leurs propres fiches de DiCo. On pourrarapprocher cette remarque de ce qui a été dit à la section 3.1. à propos deBOUILLIEll ï>s rEN BOUILLIE1.

Nous n'avons pas la place de commenter ici la description des trois autreslexies de DÉBAT. On notera simplement que DÉBAT2 se construit d'une part à

partir de DÉBATi, dont elle emprunte nombre de liens lexicaux, et d'autre partà partir de la fiche de DIALOGUEia {C'était clairement un dialogue entre deuxamants éperdument amoureux.], déjà disponible dans le DiCo. Notons que nousnous sommes volontairement abstenus, dans le cadre du présent exeirice, defaire des recherches dans des dictionnaires et répertoires de dérivationssémantiques et collocations pour compléter nos données.

4.2. Quelques remarques pour conclure sur l'approche DiCo/LAF

Nous avons déjà insisté en début d'article sur le fait que notre approche dutraitement des collocations se caractérise par sa nature « globale » : les lienscollocationnels sont un des axes d'analyse de la lexie, tous les axes d'analyseétant interconnectés. Il convient d'insister, pour conclure, sur l'omniprésencede la caractérisation sémantique de la lexie dans notre approche. Même si leDiCo ne contient pas, à proprement parler, de définition lexicographique,nous ne pouvons faire l'économie du recours à la définition pour effectuerl'encodage des liens paradigmatiques et syntagmatiques.

Le couple formé par l'étiquette sémantique et la forme propositionnelle(décrivant la structure actancielle) nous procure un squelette de définitionauquel nous avons sans cesse recours pour encoder les liens de FL (formelle¬ment et au moyen des formules de vulgarisation). De plus, les encodages duchamp fl de chaque fiche contiennent en filigrane le renvoi à des composantesde la définition, clairement identifiées au cours du travail lexicographique, etqui n'attendent que de trouver leur place dans une définition du type decelles du Dictionnaire explicatif et combinatoire5.

5. Un projet de construction de base de définition:- formelles - la BDéf - est en cours à l'OLST. Ceprojet n'a pas atteint la maturité du projet DiCo, mais notre but ultime est d'intégrer au DiCo devéritables définitions lexicogiaphiques construites selon les principes de la lexicologie explicativeet combinatoire. Pour une présentation du projet BDéf. cf. Allman fr Polguère (2003).

82

Page 19: Polguère, Mel'cuk (2006)

Dérivations sémantiques et collocations dans le DiCo/LAF

Pour illustrer ces propos par un exemple concret, examinons l'extrait de lafiche de DÉBATi reproduit ci-dessous, qui concerne la zone du champ fl rele¬vant des FL de « réalisation » Reali; Facti et Labreali;i.

/*[X/Y] apporter qqch. dans un D.*7{Reall/2--I; contribuer ;à ART -j

/*Ce que X/Y apporte dans un D.*/'{SresReall/2--II} contribution [de N=X/Y à ART ~] [« Les cramiis-

sions épiscopales viennent d'apporter unecontribution importante au débat. »]

/*D. mène à un résultat*/{FactO--II} aboutir, déboucher

/*[Qçn./X] causer de façon autoritaire que le D.mène à un résultat*/

{ce façon autoritaire Caus ( i ) FactO--II } trancher [ART ~]

Les collocations encodées ci-dessus relèvent clairement de la famille des FLde réalisation. Elles sont un indice très fort de la présence, dans la définitionde la base, d'une composante de sens liée à la finalité de la situation de débati.Si l'on peut dire, par exemple, trancher le débat pour signifier 'faire en sorteque le débati mène à un résultat", c'est parce qu'il est sémantiquementencodé dans la langue qu'un débati a une finalité, un but que cherchent à

atteindre les participants (X et Y) de la situation en question. Cette observa¬tion est d'ailleurs corroborée par la présence de collocatifs de type Ver (FLassociée au sens très général 'tel qu'il doit être") ou AntiVer qui sont directe¬ment liés à la notion de finalité :

/*Utile*/{Ver-finalité} concluant I postpos, fructueux, utile

/*Inutile*/{AntiVer-f inalité} inutile, stérile, vain

L'existence d'une collocation comme débat stérile, parce qu'elle s'encastreparfaitement dans la grille d'analyse des FL standard, nous permet de tissernotre toile sémantique autour du mot-vedette. On voit aussi qu'elle nouspousse à décrire des expressions qui ne sont pas des collocations très typi¬ques, comme débat inutile. Cette dernière, que l'on pourrait à première vueconsidérer comme sémantiquement compositionnelle, entre dans le champ degravité des collocations apparentées du fait des propriétés sémantiques et decombinatoire du mot-vedette. 11 est donc justifié de l'inclure dans notre fiche6.

Nous espérons avoir démontré que le DiCo n'est pas un dictionnaire decollocations, mais bien un dictionnaire explicatif et combinatoire à part entière.11 est vrai que le nom DiCo trouve son origine dans l'expression dictionnaire de

cooccurrences, car la modélisation des collocations était au centre de nos préoc¬cupations lorsque nous nous sommes lancés dans cette entreprise. Très vite,cependant, il est devenu évident que les collocations devaient être au DiCo ceque la crème frangipane est à la galette des Rois : la partie la plus savoureuse,peut-être, mais qui est difficilement mangeable sans le reste.

6. En d'autres termes, débat inutile n'est pas une expression aussi -- innocente » que chaise inutile, fatigueinutile... ; elle doit être considérée comme une collocation malgré son faible degré d'idiomaticité.

LANGUE FRANÇAISE -: 83

Dérivations sémantiques et collocations dans le DiCo/LAF

Pour illustrer ces propos par un exemple concret, examinons l'extrait de lafiche de DÉBATi reproduit ci-dessous, qui concerne la zone du champ fl rele¬vant des FL de « réalisation » Reali; Facti et Labreali;i.

/*[X/Y] apporter qqch. dans un D.*7{Reall/2--I; contribuer ;à ART -j

/*Ce que X/Y apporte dans un D.*/'{SresReall/2--II} contribution [de N=X/Y à ART ~] [« Les cramiis-

sions épiscopales viennent d'apporter unecontribution importante au débat. »]

/*D. mène à un résultat*/{FactO--II} aboutir, déboucher

/*[Qçn./X] causer de façon autoritaire que le D.mène à un résultat*/

{ce façon autoritaire Caus ( i ) FactO--II } trancher [ART ~]

Les collocations encodées ci-dessus relèvent clairement de la famille des FLde réalisation. Elles sont un indice très fort de la présence, dans la définitionde la base, d'une composante de sens liée à la finalité de la situation de débati.Si l'on peut dire, par exemple, trancher le débat pour signifier 'faire en sorteque le débati mène à un résultat", c'est parce qu'il est sémantiquementencodé dans la langue qu'un débati a une finalité, un but que cherchent à

atteindre les participants (X et Y) de la situation en question. Cette observa¬tion est d'ailleurs corroborée par la présence de collocatifs de type Ver (FLassociée au sens très général 'tel qu'il doit être") ou AntiVer qui sont directe¬ment liés à la notion de finalité :

/*Utile*/{Ver-finalité} concluant I postpos, fructueux, utile

/*Inutile*/{AntiVer-f inalité} inutile, stérile, vain

L'existence d'une collocation comme débat stérile, parce qu'elle s'encastreparfaitement dans la grille d'analyse des FL standard, nous permet de tissernotre toile sémantique autour du mot-vedette. On voit aussi qu'elle nouspousse à décrire des expressions qui ne sont pas des collocations très typi¬ques, comme débat inutile. Cette dernière, que l'on pourrait à première vueconsidérer comme sémantiquement compositionnelle, entre dans le champ degravité des collocations apparentées du fait des propriétés sémantiques et decombinatoire du mot-vedette. 11 est donc justifié de l'inclure dans notre fiche6.

Nous espérons avoir démontré que le DiCo n'est pas un dictionnaire decollocations, mais bien un dictionnaire explicatif et combinatoire à part entière.11 est vrai que le nom DiCo trouve son origine dans l'expression dictionnaire de

cooccurrences, car la modélisation des collocations était au centre de nos préoc¬cupations lorsque nous nous sommes lancés dans cette entreprise. Très vite,cependant, il est devenu évident que les collocations devaient être au DiCo ceque la crème frangipane est à la galette des Rois : la partie la plus savoureuse,peut-être, mais qui est difficilement mangeable sans le reste.

6. En d'autres termes, débat inutile n'est pas une expression aussi -- innocente » que chaise inutile, fatigueinutile... ; elle doit être considérée comme une collocation malgré son faible degré d'idiomaticité.

LANGUE FRANÇAISE -: 83