-
Analyse Syntaxique Automatique en Tamazight (Kabyle)
Yamouni Farida1
1Université Mouloud Mammeri Tizi Ouzou Algérie
[email protected]
Résumé .
Dans cet article nous présentons la description des grammaires
syntaxiques pour la phrase simple en Tamazight (kabyle) en vue de
l’analyse syntaxique automatique de phrases. Nous retenons la
phrase simple déclarative, avec la phrase simple nominale et la
phrase simple verbale. Nos travaux entrent dans le cadre du module
Tamazight (kabyle). Nous élaborons les ressources linguistiques
utilisées pour l’analyse syntaxique et nous décrivons les mots
grammaticaux recensés et utilisés, autres que le nom et le verbe.
Nous présentons ensuite les grammaires syntaxiques construites
ainsi que des exemples d’analyse syntaxique de phrases en Kabyle.
L’analyse linguistique qui est tout d’abord effectuée avant
l’analyse syntaxique utilise les dictionnaires électroniques
existants (Aoughlis et al, 2013), (Aoughlis, 2014) afin de fournir
les catégories syntaxiques utilisées lors de l’analyse syntaxique.
Les grammaires syntaxiques permettant l’analyse sont construites
sur la base des travaux de Nait-Zerrad K. à l’aide du système
NooJ
1 en vue du
traitement automatique de la langue Tamazight (kabyle). NooJ est
une plate-forme de développement permettant la description des
langues naturelles ou techniques.
1. Introduction
Une implémentation des règles de grammaire est réalisée dans
NooJ en vue de l’analyse syntaxique automatique de phrases.
Nous nous intéressons à la phrase simple déclarative. Nous
décrivons la phrase simple avec ses constituants. Elle est composée
d’un énoncé minimal : EVM (énoncé verbal minimum) ou bien ENM
(énoncé nominal minimum), suivi d’un ou plusieurs compléments (GN :
groupe nominal). La
1 http://www.nooj4nlp.net/
http://www.nooj4nlp.net/
-
YAMOUNI FARIDA
phrase verbale complète est l’EVM. La phrase nominale complète
est l’ENM. Une étude de la grammaire de Tamazight (Kabyle) est
faite. Les grammaires syntaxiques sont construites pour les deux
types de phrases simples. Des tests sont réalisés dans NooJ pour
analyser automatiquement dans NooJ des phrases de la langue
retenue. Les résultats sont présentés pour quelques phrases.
2. La phrase simple
La phrase met en relation deux éléments : un sujet (ce dont on
parle) et un prédicat (ce que l’on dit du sujet), suivis
éventuellement de compléments. Toute phrase est constituée d’un
prédicat complété par au moins un groupe nominal qui lui est lié.
Le prédicat peut être verbal ou nominal.
Elle phrase simple est constituée d’un EVM ou ENM suivi d’un ou
plusieurs compléments. Selon (Chaker, 1998), « en berbère, langue à
opposition verbo-nominale, c’est le verbe qui constitue
généralement le noyau prédicatif, dans certains contextes,
notamment en proposition relative, le verbe peut perdre cette
fonction et devenir un déterminant lexical équivalent à un adjectif
».
Le nom peut occuper la fonction de prédicat. Les fonctions du
nom sont (Chaker, 1998 ; Nait-Zerrad, 2001):
- Le CR, complément référentiel ou explicatif : il est marqué
par l’état d’annexion, postposé à l’élément qu’il détermine,
souvent le prédicat ;
- Le COD, complément d’objet direct : c’est le nominal
directement placé soit après le verbe, soit après le CR, il est à
l’état libre. Il peut être remplacé par un pronom affixe complément
direct ;
- Le COIND, complément d’objet indirect, est obligatoirement
relié au verbe par la préposition "i", à. Le noyau nominal est à
l’état d’annexion ;
- L’IT, indicateur de thème : le syntagme nominal à l’état libre
se trouve en position initiale, c’est une mise en relief pour
annoncer l’indice de personne ou le pronom personnel ;
- Le CC, complément circonstanciel : il est introduit le plus
souvent par une préposition. On peut avoir plusieurs CC se
rapportant à un même verbe ou équivalent nominal. On trouve le
complément direct
-
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 3
et les compléments prépositionnels (CC de lieu, cause, but,
manière, moyen, accompagnement, comparaison) ;
- CD, Complément de nom (nom déterminant un autre nom) ou
complément déterminatif, dans ce cas là le nom a une relation
indirecte avec le verbe. Il peut suivre directement le nom
déterminé ou être précédé de la préposition "n", de. Il est
toujours à l’état d’annexion ;
- Adjectif ;
- Participe : le participe est un verbe pour lequel les
oppositions de personnes sont neutralisées, il s’agit donc de
constructions de type relatif dans lesquelles le verbe a perdu sa
fonction de prédicat.
2.1. La phrase simple verbale
Elle est constituée d’un EVM (énoncé verbal minimum) suivi d’un
ou de plusieurs compléments : GN, ayant la fonction de COD, COIND,
CR, CC, etc. (Nait-Zerrad, 2001 ; 1995b).
L’EVM est composé d’un verbe + indice de personne.
La structure de la phrase simple verbale est :
EVM/CR(EA)/COD(EL)/COIND/[CC]* ou bien :
EVM (+pCOIND+pCOD+Po)/CR/CR1(COD repris)(EA)/COIND/[CC]
Avec :
COIND= PREP "i" + (N+EA) ;
Po= particule d’orientation ;
pCOD= pronom personnel COD ;
pCOIND= pronom personnel COIND ;
CR1= 2ème
CR correspondant au COD, car il reprend un pronom COD.
2.2. La phrase simple non verbale
Elle est constituée d’un EVM (énoncé verbal minimum) suivi d’un
ou de plusieurs compléments : GN ayant la fonction de COD, COIND,
CR, CC, etc. (Nait-Zerrad, 2001 ; 1995b).
Elle est aussi appelée phrase nominale. C’est une phrase sans
verbe, constituée d’un ENM, suivi d’un ou plusieurs compléments ou
GN : CR, IT, CC, adjectif, etc.
-
YAMOUNI FARIDA
Phr-Simpl-Nom = ENM + GN*
L’ENM contient un nom ou équivalent (jouant le rôle du verbe
dans l’EVM), accompagné d’un élément prédicatif. L’élément
prédicatif peut être :
- La particule "d" dite prédicative, placée devant le nom à
l’état libre ;
- Une préposition ;
- Un présentatif.
2.2.1. L’ENM avec la particule prédicative "d" :
L’ENM est composé entre autres de :
- d + nom : d aqcic ;
- d + adjectif : d ameqqran ;
- d + pronom : d nutni ;
2.2.2. L’ENM avec la préposition "n"
Elle indique l’appartenance, nous avons entre autres :
- n + pronom ;
- n + nom : n mmi-s, userwal-agi (CR); Aserwal-agi (IT), n mmi-s
;
- n + démonstratif : aɣrum, n ta ;
2.2.3. La phrase simple nominale
Nous avons les exemples suivants :
- Pronom + ENM : Netta d aqcic. / Lui, c’est un garçon ;
- Nom + ENM : Axxam d ameqqran / La maison (elle) est
grande.
-
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 5
3. Les ressources linguistiques pour l’analyse syntaxique
Dans le système NooJ (Silberztein, 2003), les grammaires
syntaxiques sont représentées par des ensembles structurés de
graphes ou de règles qui décrivent des paradigmes syntaxiques
stockés dans des fichiers ".nog ".
Pour l’analyse syntaxique automatique, nous avons construit des
grammaires syntaxiques pour l’analyse de la phrase simple verbale
et de la phrase simple nominale.
Une analyse linguistique est d’abord faite pour récupérer les
catégories syntaxiques obtenues grâce à la consultation des
dictionnaires élaborés dans NooJ pour le nom et le verbe. Ces
catégories sont utilisées pour l’analyse syntaxique. Nous avons
aussi recensé les mots grammaticaux et complété le dictionnaire
existant.
3.1. Les dictionnaires utilisés
Plusieurs dictionnaires sont utilisés pour l’analyse
linguistique, ils permettent de récupérer les catégories
syntaxiques utilisées pour l’analyse syntaxique. Le dictionnaire
des noms et celui des verbes sont décrits dans (Aoughlis et al,
2013). Le dictionnaire des verbes simples contient 3900 entrées,
celui des noms 500 entrées. Les noms et adjectifs qui ont été
dérivés des verbes (Aoughlis, 2014) sont dans le dictionnaire des
noms et adjectifs dérivés.
3.2. Le dictionnaire des mots grammaticaux
Nous avons recensé et codé les catégories syntaxiques
(Nait-Zerrad, 1995a)
autres que le nom et le verbe, dans le dictionnaire des mots
grammaticaux
qui contient 116 entrées.
-
YAMOUNI FARIDA
Nous trouvons ci-dessous, un extrait :
Figure1. Extrait de la grammaire des mots grammaticaux
3.3. Les grammaires syntaxiques
Deux grammaires principales sont construites : une pour la
phrase simple verbale et une autre pour la phrase simple
nominale.
Les grammaires sont utilisées pour l’analyse syntaxique dans
NooJ.
3.3.1. Grammaire syntaxique de la phrase simple nominale
Elle contient 9 graphes.
-
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 7
Nous trouvons ci-dessous la grammaire principale
PHR-SIMPL-NOM.nog :
Figure2. Extrait de la grammaire PHR-SIMPL-NOM
PHR-SIMPL-NOM est composée d’un ENM suivi d’un GN ou bien d’un
GN suivi d’un ENM.
Nous avons deux sous-graphes ENM et GN. Nous trouvons
ci-dessous, le sous-graphe ENM, avec les règles de grammaires.
Quatre sous-graphes sont utilisés : REL pour la relative, ENMn pour
l’ENM avec "n", PRESTAHA et PRESTAQL.
-
YAMOUNI FARIDA
Figure3. Le sous-graphe ENM
3.3.2. Grammaire syntaxique de la phrase simple verbale
Nous trouvons ci-dessous la grammaire principale PHR-SIMPL-VERB,
avec par exemple, les sous-graphes EVM, GNL (sous-graphe décrit
dans la figure5 suivante) ou GN état libre, GNA ou GN état
d’annexion.
-
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 9
Figure4. Extrait de la grammaire PHR-SIMPL-VERB
Figure4. Extrait de la grammaire PHR-SIMPL-VERB
Figure5. Le sous-graphe GNL
-
YAMOUNI FARIDA
4. Analyse syntaxique de phrases
4.1. Analyse syntaxique d’une phrase simple nominale
- Soit la phrase à analyser :
Axxam d ameqqran. / La maison (elle) est grande
- La grammaire utilisée est PHR-SIMPL-NOM.nog
- Résultats de l’analyse :
Figure6.Arbre d’analyse de la phrase "axxam d ameqqran"
-
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 11
Figure7. Arbre syntaxique de la phrase"axxam d ameqqran"
Soit une autre phrase à analyser : amcic-agi n yemma, les
résultats sont :
Figure8. Arbre d’analyse de la phrase "amcic-agi n yemma"
-
YAMOUNI FARIDA
Figure9. Arbre syntaxique de la phrase"amcic-agi n yemma"
4.2. Analyse syntaxique d’une phrase simple verbale
Soit la phrase à analyser : yekcem wergaz yeččan aɣrum ; la
grammaire est PHR-SIMPL-VERB, les résultats des analyses sont :
Figure10. Arbre d’analyse de la phrase "yekcem wergaz yeččan
aɣrum"
-
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE) 13
Figure11. Arbre syntaxique de la phrase "yekcem wergaz yeččan
aɣrum"
5. Conclusion et perspectives
Dans ce travail nous avons étudié les règles de grammaire du
Kabyle, nous avons construit les ressources linguistiques pour
l’analyse syntaxique automatique. Les travaux réalisés permettent
d’analyser les phrases simple et nominale. Les résultats souhaités
sont obtenus et les arbres d’analyse et syntaxiques sont affichés.
Les grammaires développées utilisent les catégories syntaxiques
définies pour les mots grammaticaux de la langue, ainsi que le nom
et le verbe.
Il est envisagé une étude détaillée de la proposition relative
avec la mise en place des grammaires syntaxiques. Une étude de la
phrase négative est prévue.
-
YAMOUNI FARIDA
Les résultats obtenus peuvent être utilisés pour concevoir et
développer un outil pédagogique pour enseigner la grammaire du
Kabyle.
Références
Aoughlis F., Nait-Zerrad K., Annouz H., Aït-Kaci F. and Habet
MS. (2013). A new Tamazight Module for NooJ, In Formalising Natural
Languages with NooJ 2013. Selected Papers from the NooJ 2013
International Conference. Svetla Koeva, Slim Mesfar, Max
Silberztein Eds. Cambridge Scholars Publishing: Newcastle upon
Tyne.
Aoughlis ,F. (2014). Noms et adjectifs dérivés en Tamazight,
6ème Edition de la Conférence Internationale sur Les Technologies
d’Information et de Communication pour l'Amazighe,TICAM’14, IRCAM,
Rabat, 24 et 25 novembre 2014. (Actes à paraître aux éditions de
l’IRCAM).
Chaker S. (1998). Fonctions, in Filage-Gastel, Encyclopédie
Berbère 19 : 2880-2886. Edisud, Aix-en-Provence.
Nait-Zerrad, K. (1995a). Grammaire du berbère contemporain
(kabyle), I-Morphologie , Enag Ed. : Alger
Nait-Zerrad, K. (1995b). Grammaire du berbère contemporain
(kabyle), II- Syntaxe, Enag Ed., Alger.
Nait-Zerrad, K. (2001). Grammaire moderne du kabyle, tajerrumt
tatrart n teqbaylit, Karthala, Paris.
Silberztein, M. (2003). Manuel NOOJ. http://www.nooj4nlp.net
http://www.nooj4nlp.net/