Page 1
Annotationsminimalesmulti-niveauxd’uncorpusdeparolespontanéed’apprenants
japonaisdeFLEettraitementautomatique :perspectivesdidactiques
WorkInProgress…
SylvainDetey (U.Waseda,Japon),MaximeLeCoz(ArcheanTechnologies,France),LionelFontan(Archean Technologies,France),CorentinBarcat (TUFS,Japon),Yuji Kawaguchi(TUFS,Japon),Hisae
Akihiro (TUFS,Japon),Kaori Sugiyama (Seinan Gakuin U.,Japon)&NoriKondo(NUFS,Japon).
IPFC2018– ParisMSH– 26-27novembre2018
Page 2
Plan
1)Lecorpus:objectifsetenjeux
2)Desannotationsminimalesàune
descriptionautomatisée
3)Perspectivesd’analyses
4)Perspectivesdidactiques
Page 3
1)Lecorpus:objectifsetenjeux
CLIJAF:Corpuslongitudinalinterphonologiqued’apprenantsjaponaisdefrançais (Detey,2011-2019)
Japanese SocietyforthePromotionofScience(JSPS)
Collaborateurs:Y.Kawaguchi(TUFS),M.Kondo(Waseda),H.Akihiro (TUFS),K.Sugiyama (SeinanGakuin),K.Kawashima (Fukuoka)
Page 4
1)Lecorpus:objectifsetenjeux
Volet1:– longitudinal(4sessionssur2ans)– apprenantsdébutants(A1.1-B1)– focussurlaprononciation– perception&production– parolenon-spontanée(partie1duprotocoleIPFC)
Page 5
1)Lecorpus:objectifsetenjeux
Volet2:– parolespontanée (partie2duprotocoleIPFC)– apprenantsdeniveauintermédiaire (- B2+)– extensionauxautresniveaux:lexique,syntaxe…
Question:Quellesdivergences(« erreurs »)persistantesàl’oral ?
Interfaceprononciation/lexique/grammairecf.difficultésdetranscription&codage:naturedela« divergence »
Finalité: didactiqueaiderlesapprenantsàrésoudrelesdivergencespersistantes
Page 6
1)Lecorpus:objectifsetenjeuxLecorpus:
Analysephonético-phonologique:ExploitationdeCLIJAF1&2(mots,texte,conversations)
Pourcetteprésentation:FocussurCLIJAF2– parolespontanée(conversations)
Page 7
1)Lecorpus:objectifsetenjeux
CLIJAF2:parolespontanée- Locuteurs:39(31F&8H)- Conversationsguidées:46- Conversationslibres:67- Durée:environ26h- Format:son+transcriptionorthographiquealignés
(Transcriber)
Sous-corpusWaseda+TUFSdanslaBDD- Nbremots:167172- Durée:18h33- Nbreannotations:56137
Page 8
Analysemultiniveauxd’uncorpusoral:énorme chantier…méthodologie, outils,RH…coûteux…+lesdéfisdutraitementd’uneL2!(e.g.FLLOC,Myles&Mitchell, http://www.flloc.soton.ac.uk/)
Approche didactique:- annotationsminimales: repérage desdivergencesdesurface- pointdevue del’enseignant deFLE:“divergences”et“modèles”
Méthodologie:- Transcriptionorthographique- Conventions adhoc(GARS,IPFC…)- Transcriber (simple,gratuit,testé)
2)Desannotationsminimales àunedescriptionautomatisée
Page 9
2)Desannotationsminimales àunedescriptionautomatisée
Annotationsmanuellesminimalesdesdivergences:
1) [v]_ou[c]ou[v/c]__modificationvocaliqueouconsonantiquesimpleoumultiple (sansprécision)
2) [e]_..._[xxx]:formesinacceptablestranscritestellesquellespuisformejugéesouhaitableparletranscripteur:[e]_à_[en]Allemagne, je[e]_vas_[vais]
3) [ac]_[]:formesinacceptablesauto-corrigées(dernier énoncé):jesuisallé[ac]_àAllemagneeuhjesuisalléenAllemagne_[]
Page 10
Exemple de séquence
Page 11
Traitement automatisépourunedescriptionàviséedidactique:PartenariatavecArchean Labs (L.Fontan&M.LeCoz)
- Unserveur destockageetdetraitement- Unedescriptionquantitativeducorpus- Unconcordanciertexte-son (didactique&recherche)- Uneinterfaced’évaluationpédagogique
2)Desannotationsminimales àunedescriptionautomatisée
Page 12
2)Desannotationsminimalesàunedescription automatisée:Fonctionnalités Recherche
Page 13
2)Desannotationsminimalesàunedescription automatiséeStatistiquesGlobales
Page 14
2)Desannotationsminimalesàunedescription automatiséeProfilsd’apprenants
Page 15
3)Perspectivesd’analyse
Caractéristiques:- Parapprenant:nbre&typed'erreurs- Inter-apprenants:erreursrécurrentes,parniveaux,partypedeconversation
- Longitudinales:2sessions
Page 16
3)Perspectivesd’analyse
Pourcentage d’erreurs en fonction du niveau de l’apprenant
Page 17
3)Perspectivesd’analyse
Evolution longitudinale du pourcentage d’erreurs
Page 18
3)Perspectivesd’analyse
Répartition des erreurs entre prononciation et autre pour 10 apprenants B2
Prononciation Autre
Page 19
Auniveauphonético-phonologique:apprentissagesemi-superviséavecThomasPellegrini (IRIT,Toulouse),ANRJeuneChercheurLUDAU(Lightly-supervisedandUnsupervisedDiscoveryofAudioUnitsusingDeepLearning):à positionetnaturedeladivergencesegmentale
3)Perspectivesd’analyse
Page 20
3)Perspectivesd’analyse
Approche:• Rechercheàpartirdelacibleversdesdivergences(correction)• Recherched’un itemdivergentetrécupérationducontexte• Recherched’une catégoriePDD(encours)
Intérêt:1) Adéquation lexicogrammaticale vs.Adéquation phonétique :
récupérationdusignalsonoreencontexteànaturedeladivergence:« du »/« du »
2) Doubleentrée: productionvsciblepossible
Page 21
4)PerspectivesdidactiquesDes« divergences »:générationd’activitésdidactiques:- Phonético-phonologiques- Lexicales- Morpho-syntaxiques- Discursives
ConnexionsavecCAPT-L2etLexpro- Profilphonologiquedesapprenants- Profillexicaldesapprenants
Enprojet:- Profilgrammaticaldesapprenants- Dimensiondiscursiveetsociolinguistique
à Personnalisationducontenudidactiqueselonleprofil
Page 22
Conclusion
Apportparrapportàunconcordancierstandard:- Évaluationdel’oral- Rapportentreformesproduitesetformesattendues(doubleentréederecherche)
Défis:1) Transcriptionorthographique:manuelle?2) Annotationminimale:manuelle?3) Multiplicitédesmodèles:degréd’acceptabilité?
Nécessitédecodagemultiple
Objectifultime:unsystèmedecorrectionautomatiquedelaparoleL2
à Besoindesystème(s)deréférence:- phonologiederéférence (CAPT-L2)- lexiquederéférence (Lexpro)- grammairederéférence (cf.correcteursgrammaticaux– maisdel’oral!)
Page 23
Remerciements
• Japanese SocietyforthePromotionofScience• Archean Technologies• Lesétudiantsducorpus• LaboratoirePraxiling UMR5267U.Montpellier3
Page 24
Annotationsminimalesmulti-niveauxd’uncorpusdeparolespontanéed’apprenants
japonaisdeFLEettraitementautomatique :perspectivesdidactiques
WorkInProgress…
SylvainDetey (U.Waseda,Japon),MaximeLeCoz(ArcheanTechnologies,France),LionelFontan(Archean Technologies,France),CorentinBarcat (TUFS,Japon),Yuji Kawaguchi(TUFS,Japon),Hisae
Akihiro (TUFS,Japon),Kaori Sugiyama (Seinan Gakuin U.,Japon)&NoriKondo(NUFS,Japon).
IPFC2018– ParisMSH– 26-27novembre2018