Premiers pas dans l'expression d'émotions par le robot Nao

Démonstration Premiers pas dans l'expression d'émotions par le robot Nao

Jérôme Monceaux

AldebaranRobotics 168 bis/170, rue R. Losse

rand75014, Paris, France

jmonceaux@aldebaranrobotics.com

Joffrey Becker

EHESS – LAS52, rue du Cardinal Le

moine75005, Paris, France

[email protected]

Céline Boudier



cboudier@aldebaranrobotics.com

Alexandre Mazel



amazel@aldebaranrobotics.com

RESUMENous avons étudié une façon de créer une bibliothèque d'expressions émotionnelles pour le robot humanoïde Nao d'AldebaranRobotics. Cet ensemble d'expressions pourrait être utilisé par les créateurs de comportement de robots humanoïdes pour créer des comportements avancés, ou bien utilisés par un simulateur d'émotions. C'est un aperçu d'un travail réalisé conjointement par un anthropologue et des chercheurs en robotique qui a abouti à environ une centaine d'animations. Nous ne cherchons pas à fournir une revue de la littérature.

MOTS CLES : Comportements expressifs de robots, expression émotionnelle, robot humanoïde, Nao, démonstration, Choregraphe.

NOM ET VERSION DU LOGICIEL UTILISÉ POUR ÉCRIRE LA SOUMISSION : OpenOffice.org 3.0.1 pour Ubuntu

FORME DE PARTICIPATION : Article court

THÈMES DE LA SOUMISSION : Humains : analyse et modélisation des émotions. Technologies : techniques d'interaction et de présentation, interaction gestuelle, technologies embarquées

Démonstration Premiers pas dans l'expression d'émotions par le robot Nao

Jérôme Monceaux



jmonceaux@aldebaranrobotics.com

Joffrey Becker

EHESS – LAS52, rue du Cardinal Le

moine75005, Paris, France

[email protected]

Céline Boudier



cboudier@aldebaranrobotics.com

Alexandre Mazel



amazel@aldebaranrobotics.com

RESUME Nous avons étudié une façon de créer une bibliothèque d'expressions émotionnelles pour le robot humanoïde Nao d'AldebaranRobotics. Cet ensemble d'expressions pourrait être utilisé par les créateurs de comportement de robots humanoïdes pour créer des comportements avancés, ou bien utilisés par un simulateur d'émotions. C'est un aperçu d'un travail réalisé conjointement par un anthropologue et des chercheurs en robotique qui a abouti à environ une centaine d'animations. Nous ne cherchons pas à fournir une revue de la littérature.

MOTS CLES : Comportements expressifs de robots, expression émotionnelle, robot humanoïde, Nao, démonstration, Choregraphe.

ABSTRACT In this work, we studied a way to create a library of emotional expressions for the humanoid robot Nao from AldebaranRobotics. This set of expressions could be used by humanoid robot behavior designers to create advanced behaviors, or used by an emotion simulator. It is an insight into a conjoint work between an invited anthropologist and robotics researchers which resulted in about a hundred different animations. We do not seek to provide a review of the literature.

CATEGORIES AND SUBJECT DESCRIPTORS: I.2.9. Artificial intelligence: Robotics Commercial robots and applications.

GENERAL TERMS: Design, Experimentation.

KEYWORDS: Expressive robot behaviors, emotional expression, humanoid robot, Nao, demonstration, Choregraphe.

INTRODUCTIONNao est un robot humanoïde de 57 cm de haut avec 25 degrés de liberté. Chaque articulation est équipée de capteurs de position. Une centrale inertielle comprenant 2 gyromètres et 3 accéléromètres, ainsi que 4 capteurs de pression mécanique sous chaque pied permettent à Nao d'estimer son état courant. Des sonars donnent une me

sure de la distance entre le robot et son environnement. Des bumpers sur les pieds détectent les collisions avec des objets sur le sol. Le capteur tactile sur la tête fournit un moyen de communiquer avec le robot, par exemple le récompenser avec une caresse. Nao comporte d'autres périphériques entrants comme deux caméras VGA CMOS (640x480) et quatre microphones. Les microphones sont des capteurs très importants car nous considérons que la voix est devrait être l'interface la plus naturelle entre Nao et ses utilisateurs. Un module de reconnaissance de la parole fait partie des fonctions logicielles fondamentales de Nao. Les périphériques sortant comprennent deux hautparleurs et des LEDs programmables autour des yeux et des oreilles. Le processeur est situé dans la tête du robot : c'est une GEODE 500MHz avec 512Mo de mémoire flash et une possible extension via un bus USB. Une connexion WiFi lie le robot à n'importe quel réseau local et à d'autres Nao si nécessaire. Nao tire son énergie de batteries Lithium Polymère qui offrent entre 45mn et 4 heures d'autonomie selon son activité.

Quand il est livré, Nao exécute NaoQi, sous Linux, une structure qui donne accès à toutes les possibilités du robot : envoyer des commandes aux actionneurs, lire les capteurs, gérer les connexions WiFi, etc. NaoQi peut exécuter des fonctions en parallèle, séquentiellement ou déterminées par des évènements. Les fonctions de NaoQi peuvent être appeles en C++, en Python et même en Urbi.

Choregraphe est un logiciel qui tourne sur PC et qui donne accès, grâce à une interface graphique, à toutes les fonctions fournies par NaoQi. Une description complète de Nao est disponible en [9].

Cette présentation introduit les premiers travaux réalisés par AldebaranRobotics dans le but d’obtenir une bibliothèque d’animations dédiées à l’expression d’émotions par le robot humanoïde Nao.

L’exploitation de telles animations permettra d'accroitre le potentiel distrayant du robot. Mais nous croyons également que cela permettra d’améliorer la qualité de

l’interaction avec l’utilisateur. En créant une situation d’interaction proche de celle hommehomme à laquelle l’utilisateur est habitué, nous l’inciterons à se comporter d’une manière naturelle plus simple à détecter pour Nao.

Nous croyons aussi que les futurs robots humanoïdes de service seront mieux acceptés par les personnes s’ils sont en mesure d’exprimer une émotion. Cela pourrait offrir une solution au problème d’acceptabilité que rencontrent aujourd’hui beaucoup de systèmes d’aide à la personne.

CONTEXTECréer un comportement pour un robot humanoïde est un processus qui peut être fastidieux et extrêmement compliqué. Dans le cadre de son développement, l’équipe software d’AldebaranRobotics a œuvré pour simplifier autant que possible l’édition et la création de tels comportements. Ont donc été développées des interfaces graphiques accessibles et très compréhensibles, permettant d’accéder à un ensemble de petits comportements utilisables comme briques de base dans un comportement plus large, et ce par un utilisateur non averti.

Il existe plusieurs types de banques de comportements, en voici quelques exemples :

• Banque de comportements de perception : détection de visage, détection d’objet, reconnaissance vocale, perception de la gravité, etc.

• Banque de comportements d’interaction : questions à choix multiples, réaction à la présence d’un utilisateur, etc.

• Banque d’animations ludiques et divertissantes• Etc.

Cette banque est constituée d’entités indépendantes et réutilisables. Ces entités comportementales exploitent :

• Le mouvement des articulations (25 articulations)• Le système d’éclairage (77 LEDs)• Le son

Nao est un robot humanoïde, ce qui facilite la création de mouvements expressifs compréhensibles instinctivement par le spectateur. Mais malgré ceci il existe des différences entre ce que Nao peut utiliser pour s’exprimer et ce qu’un homme exploite. Par exemple :

• Nao n’a pas de bouche• Nao n’a pas de sourcils• Nao dispose d’un système d'éclairage multicolore

dans les yeux et les oreilles• Nao possède un nombre restreint d’articulations et

des membres rigides• Nao a la capacité de diffuser parfaitement un son

Toutes ces différences forcent le créateur de comportement de robot à exploiter d’autres voies pour le rendre

expressif, souvent au détriment de la lisibilité du comportement. Cela pose de nouvelles problématiques :

• Comment lier les émotions à la couleur des yeux ?• Comment faire sourire un robot qui n’a pas de

bouche ?• Etc.

Cette étude s’inscrit parmi les travaux réalisés dans le domaine de l’expressivité des agents interactifs ou des avatars. Notons pourtant que l'expressivité d’un robot humanoïde possède quelques différences avec celle des agents couramment utilisés. Par sa présence ou encore sa capacité d’interaction avec son environnement, il obtient une considération que ne pourrait pas avoir un avatar représenté sur un écran d’ordinateur.

MÉTHODOLOGIEUn des problèmes récurrents de la recherche en robotique émotionnelle touche à l'utilisation de typologies d'émotions. Dans de nombreux travaux, ces typologies sont mobilisées au titre de prémisses et ne sont donc quasiment jamais discutées. Elles constituent des listes tout à fait commodes servant à doter les machines de répertoires d'émotions de bases. En fait, d'un côté l'élaboration et de l'autre la mobilisation des typologies font émerger une relation quelque peu paradoxale. En effet, vouloir faire des machines émotionnelles, c'est paradoxalement chercher à les doter de sentiments dont on ne peut prendre la mesure qu'à partir d'un désir de connaître l'Homme afin d'encourager ce dernier à contrôler ses passions [2]. En fait, ce paradoxe relève d'une histoire longue, touchant aux origines de la pensée scientifique [3] [10], et mettant en valeur une tension classique entre mimesis et techne [4]. La réflexion sur "les passions de l'âme" trouve dans l'art, et notamment dans la représentation du corps humain, son principal champ d'application. Pour le dire autrement, c'est par l'art que s'élabore en premier lieu les principes d'un langage du corps. Ce langage, note l'historien JeanJacques Courtine, est porteur non seulement d'une histoire du regard porté sur le corps, mais surtout d'un divorce, dans le domaine des sciences, entre une anatomie des passions et un discours du sentiment [1]. Et c'est bien par rapport à cette séparation des savoirs que semblent aujourd'hui se situer les travaux des roboticiens, empruntant tantôt à la perspective évolutionniste de Charles Darwin, tantôt à l'approche plus phénoménologique de Wilhelm Wundt [12].

Sans renoncer à ces deux approches, notre travail a privilégié l'aspect communicationnel du geste en considérant ce dernier en tant qu'image somatique. Comme le note l'historien de l'art Ernst Gombrich, la communication à travers l'image est le produit de deux choses. Elle est, d'une part, possible parce que l'image met en forme des caractéristiques essentielles de l'action qu'elle figure. Ces caractéristiques, d'autre part, s'établissent selon un canevas spécifique que l'artiste extrait des représenta

tions générales de l'action, telles qu'il en suppose l'existence dans l'esprit du spectateur [8]. En d'autres termes, il s'agit de codifier l'image somatique de sorte à favoriser une inférence correcte de la part du spectateur. Cette perspective croise celle de l'éthologiste Konrad Lorenz, pour qui les mouvements permettant une inférence constituent de véritables symboles, rendus efficaces "par certaines exagérations de parties ayant une action optique et [ayant été simplifiés] par l'abandon de détails qui, certes, [sont] essentiels en raison de leur fonction mécanique originelle, mais qui [sont] d'une faible importance quant à l'émission d'excitations." [11]

RÉPERTOIRE DE GESTESNotre travail comporte une quarantaine d'animations renvoyant à une quinzaine d'états émotionnels, euxmêmes classées selon un axe allant du plaisir au déplaisir en passant par un état de neutralité. Chaque animation est de durée variable et consiste en des gestes accompagnés de sons, le tout étant souligné par une animation des yeux du robot.

Notre répertoire a été construit par un croisement d'éléments typologiques élémentaires [6] [5] et une mise en situation du robot avec un utilisateur humain dans le cadre d'un scénario. Le but a été, ici, de permettre à l'utilisateur d'inférer des états intérieurs à la machine et donc d'encourager une interaction fondée, chez l'utilisateur, sur le mimétisme et sur l'empathie. En d'autres termes, le travail d'animation a cherché à faire réagir l'utilisateur par rapport à ce qui lui a été présenté par le robot.

Plaisir Neutralité DéplaisirGrande Joie

(fig.1 / fig. 3)Joie (fig. 2)AmusementMoquerie

Intérêt (fig.5)

Attente (fig. 4)Surprise

ConcentrationNeutralité

Besoin d'attention

Ennui

DégoûtFatigue

BouderieColère

TristesseDouleur

Tableau 1 : Distribution des principaux états à animer.

Notre travail s'est ensuite tourné vers la recherche de variations à partir des images somatiques produites. Deux directions ont été suivies. Une première a consisté à faire varier la temporalité de chacune des émotions animées. Dans ce cas, il a fallu réduire des animations pouvant parfois atteindre vingt secondes à des séquences de plus ou moins cinq secondes. La seconde direction suivie a

consisté à faire varier l'intensité des gestes produits. Dans ce cas, il a fallu animer le robot de sorte à rendre perceptible une augmentation de son activité. Trois groupes de quatre animations ont ainsi été constitués : un premier groupe portant sur l'amusement, un deuxième sur la joie, et un troisième sur la surprise.

Figure 1 : Joie.

Figure 2 : Rire.

Figure 3 : Attente.

Figure 4 : Interêt.

Les titres des sections doivent être en Helvetica gras 9 points, en capitales. La ligne de titre est précédée d’un espace d’une ligne, et suivie d’aucun espace. Les sections ne sont pas numérotées.

UNIVERS SONOREParallèlement au travail d'animation, il a fallu accompagner les gestes de la machine de sons aisément identifiables par l'utilisateur humain. Par souci de produire une image cohérente aux yeux de l'utilisateur, nous avons cherché à utiliser des sons proches de ceux que pourrait produire un être de la taille de Nao. Le risque, nous le savons, est de constituer une image suffisamment chimérique pour créer une anomalie taxinomique favorisant un sentiment d'étrangeté chez l'utilisateur [13] [14].

La raison est à lier à l'impossibilité, pour le moment, d'utiliser la synthèse vocale pour produire les onomatopées qui ponctuent parfois l'expression des émotions chez les humains. Nous avons, par conséquent, privilégié l'utilisation d'échantillons de tonalité aiguë. Ces sons interviennent seuls ou par groupes de deux ou trois lors de l'animation. Il diffèrent également selon la temporalité et l'intensité propres aux quelques variations sur lesquelles nous avons travaillé.

ANIMATION DES YEUXPour compléter cet ensemble constitué de gestes et de sons, nous nous sommes appuyés sur l'animation des LEDs des yeux du robot. Nao a la particularité d'avoir, à la place des yeux, huit segments composés de trois LEDs chacun. Nous avons donc élaboré un code, mis par la suite en place dans les séquences de gestes, et dont le but est de souligner le caractère singulier de chaque animation.

Nous n'allons pas entrer dans le détail de ce code. L'association des couleurs et des émotions pose de nombreux problèmes tant elle renvoie à des traditions qui puisent autant du côté de l'ésotérisme que de l'histoire d'une théorie de la couleur dans l'art [7]. Tout au plus, pouvonsnous souligner le caractère profondément arbitraire de cette association. Et en un sens, il en est peutêtre mieux ainsi. La codification des formes et des couleurs des yeux du robot semble ainsi n'appartenir qu'à lui.

CONCLUSIONAvant tout rappelons ici, que l’objectif de cette étude n’est pas de doter Nao d’un système émotionnel, mais d’offrir aux créateurs de comportements de robot une banque dans laquelle il pourra trouver des éléments d’expression utiles à sa composition. Un simulateur d’émotion pourra également exploiter cette banque automatiquement.

Cette étude nous permet d’entrevoir le potentiel expressif du robot Nao d’AldebaranRobotics, mais également de mettre à jour les ambiguïtés d’une telle démarche. La

difficulté à définir un code, qui serait globalement reconnu malgré les variations culturelles et les différences morphologiques entre un robot humanoïde de petite taille et un homme, a demandé une approche artistique.

Néanmoins la forme humanoïde facilite la communication entre humains et robots. La peur est symbolisée par un mouvement de recul, la rencontre par un mouvement de bras vers l'avant et la surprise par un mouvement vif. Toutefois l'absence d'un visage limite l'expression de comportements subtils comme l'incertitude, le sourire, le doute, etc. Nao ne possède ni bouche ni sourcils, ce qui entraîne l'exploitation d'une expression corporelle caricaturale.

Dans cette étude, nous avons choisi de réaliser une banque d’animations expressives constituée d’entités indépendantes et hautement réutilisables. Ceci permet aux créateurs de comportements de robots de créer rapidement des comportements expressifs sans se préoccuper du contexte comportemental dans lequel sera jouée l’animation. Nous restons néanmoins conscients qu’une prochaine étape sera de s’orienter vers l’inflexion automatique d’un comportement ou animation en fonction d’une expressivité souhaitée. Mais ce point lève de nombreux problèmes techniques aussi bien que théoriques.

Finalement, le résultat obtenu dans cette étude est encourageant et est plutôt bien reçu par le public. Notre prochaine étape sera double :

• Travailler avec des artistes professionnels de l'animation

• Soumettre le résultat de leur créations à un public de multiculturel de test afin de réaliser une évaluation de la lisibilité de l’émotion que nous cherchons à communiquer.

Par ailleurs, AldebaranRobotics recherche d’autres moyens d’expression d’émotions, en particulier dans le projet GVLex (projet ANR, financé par le gouvernement français) où nous recherchons, avec l’aide de nos partenaires, à développer une synthèse vocale plus expressive.

BIBLIOGRAPHIE1. Courtine, JJ. "Le Miroir de l'Âme", In Histoire du

Corps, Tome 1, De la Renaissance aux Lumières, G. Vigarello, Ed. Seuil, Paris, 2005, 303309.

2. Courtine, JJ., Haroche, C. Histoire du Visage, Exprimer et Taire ses Émotions (XVIème – début XIXème siècle), Paris, Petite Bibliothèque Payot, 2007.

3. Descartes, R. "Traité des Passions", In Œuvres Choisies, BarLeDuc, ContantLaguerre Éditeur, 1649.

4. Desjardin, L. Le Corps Parlant, Savoirs et Représentations des Passions au XVIIème siècle, Paris, L'Harmattan, 2001.

5. Ekman, P. "Basic Emotions", In Handbook of Cognition ans Emotion, T. Dalgeish and M. Power, Eds John Wiley and Sons, Sussex, 1999, 4560.

6. Ekman, P. "The Repertoire of Nonverbal Behavior : Categories, Origins, Usage, and Coding", Semiotica, 1, 1969, 4560.

7. Gage, J. Color in Art, London, Thames and Hudson, 2006.

8. Gombrich, E. H. "Action and Expression in Western Art", In NonVerbal Communication, R. A. Hinde, Ed. Cambridge University Press, Cambridge, 1972, 373394.

9. Gouaillier, D., Hugel V. et al. "Mechatronic design of NAO humanoid". IEEE Int. Conf. on Robotics and Automation, Kobe, 2009.

10. Le Brun, C. Conférence de Monsieur Le Brun, Premier Peintre du Roy de France, Chancelier et Directeur de l'Académie de Peinture et Sculpture, sur l'Expression Générale et Particulière, Paris, Etienne Picart, 1698.

11. Lorenz, K. Trois Essais sur le Comportement Animal et Humain, Paris, Seuil, 1970.

12. Scherer, K. R. "What are Emotions ? And How can They be Measured ?", Social Science Information, 444, 2005, Sage, 695729.

13. Severi, C. Le Principe de la Chimère, Une Anthropologie de la Mémoire, Paris, Rue d'Ulm, 2008.

14. Sperber, D. "Pourquoi les Animaux Parfaits, les Hybrides et les Monstres sontils Bons à Penser Symboliquement ?", L'Homme, 152, 1975, 534.

Premiers pas dans l'expression d'émotions par le robot Nao

Documents