Véronique Aubergé - Affecté, affectueux, affectif : quand l'« Affective Computing » se risque aux interactions sociales...

13:00
Jeudi
6
Déc
2012
Organisé par : 
L’équipe "Keynotes" du LIG
Intervenant : 
Véronique Aubergé

Véronique Aubergé est depuis octobre 2012 chercheur en SHS au LIG , après 5 ans au laboratoire CRISS (Centre Recherche en Informatique des Sciences Sociales), 4 ans dans la société OROS, 2 ans à l’ENSIMAG et 20 ans au laboratoire ICP puis GIPSA (responsable de l’équipe Structure du Code). V Aubergé a reçu en 1991 une thèse Cifre d’Informatique Linguistique à Grenoble 2 (après un DEA en Sciences du Langage et un DEA d’Informatique) pour sa modélisation de la transcription orthographique-phonétique du français (langage TOPH pour la transcription multilingue, implémenté dans les systèmes de synthèse vocale du CNET) et pour sa conception d’un système de synthèse de la parole par polysons intégrant son modèle Gestaltiste novateur de la prosodie. Elle a enrichi ce modèle fonctionnaliste superpositionnel de la prosodie audio-visuelle pour l’ensemble des fonctions de la communication située, en particulier les fonctions émotionnelles et socio-affectives (toujours avec des applications en synthèse vocale avec Bell Labs, puis ATR, puis France Telecom). Elle a construit une plate-forme expérimentale pluri-linguistique de capture d’émotions authentiques (logiciel E-Wiz, corpus Sound Teacher). Elle a également proposé une architecture cognitive auto-organisée de la communication, le modèle C-Clone. Ses travaux contrastifs sur l’inter-culturalité des affects sociaux sont appliqués en apprentissage des langues.

"Réalisation technique : Djamel Hadji | Tous droits réservés"

Dans une interaction face à face impliquant l’humain communicant, le flux d’informations est continu : le locuteur écoute (backchannel), et l’auditeur signale son suivi (feedback) dans un processus globalement organisé. Les signaux qu’il échange sont richement sociaux, intégrant des informations sur sa personnalité, son rôle sociétal situé, sa langue/sa culture, ses intentions, ses attitudes, ses états mentaux, ses processus cognitifs, ses sentiments, ses humeurs et ses émotions. Ainsi en deçà de la double articulation du langage, la prosodie audio-visuelle situe réellement le sujet dans son interaction en véhiculant ces informations. Les émotions, qui relèvent d’un contrôle involontaire, sont indissociables des décisions cognitives et les émotions sociales, qui relèvent d’un contrôle volontaire et sont façonnées par la langue et par la culture, sont les architectes de l’interaction langagière. Ne pas donner cette parole socio-affective aux agents virtuels ou robotiques leur fait courir le risque d’etre perçus comme déficients autistiques, mais les doter de performances socio-affectives réalistes, sans maîtriser finement le processus et la fonctionnalité de leurs compétences, est peut-être une explication du syndrome de la « uncanny valley ».