Thèse préparée au sein des laboratoires Gipsa-Lab, LIG et LPNC et dirigée par Julien DIARD, directeur de thèse, Jean-Luc SCHWARTZ et Pierre BESSIÈRE co-directeurs de thèse.
Lieu de Soutenance de la Thèse : Amphitéâtre de la Maison des Sciences de l'Homme, 1221 avenue centrale - Domaine universitaire - St Martin d'Hères
Membres du jury :
Si la parole est une faculté dont l’usage nous semble tout à fait naturel, il reste toutefois beaucoup à comprendre sur la nature des représentations et des processus cognitifs qui la gouvernent. Au coeur de cette thèse se trouve la question des interactions entre perception et action dans la production et la perception de syllabes. Nous adoptons le cadre de la programmation bayésienne au sein duquel nous définissons mathématiquement le modèle COSMO (pour "Communicating Objects using Sensori-Motor Operations"), qui permet de formaliser et d’étudier quantitativement les théories de la communication parlée. Nous mettons en évidence des conditions idéales d’apprentissage sous lesquelles les théories motrice et auditive sont indistinguables. Pour s’en éloigner, nous proposons un algorithme d’apprentissage sensorimoteur "par accommodation", qui permet de s’adapter au bain acoustique ambiant tout en développant des idiosyncrasies. Nous discutons les dynamiques d’évolution ainsi que la robustesse aux dégradations des modèles appris.
MOTS CLES :
Perception de la parole, cognition, modélisation computationelle, interactions sensori-motrices, programmation bayésienne, apprentissage.