Cyril Labbe
Jacques Savoy - Institut d’informatique Université de Neuchâtel - Suisse
Jeudi 26 avril à 14h dans l’amphithéâtre F018, Jacques Savoy de l’Institut d’informatique Université de Neuchâtelprésente :
Qui a écrit cet article ? Un survol des approches en attribution d’auteur
Dans cette présentation, nous discuterons des familles de méthodes proposées pour résoudre le problème de l’attribution d’auteur (sur la base d’un ensemble de texte écrits par des auteurs connus, peut-on déterminer l’auteur d’un nouveau document). Après un survol des diverses questions reliées à l’attribution d’auteur, nous présenterons des solutions classiques à cette question. Notre modèle s’inscrit dans cette perspective et s’appuie sur le concept de vocabulaire spécifique d’un texte ou d’une partie d’un corpus. Nous avons ainsi la possibilité de définir la spécificité lexicale d’un texte (ou d’un auteur). Ensuite nous indiquerons comment cette spécificité peut être comparée à des profils d’auteurs afin de déterminer l’auteur possible d’un texte. Afin d’évaluer notre approche nous avons conduit deux expériences sur des corpus de presse (Glasgow Herald : 5408 articles écrit par 20 journalistes ; La Stampa : 4 326 articles rédigés par 20 auteurs). Cette expérience démontre les qualités relatives des méthodes Delta, chi-carré ou celle basée sur la divergence de Kullback-Leibler.