Carlos Ramisch
Carlos Ramisch (GETALP)
J’ai l’honneur de vous inviter à ma soutenance de thèse, intitulée Une plate-forme ouverte et générique pour le traitement des expressions polylexicales : de l’acquisition aux applications (A generic and open framework for multiword expressions treatment : from acquisition to applications). La thèse a été effectuée en co-tutelle avec l’Université Fédérale de Rio Grande do Sul, au Brésil, sous la direction de Christian Boitet (LIG) et Aline Villavicencio (UFRGS). La soutenance sera en anglais et se déroulera le mardi 11 septembre à partir de 14h dans l’amphithéâtre F018 à l’UFR IM2AG, sur le campus. Voici la liste des membres du jury :
- Yves Lepage, Université de Waseda (Japon), Président
- Eric Wehrli, Université de Genève (Suisse), Rapporteur
- Gaël Dias, Université de Caen (France), Rapporteur
- Rosa Vicari, Universidade Federal do Rio Grande do Sul (Brésil), Examinatrice
- Renata Vieira, Pontífice Universidade Católica do Rio Grande do Sul (Brésil), Examinatrice
- Helena de Medeiros Caseli, Universidade Federal de São Carlos (Brésil), Examinatrice
- Christian Boitet, Université Joseph Fourier (France), Directeur de thèse
- Aline Villavicencio, Universidade Federal do Rio Grande do Sul (Brésil), Co-directeur de thèse
- Mathieu Mangeot, Université de Savoie (France), Invité
Vous êtes également invités au pot qui suivra, dans la salle B001 (Aquarium) du bâtiment B du LIG.
Cette thèse présente un environnement ouvert et flexible pour l’acquisition automatique d’expressions polylexicales (EPL) à partir de corpus textuels monolingues. Cette recherche est motivée par l’importance des EPL pour les applications de traitment automatique des langues. Après avoir brièvement présenté les modules de l’environnement, nous présentons des résultats d’évaluation en utilisant deux applications : la lexicographie assistée par ordinateur et la traduction automatique statistique. Ces deux applications peuvent bénéficier de l’acquisition automatique des EPL, et les expressions acquises automatiquement à partir de corpus peuvent à la fois les accélérer et améliorer leur qualité. Les résultats prometteurs de nos expériences nous encouragent à mener des recherches ultérieures sur la façon optimale d’intégrer le traitement des EPL dans ces applications et dans bien d’autres.