Lieu de soutenance : salle Turing du bâtiment CE4
Membres du Jury :
Cette étude est dédiée à un problème d’exploration de données dans les médias sociaux: la prédiction d’activité. Dans ce problème nous essayons de prédire l'activité associée à une thématique pour un horizon temporel restreint.
Afin de pouvoir définir et étudier la prédiction d'activité sans référence explicite à un réseau social existant, nous définissons un cadre d’analyse générique qui permet de décrire de nombreux médias sociaux. Trois définitions de la prédiction d'activité sont proposées. Ces trois problèmes sont étudiés avec les méthodes de l’état de l’art en apprentissage automatique.Notre capacité à prédire l’activité des thématiques est testée à l’aide d’un ensemble de données multilingue: Français, Anglais et Allemand. Les données ont été collecté durant 51 semaines sur Twitter et un forum de discussion. Plus de 500 millions de contenus générés par les utilisateurs ont été capturé.