Adrien Dulac - Etude des modéles à composition mixée pour l'analyse de réseaux complexes

09:30
Lundi
17
Déc
2018
Intervenant : 
Adrien Dulac
Équipes : 
Mots clés : 

 

Jury :

  • Eric Gaussier, professeur, Université Grenoble Alpes (UGA), directeur de thèse
  • Mohamed Nadif, professeur, LIPADE-University of Paris Descartes, rapporteur
  • Patrick Rossi, professeur, Laboratoire MAP5, Université Paris Descartes, rapporteur
  • Christine Largeron, professeure, Université Jean Monnet (UJM), codirectrice de thèse
  • Philippe Leray, professeur, Polytech'Nantes, examinateur
  • Adeline  Leclercq Samson, professeure, Université Grenoble Alpes/LJK, examinatrice

Les données relationnelles sont omniprésentes dans la nature et leur accessibilité ne cesse d'augmenter depuis ces dernières années. Ces données, vues comme un tout, forment un réseau qui peut être représenté par une structure de données appelée graphe où chaque nœud du graphe est une entité et chaque arête représente une relation ou connexion entre ces entités. Les réseaux complexes en général, tels que le Web, les réseaux de communications ou les réseaux sociaux sont connus pour exhiber des propriétés structurelles communes qui émergent aux travers de leurs graphes. Dans cette thèse, nous mettons l'accent sur deux importantes propriétés appelées *homophilie* et *attachement préférentiel* qui se produisent dans un grand nombre de réseaux réels. Dans une première phase, nous étudions une classe de modèles de graphes aléatoires dans un contexte Bayésien non-paramétrique, appelé *modèle de composition mixée*, et nous nous concentrons à montrer si ces modèles satisfont ou non les propriétés mentionnées, après avoir proposé des définitions formelles pour ces dernières. Nous conduisons ensuite une évaluation empirique pour mettre à l'épreuve nos résultats sur des jeux de données de réseaux synthétiques et réels. Dans une seconde phase, nous proposons un nouveau modèle, qui généralise un précédent modèle à composition mixée stochastique, adapté pour les réseaux pondérés et nous développons un algorithme d'inférence efficace capable de s'adapter à des réseaux de grande échelle.