Louis Jachiet - Optimisation et évaluation distribuée des langages de requêtes du web des données, en particulier du langage SPARQL

12:00
Jeudi
13
Sep
2018
Organisé par : 
Louis Jachiet
Intervenant : 
Louis Jachiet
Équipes : 

 

Jury :

  • Nabil LAYAÏDA - DR Inria - Directeur de thèse
  • Pierre GENEVÈS - CR CNRS - Co-directeur de thèse
  • Dario COLAZZO - Pr Université Paris Dauphine - Rapporteur
  • Ioana MANOLESCU - DR Inria - Rapporteure
  • Jérôme EUZENAT - DR Inria - Examinateur
  • Patrick VALDURIEZ - DR Inria - Examinateur

Ma thèse porte sur la compilation des langages de requêtes orientés web des données. Plus particulièrement, ma thèse s'intéresse à l'analyse, l'optimisation et l'évaluation distribuée d'un tel langage : SPARQL.

La principale contribution présentée est l'élaboration d'une méthode nouvelle, particulièrement intéressante pour des requêtes contenant de la récursion ou dans le cadre d'une évaluation distribuée. Cette méthode s'appuie sur une variation introduite dans cette thèse de l'algèbre relationnelle équipée d'un opérateur de point fixe : la μ-algèbre.

Les termes de la μ-algèbre peuvent être réécrits en d'autres termes (de sémantique équivalente) en utilisant soit des règles de réécriture provenant de l'algèbre relationnelle soit des règles nouvelles, spécifiques à la μ-algèbre, pour réécrire les points fixes : elles permettent, par exemple, de pousser les filtres, les jointures ou les projections à l'intérieur des points fixes (dépendant de certaines conditions sur le terme). La thèse introduit aussi un modèle de coût pour l'évaluation des termes. À l'aide de ce modèle de coût, plusieurs termes qui sont équivalents d'un point de vue sémantique peuvent maintenant être vus comme différentes manières d'évaluer un de ces termes avec différents coûts estimés.

Ma thèse s'intéresse aussi à comment ces termes peuvent être évalués, notamment dans le cas particulier d'une évaluation sur une plateforme distribuée. Nous montrerons enfin comment la méthode d'évaluation choisie et les nouveaux termes, considérés grâce aux nouvelles règles de réécritures introduites, permettent une exécution plus efficace que ce qui était possible dans les autres approches existantes.