Jury :
Cette thèse couvre le sujet des systèmes de traitement de données à
grande échelle, et plus précisément trois approches complémentaires :
la conception d'un système pour prédire des défaillances de serveurs
grâce à l'analyse de leurs données de supervision; l'acheminement de
données dans un système à temps réel en étudiant les corrélations
entre les champs des messages pour favoriser la localité; et
finalement un environnement de développement innovateur pour concevoir
des transformations de données en utilisant des graphes orientés de
blocs.
À travers le projet Smart Support Center, nous concevons une
architecture qui passe à l'échelle, afin de stocker des séries
temporelles rapportées par des moteurs de supervision, qui vérifient
en permanence la santé des systèmes informatiques. Nous utilisons ces
données pour effectuer des prédictions, et détecter de potentiels
problèmes avant qu'ils ne se produisent.
Nous nous plongeons ensuite dans les algorithmes d'acheminement pour
les systèmes de traitement de données en temps réel, et développons
une
couche pour acheminer les messages plus efficacement, en évitant les
rebonds entre machines. Dans ce but, nous identifions en temps réel
les corrélations qui apparaissent entre les champs de ces messages,
tels les mots-clics et leur localisation géographique, par exemple
dans le cas de micromessages. Nous utilisons ces corrélations pour
créer des tables d'acheminement qui favorisent la colocation des
acteurs traitant ces messages.
Pour finir, nous présentons λ-blocks, un environnement de
développement pour effectuer des tâches de transformations de données
sans écrire de code source, mais en créant des graphes de blocs de
code. L'environnement est rapide, et est distribué avec des piles
incluses: libraries de blocs, modules d'extension, et interfaces de
programmation pour l'étendre. Il est également capable de manipuler
des graphes d'exécution, pour optimisation, analyse, vérification, ou
tout autre but.