Amedeo Napoli - Aller des données vers les connaissances avec l'analyse formelle de concepts

13:00
Thursday
19
Mar
2015
Organized by: 
Jérôme Euzenat
Speaker: 
Amedeo Napoli
Teams: 

Amedeo Napoli

Équipe Orpailleur, LORIA (CNRS UMR 7503 -- Université de Lorraine)/INRIA Nancy Grand Est, Vandoeuvre les Nancy

Thursday 19th March 2015, 14h00

Amphithéatre F107, Inria Grenoble Rhône-Alpes, Montbonnot

La découverte de connaissances dans des masses de données et l'émergence de la “sciences des données” sont des questions qui intéressent directement la “science des connaissances” (ou intelligence artificielle), car elles interviennent dans la conception de bases de connaissances et autres ontologies. Dans un tel cadre, il être intéressant de disposer d'un formalisme suffisamment générique pour servir de support à la découverte de connaissances mais aussi à la représentation de connaissances, au raisonnement et à la résolution de problèmes. Dans cet exposé, nous introduisons le formalisme de “l'analyse formelle de concepts” — ou FCA pour “Formal Concept Analysis” — ainsi que deux variations, l'analyse relationnelle de concepts (RCA pour “Relational Concept Analysis”) pour traiter des données relationnelles et les structures de patrons (“pattern structures”) pour traiter des données complexes. La FCA permet, à partir d'un tableau de données binaire, de construire un treillis de concepts, où chaque concept est constitué d'une extension (les instances du concepts) et d'une intension (la description du concepts). Intensions et extensions sont les deux facettes duales d'un concept (formel) et forment une base pour la définition d'un concept en représentation des connaissances.

 
En particulier, nous montrerons comment la FCA et ses variations s'appliquent pour fouiller des textes et des données complexes (nombres, séquences, arbres, graphes), mais aussi en recherche d'information, en biclustering ou pour extraire des dépendances fonctionnelles.
 
Enfin, les treillis de concepts produits par la FCA permettent une visualisation et une interprétation très suggestive pour les experts, tout en fournissant des structures ordonnées exploitables par les machines.