Traces digitales - Université de Paris Est Marne la Vallée

09:00
Thursday
13
Feb
2014

- Dans le cadre de la quinzième séance du séminaire ’traces digitales’ du groupe CorText, nous avons le plaisir d’accueillir Philippe Gambette (MCF, Université Paris-Est Marne la Vallée) et Mathieu Brugidou (chercheur HDR, EDF) qui nous parleront d’analyse statistique de données textuelles.

- Cette matinée aura lieu le jeudi 13 février de 10h à 13h00, dans la salle de réunion C219 du Latts (Université Paris-Est Marne la Vallée - rue Galilée, bâtiment du Bois de l’Etang - 2ème étage - aile C).
Voir Séminaire de l’axe "traces digitales" (groupe Cortext)

- Contact : Nicolas Turenne
Chief-Editor Journal of Data Mining & Digital Humanities.
UR SenS (Research Unit on Sciences in Societies)
INRA - national institute for agricultural research (http://www.inra.fr/en/)
UPEM - Universite Paris-Est Marne-la-Vallee (http://www.u-pem.fr/)

- 10h-11h30 Philippe Gambette (maître de conférences, LIGM, Université Paris-Est Marne-la-Vallée)

Exploration textométrique des thématiques dans un corpus de projets de recherche sur la biodiversité

À partir d’un corpus de plus de 4000 résumés de projets financés par une quinzaine d’agences de divers pays européens, nous dressons un panorama des tendances temporelles et géographiques de la recherche sur la biodiversité financée en Europe entre 2004 et 2011. Pour cela, analyses factorielles, évaluations de spécificités de vocabulaire et visualisations en nuages arborés sont combinées dans le cadre d’une analyse exploratoire enrichie par le regard d’un expert du domaine. Les qualités et les limites de la visualisation en nuage arboré seront tout particulièrement évoquées, et approfondies par d’autres cas d’utilisation.

- 11h30-13h Mathieu Brugidou (chercheur HDR, EDF)

Le Grenelle de l’environnement : une approche morphologique et formelle avec des logiciels d’analyse des données textuelles, Alceste et Tropes.

L’hypothèse privilégiée dans ce travail est de considérer le Grenelle de l’environnement comme un dispositif d’écriture collective. Il ne s’agit pas seulement d’un dispositif de participation et de concertation des parties prenantes, marqué fortement par une dimension de négociation, comme l’indique la reprise du terme de Grenelle. Ce processus de concertation s’avère être aussi un dispositif d’écriture collective destiné à produire des synthèses et des mesures d’action publique. Deux types d’approches seront privilégiés dans cette analyse. Une première approche, morphologique, est orientée vers l’analyse de la représentation des problèmes ; une seconde, formelle, [Lassegue, 2010] est dédiée à l’analyse de la formulation de mesures : La perspective morphologique cherche à mettre en évidence les structures thématiques des différents corpus et leurs dynamiques. Nous faisons l’hypothèse que le dispositif du Grenelle – et notamment sa conception en phases – produit des cartographies des problèmes et que ceux-ci ne peuvent être représentés que de manière relationnelle. La définition des problèmes pour les acteurs du Grenelle implique de trier les questions, d’abord entre celles qui relèvent ou qui ne relèvent pas du Grenelle de l’environnement, ensuite entre celles définissant les différents problèmes identifiés au cours du Grenelle. Les méthodes d’analyses des données textuelles seront ici privilégiées – notamment celles s’inscrivant dans la filiation de Benzécri, à l’image de la méthode Alceste développée par M.Reinert, tournées vers une approche empirique des structures ; Une deuxième perspective peut être qualifiée de formelle dans la mesure où elle s’attache aux effets des dispositifs d’écritures sur la forme des mesures. Il s’agit de décrire la mise en forme des mesures en faisant l’hypothèse que celles-ci – au-delà de leurs contenus – présentent des caractéristiques linguistiques propres qui répondent à une grammaire [Lemieux, 2009] qui définit leurs propriétés pragmatiques. Cette deuxième approche, plus analytique, privilégie des études diachroniques suivant le phasage du dispositif. Ce sont notamment des analyses morphosyntaxiques qui seront ici conduites avec l’aide du logiciel Tropes. Ces analyses seront conduites sur des corpus construits selon différents paramètres de temps (les phases de la négociation) mais aussi d’espaces de discours (les différents dispositifs d’écritures, lesquels renvoient aux phases du Grenelle mais aussi à des sous espaces des rapports, par exemple l’opposition entre synthèse et annexes, etc.).