GEODISCO : approche géomatique et linguistique du discours encyclopédique des Lumières à Wikipédia

GEODISCO combine traitement automatique du langage (TAL), statistique textuelle, analyse du discours et système d’information géographique autour d’une même question : "Quelles représentations géographiques du monde les encyclopédies françaises véhiculent-elles à travers leurs discours, et que nous disent ces représentations sur chacune des époques où ces encyclopédies ont été écrites et publiées ?"

 

Problématique

GEODISCO est un projet de collaboration interdisciplinaire qui réunit des chercheurs en linguistique (ICAR, D. Vigier), en informatique (LIRIS, L. Moncla), en histoire (The Alan Turing Institute, K. McDonough) et en géographie (EVS, T. Joliveau). Il propose de faire converger les acquis, les outils et les méthodes élaborés dans trois laboratoires du pôle universitaire Lyon-St-Etienne autour d’un objet scientifique partagé : le discours géographique tenu dans les encyclopédies françaises des Lumières à Wikipédia.

Notre corpus réunit trois encyclopédies :

  • Encyclopédie ou Dictionnaire Raisonné des Sciences, des Arts et des Métiers dirigée par Diderot et d’Alembert (1751-1772) ; 
  • Encyclopædia Universalis (édition numérique 2018) ;
  • Wikipédia (version juillet 2018).

Notre objectif est de combiner les méthodes et les ressources du TAL et de la cartographie d’une part, des humanités numériques et de la statistique textuelle d’autre part, afin de proposer une première analyse de la manière dont ces trois encyclopédies se réfèrent à - et rendent compte de - l’espace. L’objectif, combinant approche linguistique, historique et géographique, est d’explorer les méthodes automatiques d’annotation spatiale des textes encyclopédiques et de cartographie des toponymes cités, cartographie que nous enrichirons d’informations contextuelles extraites des textes. Notre conviction est que de telles visualisations enrichies par des informations linguistiques constitueront des objets numériques à fort potentiel heuristique en vue de mieux appréhender et de mieux comparer les spécificités du discours géographique tenu dans telle ou telle œuvre de notre corpus.

 

Responsable scientifique

Denis Vigier, linguistique (Univ. Lyon 2, ICAR)

Partenaires

ICAR, EVS, LIRIS, The Alan Turing Institute (London)