Indexation et modélisation

Date : 
Vendredi 29 Mars 2019 - 10:00 à 17:00
Lieu : 
Université St-Etienne, 33 rue du 11 Novembre, St-Etienne (Bât. G, salle G0.5)

Atelier "Indexer les corpus numériques" organisé par le laboratoire IHRIM, en collaboration avec l'Université St-Etienne, le Consortium Cahier et la MSH Lyon St-Etienne, dans le cadre de son axe scientifique Sociétés et humanités numériques

L’édition critique est l’un des axes structurants de l’Institut d’Histoire des Représentations et des Idées dans les Modernités (IHRIM - UMR 5317). Le laboratoire mène en particulier de nombreux projets d’éditions numériques, pour lesquels il jouit d’une véritable reconnaissance. Dans ce domaine en pleine expansion des Humanités numériques, le partage des compétences et la diffusion des bonnes pratiques se révèlent essentiels.

Pour l’édition numérique de corpus, la constitution d’index est un véritable enjeu scientifique et technique, pour lequel il existe encore peu de documentation. Les index relèvent, avec l’annotation, de l’exploitation scientifique des textes édités : ils sont des outils de navigation dans le corpus et participent à sa compréhension en identifiant les personnes, les lieux et les œuvres mentionnés, ainsi que les matières traitées. L’exploitation de ces données aide par exemple à visualiser des réseaux de relations. Les référentiels et les notices d’autorités permettent d’uniformiser et de consolider les index grâce à l’emploi d’un vocabulaire contrôlé et de formes normalisées. Ils apportent des solutions au traitement des variantes des patronymes, des toponymes et des titres d’ouvrages. Dans la perspective du Linked Open Data, l’alignement sur des référentiels aide à enrichir les données d’un projet en les complétant avec d’autres ressources et bases de données (data.bnf.fr, IdREF, VIAF, ISNI).

L’atelier, fondé sur le partage d’expériences d’ingénieurs et de chercheurs impliqués dans l’édition de corpus numériques, vise à définir les bonnes pratiques utiles à l’établissement d’index, pour identifier et documenter de manière univoque une notion ou une entité nommée : quels sont les référentiels à utiliser ? Comment valoriser au mieux son corpus ? Comment structurer ces données ? Quelles sont les solutions techniques ?

Public : Journée ouverte à tous chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en sciences humaines et sociales.

 

Programme

09h30 : Accueil

Traitement des données
Présidence de séance : Sabine Loudcher (Université Lumière Lyon 2, ERIC et ICOM)
10h00 : Conférence d’ouverture : Propositions de la TEI pour l’indexation : encodage de texte ou encodage de données ? - Lou Burnard (Université d’Oxford, co-fondateur de la Text Encoding Initiative)
11h00 : Indexer les personnages, annoter les caractères : expérimentations sur quelques nouvelles - Ioana Galleron (Univ. Sorbonne Nouvelle - Paris 3, Lattice), Cécile Meynard (Université d’Angers, CIRPaLL) et Fatiha Idmhand (Université de Poitiers, CRLA-Archivos)

Indexation et corpus numériques
Présidence de séance : Lou Burnard (Université d’Oxford)
11h50 : Pour une histoire sociale de l’institution (l’Europe angevine, XIIIe-XIVe s.) : construire un outil d’analyse prosopographique - Thierry Pécout (UJM Saint-Etienne, LEM-CERCOR)
14h00 : Saint-Simonisme, une utopie innovante à revisiter - Michel Bellet (UJM St-Etienne, GATE)
14h50 : "Emergence de l’art contemporain en Auvergne-Rhône-Alpes", ou comment la reprise d’une enquête conduit à développer une plateforme de stockage, de présentation et de fouille dans les données visuelles - Pascal Vallet (UJM St-Etienne, Centre Max Weber)

Présentation d'outils
15h30 : Indexer les corpus avec Solr et Drupal - Gérald Chatagnon (UJM St-Etienne, DSI) et Ahmad Fliti (CNRS, LEM-CERCOR)
15h50 : Un exemple d’outillage pour indexer et aligner des données XML : combiner XXE et OpenTheso - Maud Ingarao (ENS de Lyon, IHRIM)

Synthèse du séminaire
Christelle Bahier-Porte (UJM St-Etienne, IHRIM)

 

Comité d'organisation

Emmanuelle Perrin (UJM St-Etienne, IHRIM)
Fabienne Vial-Bonacci (CNRS, IHRIM)

 

Informations pratiques

Inscription gratuite mais obligatoire, avant le 20 mars, par mail : fabienne.vial (a) univ-st-etienne.fr
Contact : ihrim-seminaire-index (a) univ-st-etienne.fr