Plateforme Tal-IA : exploration et préparation de corpus

Café des données

Atelier proposé par la MSH Lyon St-Etienne, dans le cadre du cycle Café des données 2025-2026 et la plateforme technologique PANELS, en partenariat avec le réseau TIPS-IA.

Intervenants : Vincent Ventresque (Univ. St-Etienne, IHRIM)

 

Dans le cadre du café des données, la MSH-LSE et le réseau TIPS-IA s’associe pour présenter le logiciel développé par Vincent Ventresque à l'attention du personnel de la recherche qui s'intéresse aux questions de Traitement automatique de la langue, d’annotation automatique de document, à la classification de texte. Vincent Ventresque (UJM), ingénieur d'étude pour l'IRHIM et Triangle, nous présentera l'outil de sa conception Tal-IA.

La plateforme Tal-IA a été développée pour tester les modèles de langue open source légers sur des tâches comme l'extraction d'information, la recherche sémantique et la classification. Actuellement, deux scénarios sont implémentés : 1) l'annotation semi-automatique de corpus via la reconnaissance d'entités (notamment, modèle GliNER), couplée à une interface de correction et un export vers TXM ; 2) La sélection et la catégorisation (manuelle) de segments de texte pour servir d'exemples à une recherche sémantique ou une classification 'few-shot’.
Aperçu des fonctionnalités de l'outil : https://ganeshs.hypotheses.org/433

 

 

Public : ces ateliers sont ouverts à tous les personnels (chercheurs, enseignants-chercheurs, ingénieurs et techniciens, doctorants) membres des laboratoires associés à la MSH Lyon St-Etienne.

 

 

Informations pratiques

Inscription gratuite mais obligatoire (au plus tard 2 jours ouvrés avant la séance) >> formulaire en ligne
Contact : Alioscha Massein (MSH Lyon St-Etienne) - alioscha.massein (b) msh-lse.fr - Tél. +33(0)4 72 72 65 06