
Café des données, 2023-2024
Ateliers pratiques
Cycle d’ateliers proposé par la MSH Lyon St-Etienne, dans le cadre de sa plateforme technologique PANELS.
D’octobre 2023 à mai 2024, à Lyon.
Inscription gratuite mais obligatoire (au plus tard 2 jours ouvrés avant la séance) >> formulaire en ligne
Les ateliers "Café des données" sont un dispositif de formation s’adressant au public de la recherche en sciences humaines et sociales. Doctorants, chercheurs, étudiants et ingénieurs sont les bienvenus pour participer à ces séances autour des questions qui entourent les données. L’objectif est d’apporter des connaissances, des méthodes, des retours d’expériences et des outils qui concernent l’utilisation et le traitement des données en SHS, en essayant d’aborder tous les domaines qui les concernent – science ouverte, open data, plan de gestion de données, questionnaires, traitements et analyses statistiques, stockage, archivage et diffusion – dans toutes les disciplines des SHS : par exemple, les besoins pour les économistes, les historiens, les sociologues, les géographes, ou encore les juristes sont différents. Il s’agit d’apporter à tous des informations adaptées à ses pratiques et ses méthodologies de recherche.
Pour aller à rebours d’un parcours de formation qui peut être trop chargé ou trop contraignant, nous avons fait le choix d’organiser ce "Café des données" sur un format moins formel et plus court : nous organisons des ateliers thématisés d’une heure, qui s’ouvrent sur la présentation d’une méthode, de techniques, de plateformes, qui se poursuivent par une discussion sur vos sujets de recherche et vos données. Cette évolution vers une forme de permanence, nous permet ainsi de guider les participants dans leurs pratiques, tout en échangeant sur les différents savoir-faire des uns et des autres. Le principe est de créer un espace d’échange et d’accompagnement sur les questions relatives aux données, et nous sommes persuadés que les expériences personnelles et le travail avec ses propres données de recherche permet de mieux aborder ces questionnements.
Ces ateliers s’adressent à tous les publics de tous les niveaux. Venez avec ou sans données, quelques soit leur forme : questionnaire, entretiens, corpus d’images, de textes, de vidéos, d’entretiens… nous pourrons vous donner des informations pour exploiter au mieux ces matériaux. En plus de pouvoir avoir des retours de notre part, il est encouragé de partager votre propre expérience sur les données des autres participants. Quelle que soit votre discipline et votre expertise, il est toujours pertinent de croiser les pratiques des disciplines de recherche entres elles. De plus, cela nous permet de prendre en compte vos besoins en terme de formations pour mettre en place des ateliers dédiés.
Le "Café des données" a vocation à être un dispositif qui se déroule tout au long de l’année, un mardi de chaque mois, afin d’être un espace d’échange régulier, et qui s’adapte au mieux aux besoins des personnes qui viennent à ces ateliers. Enfin, qui dit "Café des données", dit café et thé offerts sur place pour pouvoir discuter autour de ces questions.
Public : ces ateliers sont ouverts à tous les personnels (chercheurs, enseignants-chercheurs, ingénieurs et techniciens, doctorants) membres des laboratoires associés à la MSH Lyon St-Etienne.
Programme
Mardi 10 octobre 2023 (9h-10h, salle Elise Rivet) >> inscription [formulaire clos]
Acquisition, traitement de données : PUD-Panels & pôle numérisation
Orline Poulat, Céline Faure, Alioscha Massein, Alexandra Dugué et Hélène Kieffer (MSH Lyon St-Etienne)
Pour cette 1e séance, nous vous présenterons la plateforme PANELS, ses compétences et ses missions d’accompagnement de la recherche, pour vous donner un premier aperçu de ce qu’il est possible de faire et de ce que nous pouvons mettre en place pour vous apporter les outils et méthodes nécessaires à vos travaux de recherche. Hélène Kieffer présentera aussi le pôle Numérisation de la MSH (matériel à disposition, outils OCR et traitement d'images), afin de montrer l’ensemble des activités de traitements de données réalisables.
Mardi 14 novembre 2023 (9h-10h, salle Elise Rivet) >> inscription [formulaire clos]
Persée et les perséides, des corpus numérisés pour les projets de recherche
Agnieszka Halczuk, chargée de partenariats recherche (Persée)
Depuis 2005, Persée diffuse en accès libre plus d'un million de documents. Il s'agit de la littérature scientifique française enrichie par des liens avec des référentiels. Persée fabrique également les Perséides, sites web dédiés à des corpus de recherche qui peuvent être atypiques (presse ancienne, archives de fouilles). Afin de mieux répondre aux besoins de chercheurs, d'autres canaux de diffusion comme IIIF ont été conçus. L'objectif est de vous montrer les types des données mis à disposition pour une réutilisation libre dans des projets de recherche (études textométriques, constitution des bases de données thématiques, fouille de texte), ainsi que les canaux et conditions d'accès à ces données.
Mardi 16 janvier 2024 (9h-10h, salle André Bollier) >> inscription [formulaire clos]
Huma-Num : accéder aux outils de recherche et enquêter sur les pratiques
Orline Poulat, Sonia Guérin-Hamdi, Sylvain Besson (MSH Lyon St-Etienne)
L’IR* Huma-Num met à disposition des chercheurs un ensemble d’outils pour les accompagner dans le traitement, l’analyse et la valorisation de leurs données. Ces services, ouverts à l’ensemble de la communauté de la recherche, sont parfois peu connus, ou mal référencés, d’où la présence sur les sites universitaires de référents Huma-Num pour orienter, conseiller et accompagner les personnels sur ces outils. Pour mieux évaluer la qualité et l’utilisation de ses services, Huma-Num cherche aussi à questionner les usages sur le site de Lyon Saint-Étienne grâce à une enquête menée par Sylvain Besson. Ce café des données sera l’occasion de revenir d’une part sur les outils d’Huma-Num et leur accès, ainsi que sur le lancement de l’enquête.
Mardi 13 février 2024 (9h-10h, salle André Bollier) >> inscription [formulaire clos]
Heurist : créer vos bases de données
Vincent Ventresque (Univ. St-Etienne, TRIANGLE & IHRIM)
Heurist, créé en 2005 par le professeur Ian Johnson, est un système de gestion de base de données qui entend répondre au besoin croissant d'organisation des données, au moyen d'un outil à la prise en main facile et ne nécessitant pas de connaissances informatiques préalables. Utilisable par l'ensemble des disciplines en SHS, Heurist intègre des fonctionnalités de travail collaboratif, de visualisation de données textuelles, géographiques, ou encore temporelles, mais aussi de mise en ligne simple mais effective des données. Fort d'un partenariat avec l'IR* Huma-Num, cet outil de création et gestion de base de données a en premier lieu été pensé pour permettre de renforcer l'autonomie du travail des chercheurs au regard de l'indisponibilité potentielle de personnes ressources en ingénierie.
Cette présentation sera ainsi constituée d'un retour d'expérience critique de l'outil, à partir de trois projets de recherche illustrant la diversité des types de données pouvant être traitées via Heurist : Rey’s Ornament Image investigation et les ornements, Ricci Mappemonde et l'information géographique et picturale, et la base prosopographique du projet Rockefeller Fellows.
Mardi 12 mars 2024 (9h-10h, salle André Bollier) >> inscription [formulaire clos]
OpenRefine : nettoyer vos données
Séverine Gedzelman et Pierre-Yves Saunier (CNRS, TRIANGLE)
OpenRefine est un outil libre qui permet de nettoyer, classer, transformer des données structurées dans des tables. Son interface permet une prise en main très rapide et se double d’une connexion avec Python pour des traitements plus avancés de l’information.
Les nombreuses fonctionnalités de l’outil permettent de transformer un tableau de données brutes en un tableau de données exploitable pour diverses analyses (statistiques et autres). Des outils intégrés permettent aussi bien d'éliminer des caractères superflus dans des séries de cellules que de redistribuer complètement les valeurs d'un tableau, et des fonctions ad hoc peuvent être rédigées. Il est également possible d’utiliser OpenRefine pour normaliser et réconcilier ses données avec les données de Wikidata, ce qui permet d’aligner ses données avec des informations normées et donc interopérables.
La séance débutera avec une évocation de la gamme des fonctionnalités d'OpenRefine, puis nous reviendrons sur quatre situations d'usage où l’outil nous a tiré d'affaire: repérage de doublons et autres proximités complexes, ou encore éclatement de colonnes à valeurs multiples. On pourra également voir les possibilités de liage des données (data.bnf) sur des auteurs présents dans une base de données concernant les professeurs en droit au siècle dernier (projet Siprojuris) et réaliser une démonstration de la détection de doublons dans cette base.
Mardi 16 avril 2024 (9h-10h, salle André Bollier) >> inscription [formulaire clos]
IRaMuTeQ : Exploiter vos données textuelles
Sarah Leveaux, doctorante (Univ. Lyon 2, RADIATIONS)
IRaMuTeQ (Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires) est un logiciel libre et ouvert d'analyse de données textuelles ou de statistique textuelle. Cet outil regroupe un ensemble de techniques et méthodes d’analyse statistiques de textes qui simplifient l’exploitation de vos données textuelles.
Cette séance sera présentée par Sarah Leveaux, qui montrera comment elle a utilisé Iramuteq sur différents corpus (enquête en ligne, corpus de commentaires Facebook) dans le cadre de sa thèse et de divers projets. Notamment à travers l'identification des représentations sociales et des émotions liées au contexte de la pandémie du Covid-19 ou des représentations sociales des théories du complot. Son article : https://jspp.psychopen.eu/index.php/jspp/article/view/6201
Mardi 21 mai 2024 (9h-10h, salle Elise Rivet) >> inscription [formulaire clos]
Permanence libre : venez avec vos données, questions
Orline Poulat, Céline Faure, Alioscha Massein, Alexandra Dugué (MSH Lyon St-Etienne)
Cet atelier libre est une véritable permanence centrée autour de vos données et de vos terrains de recherche. Ce format nous permet de vous accompagner, quel que soit votre niveau, et d’apporter des pistes de réflexions et des outils pour approfondir vos travaux.
Informations pratiques
Lieu : MSH Lyon St-Etienne, 14 av. Berthelot, Lyon 7e (salle Elise Rivet, 4e étage, ou salle André Bollier, rdc)
Inscription gratuite mais obligatoire (au plus tard 2 jours ouvrés avant la séance) >> inscription [formulaire clos]
Contacts : Alioscha Massein (MSH Lyon St-Etienne) - alioscha.massein (b) msh-lse.fr - Tél. +33(0)4 72 72 65 06
Orline Poulat (MSH Lyon St-Etienne) - orline.poulat (b) msh-lse.fr - Tél. +33(0) 4 69 66 11 54