Modélisation des données d'enquêtes : la régression logistique

Date : 
Jeudi 27 Juin 2013 - 09:30 à 17:30
Lieu : 
ISH, 14 avenue Berthelot, Lyon 7e (salle Ennat Léger)

Formation proposée par l'ISH / Traitement et analyse de données

Intervenant : Bruno Cautrès (CEVIPOF, Sciences Po Paris, CNRS)

Objectifs : L’analyse de régression logistique fait aujourd’hui partie des techniques statistiques standard pour les utilisateurs de sciences sociales.
Ces disciplines sont en effet fréquemment utilisatrices de données d’enquêtes, collectées au niveau micro-individuel par questionnaires. Les données ainsi collectées sont souvent mesurées par des échelles ordinales ou des variables catégorielles. Dans ce cadre, modéliser une proportion ou une probabilité ne peut être réalisé par la méthode statistique la plus connue parmi les modélisations, à savoir le modèle de régression linéaire. On fait alors usage du modèle de régression logistique.
Très utilisé depuis longtemps dans des disciplines qui modélisent une probabilité issue d’une distribution binomiale (par exemple en épidémiologie : guéri/ non guéri ; mort / survie ; amélioration / détérioration), ce modèle a fait son apparition en sciences sociales plus récemment. Si de nombreuses présentations de ce modèle sont disponibles, elles présentent souvent deux défauts : être trop complexes ou au contraire trop simplificatrices. Le but de cette journée est de se situer entre ces deux écueils et de permettre aux participants de repartir avec un guide d’interprétation leur permettant de progresser par eux-mêmes ensuite et d’éviter quelque uns des pièges d’interprétation.
La journée alternera présentations théoriques et applications sur données d’enquêtes (logiciel SPSS). Le niveau de formalisation statistique sera intermédiaire, avec le minimum requis permettant de lire des travaux, d’apprécier leur bonne utilisation du modèle et de pratiquer soi-même.

 

Programme

1e Partie - Le modèle de régression logistique : grands principes théoriques

  • Modéliser une proportion ou une probabilité : odds, odds-ratios, logit. Logarithmes et exponentielles.
  • Pourquoi le modèle de régression OLS ne peut être utilisé dans ce cas ?
  • La fonction logistique
  • Le modèle de régression logistique : principes de l’estimation du maximum de vraisemblance, qualité de l’ajustement, tests statistiques, estimateurs, probabilités prédites

2e Partie - Pratiques et exemples d’interprétation sur données d’enquêtes

  • Interprétation détaillée et pas à pas d’un modèle sur données d’enquêtes, estimé par SPSS.
  • Quelques pièges d’interprétation
  • Le modèle de régression logistique multinomial : présentation et exemple commenté


Logiciel utilisé : SPSS

 

Inscription obligatoire (formation payante) >> formulaire en ligne

Contacts : Céline Faure / Sofiane Bouzid

À télécharger : 
Mots-clés :