Statistiques

Collecte, organisation et exploration de données de recherche

La MSH met à disposition un environnement scientifique et technique spécifiquement dédié aux recherches en sciences humaines et sociales par le biais d’un accompagnement en matière de collecte, traitement et analyse statistique des données.

Collecte de données

La MSH conseille les équipes de recherche sur les sources de données disponibles et leurs modes d’accès et d’utilisation. Les chercheurs sont guidés pour accéder aux bases de données de la statistique publique (PROGEDO, Réseau Quetelet) ou recueillir des résultats de recherche. Ils peuvent être orientés vers des sources de données privées, Open Data, etc. et les techniques de moissonnage appropriées.

Des méthodes sont aussi proposées pour l’élaboration d’enquêtes statistiques quantitatives ou qualitatives outillées, ou plus largement la mise en place d’expérimentations.

 

Données publiques

Le portail Quételet-Progedo-Diffusion diffuse actuellement, plus de 1500 jeux de données françaises, internationales ou confidentielles (CASD). De nouveaux fichiers de données sont régulièrement ajoutés au catalogue.

La MSH aide les chercheurs et techniciens à trouver la documentation des enquêtes pertinentes pour leurs travaux. En fonction des enquêtes, la documentation peut être constituée : du ou des questionnaire(s), du dictionnaire des variables, des instructions aux enquêteurs, du cahier des cartes, d’une bibliographie, etc.

 

Moissonnage et extraction de données

Lorsque des informations sont disponibles publiquement, une collecte peut être réalisée de façon automatique en interrogeant des services web qui mettent à disposition des données selon des critères/filtres spécifiques. A défaut de la disponibilité d’un service web, cette collecte peut aussi être réalisée par la capture d’informations directement sur un site internet classique diffusant des informations de façon structurée (web scraping), avec des outils comme Python ou Selenium.

Traitement et analyse statistique

La MSH apporte conseil et expertise pour l’utilisation d’outils informatiques, aide à l’écriture et l’interprétation des résultats, et à la relecture des analyses statistiques en vue de publications scientifiques. Elle assiste les équipes scientifiques dans l’application de techniques de traitement et d’analyse statistiques : statistique descriptive et inférentielle, data mining, régression.

 

En terme de méthodes et techniques, le processus d’accompagnement et de traitements peut couvrir les concepts liés à :

  • la description et l’exploration des données : représentation graphique, méthodes alternatives, mesure de variabilité et de tendance ;
  • l’inférence statistique dans le cas paramétrique et non paramétrique ;
  • l’analyse de données multidimensionnelles dans un but explicatif et descriptif ;
  • la classification des données en utilisant les méthodes non supervisées ;
  • la fouille de données basées sur les méthodes supervisées ;
  • la fouille de textes par des méthodes de textométrie et de text mining ; le traitement automatique de la langue ;
  • l’analyse de réseaux dirigés et non dirigés, visualisation et caractéristiques ;
  • le machine learning et l’intelligence artificielle (IA).

 

La MSH forme les chercheurs pour exploiter leurs données et propose des formations rapides et personnalisées en fonction de leurs besoins. Un programme de formation aux méthodes et outils statistiques est aussi proposé aux chercheurs et doctorants (Semainre DataSHS, cartographie, parcours quantitatif, etc.).

Outils, logiciels, documentation

Outils et logiciels

S’appuyant sur la connaissance d’outils et logiciels spécialisés, la MSH peut notamment aider, intervenir sur les logiciels suivants :

  • Bases de données : MySQL, Oracle, Access, MariaDB
  • Traitement quantitatif de données : R, SAS, SPSS, Python
  • Traitement qualitatif de données : SPHINX, TXM, Iramuteq, Gargantext, ATLAS.ti
  • Enquêtes : SPHINX, LimeSurvey, Modalisa
  • Visualisation cartographie : R, Cartes & Données,MapInfo

 

En lien avec les IR* Progedo et HumaNum, la MSH apporte également son conseil dans le déploiement de bases de données sécurisées : organisation, consolidation, conservation, partage et archivage des données recueillies dans le cadre de projets de recherche.

 

Logiciels mutualisés
Disponibles en licences flottantes

  • SPSS : logiciel de traitement statistique généraliste (version 26, pour PC et Mac) >> Nouveautés de la version 26 & tutoriels en ligne
  • ATLAS.ti : logiciel d’analyse de données qualitatives

 

Documentation

La MSH met à disposition (en consultation) des manuels relatifs aux méthodes et outils statistiques. Pour consulter la liste des ouvrages disponibles, reportez-vous au catalogue en ligne Smultidoc.

Enquêtes, données personnelles

Des méthodes sont proposées pour l’élaboration d’enquêtes statistiques quantitatives, anthropologiques ou qualitatives outillées, ou plus largement la mise en place d’expérimentations.

>> Enquêtes en ligne LimeSurvey : conseils et ressources

 

A partir d’une étude des objectifs et du contexte d’un projet, la MSH contribue au recueil des informations nécessaires : variables, couverture et bases de sondage, plan d’échantillonnage, conception du questionnaire ou d’une grille d’entretien (dans le cas de données qualitatives), codage des données et documentation associée, vérification, évaluation de la qualité des données, analyse et présentation des données.

 

Des informations relatives à la CNIL et les obligations dans le cadre du RGPD sont également possibles, offrant la possibilité de répondre à des questions telles que : Quand faut-il recueillir le consentement des enquêtés ? Quelles questions « sensibles » est-on autorisé à poser et sous quelles conditions ? etc.

>> Données personnelles : conseils et ressources

 

Contact

Accompagnement de projets scientifiques >> Demande de moyens (formulaire à remplir)

Assistance technique, demandes ponctuelles >> Portail de demandes informatisées (tickets), catégorie/Department Compétences statistiques

Céline Faure

Enquêtes, données publiques, RGPD, formations

Alioscha Massein

Traitement et analyse de données