Présentation du SSPLab

Nicolas Toulemonde
SSP Lab, animation du SSP Hub

2025-11-03

Le SSP Lab, l’innovation en science des données à l’Insee

Les missions du SSP Lab

Explorer
de nouvelles données
de nouvelles méthodes

Accompagner
les directions du SSP
dans leurs projets innovants

Animer
une communauté de data scientists
des formations à la datascience

Une petite équipe au sein de la DMCSI

  • 7 data-scientists, responsable et adjoint

  • une doctorante, une post-doctorante

  • beaucoup d’échanges et de collaborations avec les autres directions et les SSM qui portent des projets innovants

Explorer des méthodes et données

Veille active en data-science

Explorer de nouvelles données

  • les données de téléphonie mobile : depuis 2016, en lien avec Eurostat dans les groupes MNO-MINDS et multi-MNO
  • les données de carte bancaire (GIE CB), en partenariat avec la Chaire Finance Digitale

Focus : les données de téléphonie mobile

Utilité pour mesurer :

la population présente
–> calibrer :
les offres de soin
le traitement des déchets
les service de secours

la mobilité
–> interactions entre territoires
–> comportements quotidiens
–> télétravail

La téléphonie mobile pour mesurer des mouvements de population

Etude de la distribution des présences pendant confinement et déconfinement

Accompagner

Travail en partenariat avec les autres directions

  • des projets d’innovation portés par un grand nombre de départements de l’Insee, de DR et des SSM

  • certains avec de fortes exigences de passage en production

  • …d’autres plus exploratoires

  • un travail en équipe avec les data-scientists ou les statisticiens de la direction concernée par le projet

Exemple : la codification automatique

SIRENE et le passage au guichet unique

  • des délais courts
  • un enjeu pour les entreprises… et les gestionnaires SIRENE
  • une première expérience de la mise en production

La nomenclature PCS2020

  • travail en lien avec un data-scientist de l’équipe du recensement
  • objectif de mutualiser avec la codification de la PCS dans d’autres sources : enquête emploi, enquêtes ménage,…

Produits de consommation pour l’enquête Budget de Famille

  • modernisation de la collecte d’information lors de l’enquête
  • classification automatique des produits de consommation en COICOP (issus de tickets de caisses et de carnets papier ou numériques)

D’autres thèmes d’étude

  • Détection du bâti
  • Extraction d’informations dans des pdf sur les comptes sociaux des entreprises
  • Appariements entre bases de données (RESIL, BRPP3, ElasticSearch)

Animer

Former à la data-science

Le Funathon

  • Un hackathon pédagogique destiné à faire découvrir et pratiquer la data-science
  • Des notebooks pour accompagner chaque sujet, des masterclass et une assistance en continu
  • Environ 150 participants issus de diverses directions

Formations

  • Bonnes pratiques
  • Python, nouvelles sources de données,…

Animer une communauté de data-scientists

SSPHub

Le SSP Hub, le réseau des data scientists du SSP

Qu’est-ce qu’un data scientist ?

“Data Scientist (n.): Person who is better at statistics than any software engineer and better at software engineering than any statistician.” J. Wills

Organisation


  • Groupe informel, sur la base du volontariat :
    • environ 600 inscrits volontaires dans la mailing list
    • environ 300 sur Tchap
    • Equipes métiers, data-scientist méthodologues, chefs et directeurs…
  • Manifeste écrit collectivement pour rappeler l’utilité de la data science dans le public et définir la ligne éditoriale du SSP Hub

Public cible

  • Tous les agents du Service Statistique Public:
    • Indépendamment du niveau d’expertise
    • Chacun peut s’intéresser à une partie restreinte des ressources
  • Proposer du contenu pour tous :
    • Différents niveaux de ressources coexistent
    • Entrées thématiques

Objectifs

  • Faciliter l’échange entre pairs et l’émulation
  • Relayer des formations et ressources utiles
  • Créer collectivement du contenu, indépendamment de leurs institutions d’origine
  • Accompagner de manière ponctuelle des équipes
  • Offrir une vitrine des initiatives de data science
  • Valoriser les compétences des agents du SSP

Moyens d’action du réseau

Site web: ssphub.netlify.app/

  • Site web comme porte d’entrée :
    • Vers les projets et actions ;
    • Vers les newsletters ;
    • Vers des ressources utiles ;
    • Vers des partenaires.
  • Décloisonner en faisant connaître les projets des membres
  • Communiquer sur nos valeurs
  • Nouer des partenariats avec des extérieurs
    • Chercheurs, institutions…

Newsletter

  • Rappel des évènements passés/à venir et actualités
    • Formations, ressources, sujets traités…
  • Valorisation des initiatives individuelles et collectives
  • Revue d’actualité de l’écosystème de la donnée :
    • Technologique, juridique, institutionnelle…

Evénements

  • événement annuel en présentiel :
    • Présentations, retours d’expérience, tables rondes…

Rejoignez et faites vivre le réseau !

Pour rejoindre le réseau :

  • Tchap ;
  • recevoir l’infolettre en vous inscrivant ici ;
  • participer à la création de contenu sur ce site sur notre Github ;
  • par mail à .

Le SSP Cloud, le LS3 public et la formation en plus

Le SSP Cloud, la version publique de LS3

https://datalab.sspcloud.fr

Un Datalab pour l’expérimentation et la formation

  • Créée par la DIIT (Division Innovation et Instruction Technique)
  • Plateforme de datascience dimensionnée pour les usages innovants
  • Des technologies modernes qui favorisent la reproductibilité
  • Lieu de formation et d’expérimentation
  • Ouverte et collaborative

En plus de LS3 : de la formation

  • Innover sur les modes de formation
    • Vers de l’auto-formation tutorée

L’open-source à l’Insee

  • Pourquoi ouvrir ses codes ?
    • Auditabilité des agents publics
    • Meilleur qualité du code et reproductibilité des résultats
    • Une vitrine pour l’auteur.e et pour l’Insee