Diffuser la culture de la reproductibilité par une formation aux bonnes pratiques: de la qualité d'un projet aux pipelines de données
Lino Galiana  1, *@  , Romain Avouac@
1 : INSEE
Institut national de la statistique et des études économiques (INSEE)
88 avenue Verdier, 92120 Montrouge -  France
* : Auteur correspondant

L'objet de cette communication est de présenter les choix faits pour diffuser la culture de la reproductibilité à l'INSEE avec R à travers une formation ouverte et construite de manière collaborative : https://inseefrlab.github.io/formation-bonnes-pratiques-git-R/

L'objectif de cette formation est de sensibiliser des publics aux niveaux de compétences divers à la culture de la reproductibilité et au partage de projets statistiques s'appuyant sur le langage R.

Après avoir proposé des éléments généraux sur la lisibilité d'un code et d'un projet statistique en R, cette formation propose une série de choix opinionated: quels formats de données privilégier ? comment gérer dans un projet ouvert des éléments de configuration à ne pas partager comme des jetons ? doit-on systématiquement structurer son projet sous forme de package ?

Plutôt que d'insister sur le développement de packages, qui est assez exigeant sur la maintenance de documentation et de tests, cette formation propose plutôt dans le cadre de projets statistiques de privilégier l'apprentissage des environnements virtuels (avec renv) et des pipelines de données (avec targets).



  • Poster
Personnes connectées : 1 Vie privée
Chargement...