Données ouvertes & FAIR

Pourquoi ouvrir et partager ses données de recherche ?

Un certain nombre de raisons encouragent le partage des données de recherche. Ce partage :

  • facilite la reproduction et la vérification des expériences et recherches menées ;
  • rend davantage visible les travaux et résultats de recherche ;
  • augmente le nombre de citation des articles scientifiques pour lesquels les données de recherche sont également publiées ;
  • encourage les nouvelles collaborations et nouvelles pistes de recherche ;
  • soutient le principe d’intégrité scientifique ;
  • répond aux exigences de certains bailleurs de fonds et éditeurs scientifiques.

L’UNIL prône une recherche intègre et responsable qui vise à gérer les données de recherche de manière transparente et ouverte, dans les limites du droit et des prescriptions scientifiques en matière d’éthique, de déontologie et du respect des standards en matière de protection de l’individu et de la propriété intellectuelle.
A l'instar de l'Union européenne et de son programme Horizon2020, l'UNIL prône donc une publication des données "as open as possible, as closed as necessary". Cela signifie une ouverture dans les limites du droit et des prescriptions scientifiques en matière d’éthique, de déontologie et du respect des standards en matière de protection de l’individu et de la propriété intellectuelle (voir la Stratégie Open science de l'UNIL).

Open source et code informatique

La notion d'Open source n'est pas à confondre avec l'Open research Data.

L'Open source est un moyen transparent de développer des logiciels et de les rendre librement accessibles à d'autres utilisateurs. Le code source d'un programme est mis à la disposition des individus pour qu'ils puissent y accéder, le modifier et le réutiliser, contrairement aux logiciels propriétaires.

Pour le partage et le dépôt du code informatique, l'UNIL recommande la plateforme suisse non-commerciale c4science, une infrastructure pour la co-création, conservation, partage et tests de codes scientifiques. Disponible pour l'ensemble de la communauté universitaire suisse et accessible aux collaborateur·trice·s externes, cette plateforme est hébergée sur SWITCHengines, gérée par l'EPFL-SCITAS, créée via EnhanceR.

Pour plus d'infomation, vous référer aux pages dédiées du Digital Curation Center (DCC).

Principes de données FAIR

De manière générales, les principes FAIR (Wilkinson et al., 2016) concernent l'ouverture, la communication, l'appropriation et la réutilisation des données de recherche.

Voir la présentation interactive de DoRANum qui explique de façon simplifiés chaque item des principes FAIR.

Pour le Fonds national de la recherche suisse et l'UNIL, les données doivent donc être gérées selon les principes FAIR. Ces principes permettent de s'assurer qu'un ensemble de données puisse être facile à trouver (Findable), qu'il soit accessible (Accessible), interopérable (Interoperable) et réutilisable (Re-usable).

Télécharger les explications des principes FAIR promus par le FNS.

Les aspects Findable et Accessible s'intéressent principalement à l'endroit où les données sont déposées. Les considérations importantes à prendre en compte comprennent la disponibilité de DOI persistants, des métadonnées, du suivi de la réutilisation des données, des licences, du contrôle d'accès et de la disponibilité à long terme (conservation pérenne).

Les aspects Interoperable et Re-usable soulignent l'importance de réfléchir au format des données (propriétaire vs. ouvert) et à la façon dont ces formats pourraient changer à l'avenir, ainsi qu'à l'interopérabilité (ouverture via API) du dépôt choisi vers d'autres méta-dépôts internationaux ou disciplinaires, ou d'autres outils de mise en valeur. L'aspect d'une documentation détaillée entre également en compte dans la réutilisabilité des données ainsi que du code.

15 principes ont été édictés par FORCE11, une comunauté regroupant des chercheurs, bibliothécaires, archivistes, responsables de publications scientifiques, instituts de financement, etc. Ces principes se regroupent sous les 4 principes généraux : Facile à trouver, Accessible, Interopérable et Réutilisable.

Sur la base des 15 principes ci-dessus, un ensemble de 14 paramètres ont été définis pour quantifier les niveaux de "FAIRness". Ces derniers développements sont disponibles sur le site GO-FAIR.

Une bonne gestion des données est un moyen de soutenir les principes FAIR.

En pratique, le DMP est l'instrument naturel de la "FAIRification" de la recherche, en mettant en place la découverte des données, leur accessibilité, leur interopérabilité et leur réutilisation.

Suivez nous:    

Le saviez-vous ?

La Commission européenne a estimé le coût annuel de l’absence de données FAIR à un minimum de 10,2 milliards d’euros par an !

Cost-benefit analysis for FAIR research data, 2019

Make scientific data FAIR !

Toutes les disciplines devraient suivre les géosciences et exiger les meilleures pratiques pour la publication et le partage des données...

Lisez cet article paru dans Nature en juin 2019.

Data Management Expert Guide

Data_Management_Expert_Guide_-_CESSDA_TRAINING.jpg

Retrouvez de nombreuses ressources sur le Data Management Expert Guide pour vous aider dans la gestion FAIR de vos données.

Partagez: