Cycle de vie des données
Les données de recherche ont une longue durée de vie, souvent plus longue que la période comprise entre leur création et la rédaction de la publication scientifique pour laquelle elles ont été créées. La fonction et la valeur des données changent d'une phase à l'autre du cycle. La notion de cycle de vie des données de recherche est un outil qui peut être utilisé pour cartographier différentes phases et voir comment elles se connectent l'une à l'autre. L'utilisation d'un cycle de vie permet de passer d'une perspective à court terme à une perspective à long terme dans la gestion des données.
Élaboré par UK Data Archive, le modèle de référence du cycle de vie des données de recherche "Research Data Lifecycle" définit 6 principales étapes : Création des données ; Traitement des données ; Analyse des données ; Préparer les données pour la préservation ; Accès aux données ; Réutilisation des données.
Chacune de ces étapes est composée de plusieurs actions à réaliser pour assurer une gestion adéquate des données de recherche.
Uniris a développé une vision similaire basée également sur 6 phases :
- Gestion planification du projet (DMP)
- Collecte ou création des données
- Organisation et analyse
- Préservation et curation
- Archivage et partage (publication)
- Réutilisation des données
La prise en compte de ces 6 phase permet la réalisation des aspects suivants :
- Stockage sécurisé durant la phase active
- Stockage intermédiaire (Long term storage) des données organisées et documentées
- Archivage sur un dépôt FAIR et non commercial, et partage (Open research Data)
Un distinction s'opère entre les données actives de recherche, la préservation d’une partie de ces données (conservation à long terme) et l'archivage/partage pérenne des données.
- les données actives de recherche sont les données en cours d’utilisation par le chercheur ;
- les données conservées à long terme sont des données qui ont déjà été analysées et qui sont là pour consultation et/ou utilisation dans le cadre d’une autre recherche, ou qui n'ont pas été encore exploitées lors de la première recherche ;
- les données qui sont archivées de façon pérenne et partagées via un dépôt de données FAIR et non commercial, le sont pour permettre leur accessibilité et leur réutilisation dans le temps et répondre ainsi aux enjeux de l'Open research Data.
Voir le schéma ci-contre.