Littéralement "donnée sur la donnée", une métadonnée est une donnée servant à définir ou décrire une autre donnée quel que soit son support.
Les métadonnées documentent la façon dont les données ont été générées, sous quelle licence et comment elles peuvent être réutilisées. Elles fournissent également le contexte pour une interprétation appropriée par les autres chercheurs.
Chaque set de données collecté ou créé devrait être accompagné de métadonnées exhaustives, respectant les standards, règles et conventions d'une discipline, et également lisibles par une machine. Voir Guide to writing "readme" style metadata (Cornell University).
Bien que les responsables de données et, de plus en plus, les chercheur·es sachent que de bonnes métadonnées sont essentielles à l'accès aux données de recherche et à leur réutilisation, il peut être complexe de déterminer précisément quelles métadonnées saisir. Il convient de garder à l'esprit que seules des métadonnées de qualité soutiennent les principes FAIR.
Set minimal de métadonnées
Consortium international de bibliothèques et services spécialisés dans les sciences de l'information, DataCite a développé un schéma de métadonnées pour la publication et la citation des données de recherche. Dans son Metadata Schema Documentation for the Publication and Citation of Research Data (Version 4.2., 2018), le set minimal de métadonnées obligatoires à utiliser, lors de la description de (sets de) données, est le suivant :
- Identifier (of the dataset)
- Creator
- Title
- Publisher
- PublicationYear
- RessourceType
Certaines autres métadonnées sont optionnelles :
- Subject
- Contributor
- Date
- RelatedIdentifier
- Description
- GeoLocation
Métadonnées disciplinaires
De nombreuses disciplines ont développé des standards spécifiques de métadonnées. Une liste complète est disponible sur le site du Digital Curation Center et sur le site FAIRsharing.org.
Data Documentation Initiative (DDI)
Cette initiative est un standard international pour la description de données produites dans les sciences sociales, comportementales, économiques et de la santé. Les standards DDI permettent aux données d'être documentées, découvertes ainsi qu’interopérables. Les spécifications et les outils sont disponible sur le site du DDI.
Metadata Standards Directory Working Group
Le groupe de travail sur le répertoire des normes de métadonnées est appuyé par des personnes et des organisations qui participent à l'élaboration, à la mise en œuvre et à l'utilisation des métadonnées pour les données scientifiques. L'objectif primordial est d'élaborer un répertoire ouvert et collaboratif de normes de métadonnées applicables aux données scientifiques, afin de relever les défis en matière d'infrastructure et d'organisation des données.