Eco‑responsible  images

Image compression reduces page weight and loading times.

Read more about it

Search in
Environnement Durabilité

Forte croissance de la quantité de données de recherche : quelles solutions pour la FGSE ?

Avec une génération de données numériques de recherche grandissante, l’UNIL est face à un défi financier, infrastructurel, et des dépenses énergétiques à fort impact environnemental. Une réflexion est lancée pour envisager des solutions pour l'avenir, avec une invitation à la participation de toute la communauté de recherche et des grand·es producteur·ices de données. Une liste de bonnes pratiques est d’ores et déjà disponible ci-dessous, que nous vous encourageons à consulter.

Published on 20 Feb 2024

Notre université est confrontée à une véritable explosion des données numériques, particulièrement manifeste dans le secteur de la recherche. La Faculté des géosciences et de l’environnement (FGSE), derrière la FBM et le CHUV, est désormais un contributeur majeur à cette tendance (voir le graphique, extrait de la note du Centre Informatique envoyé à la Direction en juin 2023). L’accroissement du nombre de données de recherche produites s’accélère : en 2019, l’UNIL générait environ 0,3 PétaByte (1 PB = 1024 térabyte/TB) de nouvelles données annuellement. En 2023, ce volume est passé à 1 PB. À noter que ces chiffres correspondent aux données stockées sur les serveurs institutionnels ; les données stockées hors serveurs UNIL sont difficilement quantifiables.

Chaque Pétabyte coûtant environ 100 000 CHF par an pour le seul stockage, l’impact financier de ces données est considérable. D’autre part, les données numériques ont une empreinte environnementale non négligeable (voir les articles dans les liens). Dans une perspective de sobriété numérique, chacun·e est invité à s’interroger en permanence sur sa façon de gérer ses données.

Un groupe de travail, mandaté par la Direction et composé de représentant·es de FBM, FGSE, UNIRIS et du CI, étudie les moyens de faire face à l’augmentation des données numériques. Si vous avez des idées ou des réflexions à partager, n’hésitez pas à contacter la consultante recherche de la FGSE.

Un panier bien rempli de bonnes pratiques

Voici déjà de solides pistes quant à ce que les chercheur·es de notre faculté peuvent adopter comme attitude pour gérer leurs données :

  • « Recycler » des données existantes ! Il est possible que certaines données dont vous avez besoin aient déjà été produites et aient été rendues accessibles ; le site https ://www.re3data.org/ peut vous aider à identifier des dépôts qui contiennent des données de recherche réutilisables.
  • Réfléchir d’emblée à l’utilité des données produites. Les données collectées correspondent-elles aux objectifs et aux hypothèses de l’étude ? Minimiser la collecte des données pour « si jamais » ou « cela pourrait être un jour intéressant… » vous aidera à éviter de perdre du temps et des ressources à réunir, nettoyer, traiter et sécuriser des données qui ne sont pas nécessaires.
  • Ajuster le format de stockage pour minimiser les volumes chaque fois que c’est possible. Par exemple, pour les données issues d’entretiens, les enregistrements audios doivent-ils être conservés ou simplement leurs transcriptions textuelles ?
  • Réduire le nombre de copies des fichiers tout en assurant leur sauvegarde. Le choix des infrastructures UNIL fournies par la Division calcul et soutien à la recherche (DCSR) permet de minimiser le nombre de copies de données. En effet, le NAS DCSR garantit une sauvegarde sécurisée avec seulement 2 copies (il effectue des sauvegardes à deux endroits distincts et des instantanés (snapshots) quotidiens sur une période de trois mois).
  • Privilégier les solutions de stockage les moins énergivores. Lorsque certaines données ne sont pas quotidiennement utilisées, elles peuvent être stockées sur bandes magnétiques (Long Term Storage – LTS de la DCSR).
  • Tout au long du projet, de manière régulière, sélectionner quelles versions des jeux de données sont à éliminer, à conserver, à archiver à long terme, à partager. Garde-t-on les données brutes et intermédiaires ou uniquement les données finales ? Et à quel moment éliminer les données inutiles ?
  • Privilégier l’utilisation de logiciels libres et formats de fichiers ouverts pour garantir l’accessibilité et la réutilisation à long terme de vos données – et donc la moindre génération de nouvelles données.
  • Partager, de manière « aussi ouverte que possible, aussi fermée que nécessaire », les données de recherche – ainsi que les éventuels résultats négatifs – afin de favoriser la réutilisation future d’une part et, d’autre part, d’éviter la génération inutile de données déjà existantes.

N’hésitez pas à contacter researchdata@unil.ch pour toute question.


Useful links and documents

View more news