Archivage des métadonnées

VALIBEL

Ajout dans la base de données Valibel / Structure des métadonnées

 

Le terme métadonnée semble être monnaie courant dès qu’il est question de gestions de documents numériques. En effet, afin de pouvoir gérer des documents numériques, il est nécessaire de recueillir des informations sur celui-ci (e.g. auteur, date, lieu, etc.). Ceci a pour but de pouvoir retrouver le document en question grâce à l’utilisation de mots-clés mais aussi de pouvoir en faciliter la consultation, la conservation et, si nécessaire, la destruction.

Il est important de noter que les métadonnées ne représentent pas une fin en soi. Cependant, l’environnement numérique dans lequel nous nous situons actuellement impose de pouvoir fournir des informations structurées sur tout document.

1. Qu'est-ce qu'une métadonnée ?

Comme indiqué par le terme méta, une métadonnée est une donnée sur une donnée. Elle représente ainsi un ensemble structuré d’informations qui tendent vers une description exhaustive d’une ressource quelconque. Une métadonnée peut également renvoyer à des étiquettes permettant aux chercheurs de retrouver des informations au sein de jeux de données.

2. Pourquoi documenter des métadonnées ?

Quatre points importants peuvent être relevés :

  • Afin de faciliter la recherche et comprendre le contenu :
    • Décrire le contenu de fichiers ainsi que les possibles relations entre ceux-ci ;
    • Classer le contenu suivant un degré de difficulté ou un public cible ;
    • Mieux référencer un site ou une page sur internet.
  • Pour faciliter l’interopérabilité et garantir la pérennité de l’accès aux données :
    • Conserver, partager et échanger des informations.
  • Afin de faciliter la gestion et l’archivage de documents :
    • Informer sur le cycle de vie des documents ;
    • Gérer des collections de ressources ;
    • Gérer des archives électroniques.
  • Pour gérer et protéger les droits :
    • Les droits de propriété intellectuelle ;
    • Les droits d’accès à des pages web (notamment des restrictions de consultation).

3. Comment les métadonnées sont-elles archivées ?

Afin de favoriser l’archivage pérenne des (méta)données, des dictionnaires – ou jeux – de métadonnées ainsi que des standards d’empaquetage des métadonnées existent (e.g. le Dublin Core). Ces standards sont constitués de différents éléments, dont :

  • Les titres ;
  • Le/les créateur(s) ;
  • Les sujets ;
  • Des descriptions ;
  • Les dates ;
  • Le type de donnée ;
  • Le format des données ;
  • La sources des données ;
  • La langue des données ;
  • Les droits ;
  • ...

Le Dublin Core a donné naissance à de nombreux autres modèles dont la plupart se sont focalisés sur les ressources documentaires. Il est cependant important de remarquer que le Dublin Core ne répond pas aux besoins d’archivage des métadonnées, car il ne fournit aucune information sur le rattachement à un processus ou encore sur la durée de conservation des métadonnées.

D’autres modèles ont ainsi été créés, notamment le XML (eXtensible Mark-up Language). Ce dernier donne aux métadonnées une puissance opérationnelle en matière de recherche, de gestion ou encore d’opérabilité. Le XML permet de créer des ressources parfaitement structurées et pérennes.

4. Métadonnées à caractère personnel et RGPD ?

Depuis la mise en vigueur du RGPD le 25 mai 2018, les métadonnées à caractère personnel possèdent elles aussi un statut particulier. Dans quelles situations faut-il conserver ou supprimer les métadonnées à caractère personnel et quand ces dernières doivent-elles être anonymisées ?

  • Lorsque l’archivage et le partage de (méta)données à caractère personnel ne porte pas préjudice à la personne concernée par ces dernières et lorsque ces données ont une certaine valeur historique, la conservation sans limite des données est envisageable (e.g. lorsque des métadonnées ont des fins archivistiques, historiques ou statistiques). Dans ce cas précis, il est possible de donner accès aux (méta)données à un public cible ;
  • Les métadonnées doivent être supprimées dans le cas de documents à durée de vie limitée (i.e. lorsque la conservation correspond à la durée du traitement nécessaire pour l’activité) ;
  • Lorsque les documents doivent être conservés pour une durée supérieure à celle du traitement nécessaire pour l’activité, il est recommandé de suivre les directives du texte du RGPD et d’anonymiser les données.

5. Références supplémentaires

  • Pour des métadonnées plus techniques ayant des fonctions de conservation, voir PREMIS (i.e. Preservation Metadata : Implementation Strategies) : Lien
  • Pour des thèses électroniques, voir TEF : Lien
  • Pour les ressources d’enseignement ou d’apprentissage, voir LOM, LOMFR ou SupLOMFR : Lien
  • Pour encapsuler plusieurs blocs de métadonnées afin de décrire un objet numérique, voir METS (i.e. Metadata Encoding and Transmission Standard) : Lien

 

Informations importantes pour les mémorants et les doctorants

Les corpus collectés doivent être ajoutés dans la base de données avant le dépôt du mémoire ou de la thèse.