Préservation digitale

StandardsLogiciels open source

Standard ouvert

Specification libre

Description

La préservation digitale (digital preservation) est un domaine de recherches visant la préservation l'information digitale sur le long terme,  le long terme étant défini comme "suffisamment long pour être soumis à l’impact des changements technologiques, y compris à la prise en compte de nouveaux supports et nouveaux formats de données ou à des changements de la communauté d’utilisateurs." Cette définition, reprise au modèle OAIS, ne met cependant pas suffisamment l'accent sur la nécessité de garder l'information intelligible dans son sens initial, certains concepts évoluant avec le temps.

La préservation digitale doit être différenciée de l'archivage qui est davantage une manière de gérer le cycle de vie de l'information (capture, classement, restitution). Bien que la limite entre les deux ne soit pas toujours facile à définir, cette distinction permet de séparer les problèmes et est donc sinon pertinente au moins utile. Ces deux disciplines ont évidemment des liens en commun puisque la préservation digitale veillera à préserver (conserver) l'information archivée en la rendant pérenne.

Autrement dit, il faut d'abord archiver et puis conserver.

Problématique

La problématique de la préservation à long terme de l'information numérique est complexe car elle doit être appréhendée selon différents angles d'approches :

  • une approche technologique : les technologies informatiques sont en constante évolution, rendant ainsi les composants matériels et logiciels obsolètes.
  • une approche informationnelle : de par sa dépendance à la technologie utilisée, l'information est susceptible d'être modifiée avec le temps. Il faut donc veiller à déterminer (et cela de manière continue) ce qui doit être conservé, aussi bien au niveau de l'information que de ses caractéristiques (dont une des principales est son authenticité). Par ailleurs, il est important que l'information garde son intelligibilité dans le temps, face à une réalité en constante évolution.
  • une approche organisationnelle et financière : il n'est pas rare que des informations soient perdues suite à un problème organisationnel qui n'est pas toujours discerner à temps. En outre, la préservation digitale a un coût que les entreprises ne sont pas toujours prêtes à assumer.

There is an inherent paradox in digital preservation. One the one hand, it aims to deliver the past to the future
in an unalterd, authentic state. On the other hand, doing so inevitably requires some alteration.
K. Thibodeau (2002)

Stratégies et approches envisageables

Malgré tout, il existe plusieurs stratégies et approches envisageables pour tenter de remédier à cette problématique. Chcaune pose évidemment ses propres enjeux et difficultés qu'il faudra solutionner :

  • sélection de l'information et stratégie d'ILM
  • significant properties : définition continue des caractéristiques de l'information qui doivent être préservés (capacité de traitement, de lisibilité, préservation du look & feel,...) ;
  • gestion des supports de stockage et refreshing ;
  • gestion des formats de fichiers :
    • réduction du nombre de formats à gérer ;
    • choix de formats pérennes (ex. PDF/A, TIFF) ;
    • standardisation ;
  • veille technologique : suivi des évolutions technologioques pour détecter de manière pro-active les problèmes d'obsolescence potentiels ;
  • migration
  • émulation
  • encapsulation
  • recours aux métadonnées (cf. Dublin Core, METS, PREMIS, ...)
  • stratégie organisationnelle : mise en place d'une organisation en charge de la gestion de la préservation, rédaction de guidelines et de procédures claires (base intéressante dans la norme OAIS)

Logiciels open source

Logiciels open source: DROID, JHOVE

Standards

Standard ouvert: PDF/A, TIFF, OAIS
Specification libre: PREMIS, METS
Vous avez des remarques ou des questions à propos de ce texte? Faites-le nous savoir
Dernière mise à jour le 04/01/2011