Préservation digitale
| Standards | Logiciels open source |
|---|---|
|
Standard ouvert Specification libre |
Description
La préservation digitale (digital preservation) est un domaine de recherches visant la préservation l'information digitale sur le long terme, le long terme étant défini comme "suffisamment long pour être soumis à l’impact des changements technologiques, y compris à la prise en compte de nouveaux supports et nouveaux formats de données ou à des changements de la communauté d’utilisateurs." Cette définition, reprise au modèle OAIS, ne met cependant pas suffisamment l'accent sur la nécessité de garder l'information intelligible dans son sens initial, certains concepts évoluant avec le temps.
La préservation digitale doit être différenciée de l'archivage qui est davantage une manière de gérer le cycle de vie de l'information (capture, classement, restitution). Bien que la limite entre les deux ne soit pas toujours facile à définir, cette distinction permet de séparer les problèmes et est donc sinon pertinente au moins utile. Ces deux disciplines ont évidemment des liens en commun puisque la préservation digitale veillera à préserver (conserver) l'information archivée en la rendant pérenne.
Autrement dit, il faut d'abord archiver et puis conserver.
Problématique
La problématique de la préservation à long terme de l'information numérique est complexe car elle doit être appréhendée selon différents angles d'approches :
- une approche technologique : les technologies informatiques sont en constante évolution, rendant ainsi les composants matériels et logiciels obsolètes.
- une approche informationnelle : de par sa dépendance à la technologie utilisée, l'information est susceptible d'être modifiée avec le temps. Il faut donc veiller à déterminer (et cela de manière continue) ce qui doit être conservé, aussi bien au niveau de l'information que de ses caractéristiques (dont une des principales est son authenticité). Par ailleurs, il est important que l'information garde son intelligibilité dans le temps, face à une réalité en constante évolution.
- une approche organisationnelle et financière : il n'est pas rare que des informations soient perdues suite à un problème organisationnel qui n'est pas toujours discerner à temps. En outre, la préservation digitale a un coût que les entreprises ne sont pas toujours prêtes à assumer.
There is an inherent paradox in digital preservation. One
the one hand, it aims to deliver the past to the future
in an unalterd, authentic state. On the other hand, doing so inevitably requires
some alteration.
K. Thibodeau (2002)
Stratégies et approches envisageables
Malgré tout, il existe plusieurs stratégies et approches envisageables pour tenter de remédier à cette problématique. Chcaune pose évidemment ses propres enjeux et difficultés qu'il faudra solutionner :
- sélection de l'information et stratégie d'ILM
- significant properties : définition continue des caractéristiques de l'information qui doivent être préservés (capacité de traitement, de lisibilité, préservation du look & feel,...) ;
- gestion des supports de stockage et refreshing ;
- gestion des formats de fichiers :
- réduction du nombre de formats à gérer ;
- choix de formats pérennes (ex. PDF/A, TIFF) ;
- standardisation ;
- veille technologique : suivi des évolutions technologioques pour détecter de manière pro-active les problèmes d'obsolescence potentiels ;
- migration
- émulation
- encapsulation
- recours aux métadonnées (cf. Dublin Core, METS, PREMIS, ...)
- stratégie organisationnelle : mise en place d'une organisation en charge de la gestion de la préservation, rédaction de guidelines et de procédures claires (base intéressante dans la norme OAIS)
Liens
- I. Boydens, La préservation à long terme de l'information numérique, Techno – Smals, n° 28, 2004
- A. Hulstaert, Digital Record Object Identification (DROID) - File Format Identification Tool, Quick Review - Smals, n°22, 2009 (seulement via l'Extranet)
- A. Hulstaert, La préservation à long terme de l'information numérique, Rapport d'étude – Smals, 2010 (seulement via l'Extranet)
- A. Hulstaert, JSTOR/Harvard Object Validation Environment (JHOVE) 1.5 - File Format Identification and Validation Tool, Quick Review - Smals, n°25, 2010 (seulement via l'Extranet)
