La “Préservation de l’information numérique” est une problématique complexe. Comme je l’avais souligné durant ma session d’information, les difficultés sont nombreuses comme le montre l’image ci-dessous :
Commençant une étude sur l’archivage et la préservation des bases de données, j’ai cherché à récolter de la documentation sur le cas qui sera étudié durant l’étude. Coup de chance, je tombe sur un fichier intitulé du nom du cas. Je le télécharge donc pour le consulter via powerpoint.
Réponse (en image) :
Le format n’est donc plus supporté par la version standard de MS Powerpoint que nous utilisons (obsolescence de format). Le fichier est-il si vieux ? Pour le savoir, il faut faire appel à des outils d’identification de format. Dans ce cas-ci, j’ai utilisé DROID, un logiciel open source créé par les Archives National anglaises.
Il s’agit donc de la version 4.0 de Powerpoint (merci DROID) et donc la version de 1993 (merci wikipedia). Maintenant, il ne me reste plus qu’à trouver un logiciel capable de lire le fichier. Le plus simple dans ce cas-ci est d’utiliser un format viewer vu que je ne souhaite que consulter le fichier et pas le modifier (voir chapitre 5.4.3 de notre étude).
Une recherche rapide sur Google n’indique pas de format viewer pour Powerpoint 1993. Par contre, on peut rapidement trouver que les fichiers de 1993 peuvent être lus avec Powerpoint 1997. Là c’est beaucoup plus simple de trouver une visionneuse (Microsoft PowerPoint Viewer 97). Après installation, j’ai pû enfin prendre connaissance du contenu du fichier et l’imprimer (moyennant quelques problèmes de présentation -cf. l’image ci-dessous). Heureusement, le viewer fonctionnait sous Windows XP!
Cet exemple simple pose une question essentielle : comment préserve-t-on la documentation de nos applications et de notre business ? Les outils d’intranet permettent de rendre facilement disponible ces informations mais ne garantit en rien leur lisibilité (à savoir le fait de pouvoir ouvrir le fichier de manière correcte). Or, alors qu’elle peut sembler anodine par le fait qu’elle est stockée dans l’intranet ou tout autre système d’information, cette documentation est indispensable pour maintenir les applications et donc garantir le service aux clients.
A cet égard, il serait utile d’intégrer une politique de préservation dans la gestion de l’information. Pou rcela, il faudrait mieux surveiller les formats des fichiers stockés dans ces systèmes et si nécessaires les migrer vers un autre format quand un risque d’obsolescence se présente.
Avez-vous déjà rencontré d’autres cas similaires ?
Je pense que l’outil mentionné DROID pourrait être utilisé. On peut en discuter si tu veux.
Arnaud,
A quel “crawler” penses-tu ?
En connais-tu un qui puisse parcourir un intranet ?
Deux commentaires :
1. Dans la préservation des formats de données, on pense effectivement souvent aux documents externes mais pas à ce que nous produisons en interne. MS-Office nous a cependant déjà infligé des changements de formats par le passé.
conclusion : lors d’une migration vers une nouvelle version d’Office, il faudrait orchestrer une convesion systématique des formats anciens vers le dernier format en date.
2. Le problème ne se limitera pas à Office, mais aussi notamment aux Wiki et autres documents produits à l’aide de logiciels exotiques qui se multiplient chez Smals et constituent une base de documentation précieuse.
Bon amusement pour le migrations !