Accueil > Techniques de la documentation juridique > Théories > Archivage - conservation des documents > L’archivage des données du web

L’archivage des données du web

La mémoire de la toile : rencontre "Communication Publique" du 12 avril 2005, BNF

dimanche 17 avril 2005, par Stephane Cottin

Alors qu’Olivier Andrieu, sur la partie "Abonnés" de son site Abondance se pose la même question [1], une réunion organisée par Pierre Zémor et son association Communication Publique se tenait le mardi 12 avril 2005, au 18e étage de la BNF, une rencontre avec Mme Martine de Boisdeffre, directrice des Archives nationales, et avec M. Jean-Noël Jeanneney, président de la Bibliothèque de France.

Voir ici sur Artesi l’annonce de cette rencontre sur le thème "la mémoire de la toile"

La conservation des données non matérialisées sur un support, la "mémoire de la toile" sont aujourd’hui des enjeux culturels.

  • Où en est le chantier du dépôt légal du "web" ? Comment réaliser un archivage aussi colossal des sites internet et intranet ?
  • Quels moyens et partenariats et synergies mettre en œuvre ? Comment s’y prennent d’autres pays ?
  • Quels sont les responsabilités qui incombent désormais aux communicateurs publics ?

Le président Jean-Noël Jeanneney nous a d’abord présenté les projets de la BNF en matière de conservation. Un dossier de presse a été remis Comment conserver la mémoire d’Internet ? Un défi pour la Bibliothèque nationale de France

Mais tout ceci a été développé à la lumière des récentes assertions de Google sur la future création d’une bibliothèque numérique mondiale. Jean-Noël Jeanneney a évoqué la sortie prochaine d’un ouvrage sur le sujet, reprenant les idées qu’il a pu développer dans la presse récemment.

- Jean-Noël Jeanneney : "L’intelligence, l’innovation ne sont pas seulement outre-Atlantique !"
LE MONDE

- Google prend acte du projet français de bibliothèque virtuelle
LE MONDE

  • Le ministre de la culture et de la communication, Renaud Donnedieu de Vabres, et le président de la Bibliothèque nationale de France (BNF), Jean-Noël Jeanneney, ont été reçus, mercredi 16 mars, à l’Elysée, par Jacques Chirac afin d’ébaucher le projet de bibliothèque virtuelle que le chef de l’Etat entend proposer à ses partenaires européens (Le Monde du 16 mars)...

La problématique a été ainsi posée : la "mémoire de la toile" = oui, mais pas d’ambition d’exhaustivité. Donc il faut des critères de choix :
- l’attente supposée et anticipée (difficile)
- la rareté (si c’est rare, c’est que c’est précieux, mais si c’est rare, c’est que ce n’est pas représentatif)
- la représentativité (à rapprocher de l’importance de représenter une certaine identité nationale = d’où retour au "problème google")

Il a aussi été question de l’ouverture d’un consortium : Netpreserve.org, International internet preservation consortium

The national libraries of Australia, Canada, Denmark, Finland, France, Iceland, Italy, Norway, Sweden, The British Library (UK), The Library of Congress (USA) and the Internet Archive (USA) acknowledged the importance of international collaboration for preserving Internet content for future generations and therefore decided to form a consortium called the International Internet Preservation Consortium.

The goals of the consortium are :

  • To enable the collection of a rich body of Internet content from around the world to be preserved in a way that it can be archived, secured and accessed over time.
  • To foster the development and use of common tools, techniques and standards that enable the creation of international archives.
  • To encourage and support national libraries everywhere to address Internet archiving and preservation.

Plusieurs rapports ont déjà été publiés. La coordination de l’ensemble est assurée par la BNF.

Ont été enfin exposées les trois méthodes pour archiver le web :
- la photographie ’instantanée’ de tout ou partie du web. C’est la méthode des pays scandinaves. L’inconvénient est l’absence du web profond.
- la négociation et les dépôts volontaires
- la sélection, ou collection, comme, pour la France, des sites des élections, par ’moissonage’/harvesting.


A la suite de cet exposé, Martine de Boisdeffre s’est employée à décrire pour la direction des archives de France, les méthodologies et pratiques de l’archivage des sites Internet.

Les nombreux efforts de la Direction des Archives de France en la matière s’inscrivait entre autres dans le Projet Minerva [2] qui est devenu le projet Michael
ouvert début avril 2005.

Le site officiel du projet Michael (Multilingual Inventory of Cultural Heritage in Europe) est http://www.michael-culture.org/.

Restent les problèmes liés à l’archivage des intranets publics, et, plus généralement des obstacles juridiques (secret, anonymisation...) et pratiques (obsolescence des techniques, taille) à la collecte. Ce sont les nombreux défis que souhaite relever la direction des archives.

SPIP | | Plan du site | Suivre la vie du site RSS 2.0