Accueil > Divers (et d’été) > Dossiers > La catastrophe numérique

La catastrophe numérique

lundi 21 mai 2007, par Paul Courbis

A l’aube de l’humanité, l’enjeu majeur était le contrôle de la matière. Celui qui savait façonner les matériaux bruts selon sa volonté avait une supériorité sur l’autre. Ce furent les âges de la pierre, Paléolithique, Mésolithique et Néolithique, les âges du métal, cuivre, bronze, fer, et cætera…

Avec la révolution industrielle, nous sommes entrés dans une nouvelle ère : celle de l’énergie, dont l’emblème est la machine à vapeur. Le contrôle des ressources énergétiques fait et défait des fortunes, élève des nations aux premiers rangs, décide des conflits ou est à l’origine de catastrophes sans précédents dont les pires sont peut être encore à venir…

Bien sûr, il n’y a pas eu de rupture franche entre ces deux ères et l’énergie s’est développée avant tout au service de la production de biens matériels. Cependant la vraie domination, le vrai pouvoir, est bien passé progressivement de l’un à l’autre en quelques décennies.

La révolution Internet si visible ces 10 dernières années est le point d’orgue d’une nouvelle rupture entre deux ères : le passage de la domination par l’énergie à la domination par l’information. L’apport décisif de cette ressource n’est cependant pas nouveau…

Ainsi, selon la légende, en 490 avant Jésus-Christ, Phidippidès, soldat athénien aurait parcouru 42 km pour annoncer à Athènes, au prix de sa vie et au cri de « nenikekamen ! », la victoire du commandant Miltiade contre les Perses.

Plus proche de nous et des préoccupations mercantiles de notre époque, en 1815, sur une « morne plaine », régnait un brouillard épais qui rendait inutilisable la récente invention de Chappe, le télégraphe optique. Un simple pigeon voyageur en prévenant, avant tout le monde, une famille de la moyenne bourgeoisie londonienne de la défaite de Napoléon permit à cette famille de plus que doubler ses avoirs : la fortune des Rothschild était née…

De détails de l’Histoire, la ressource « information » prend aujourd’hui une place prépondérante dans le fonctionnement de notre société.

Quelle sera la prochaine ère de l’humanité ? C’est une prospective passionnante qu’il serait tentant d’aborder mais qui n’est pas l’objet de mon propos d’aujourd’hui. Cependant toute prévision ou prédiction du futur ne peut se passer d’une connaissance précise et d’une compréhension excellente du passé : les « comment » et les « pourquoi » d’hier éclairent les obscurs « peut-être » de demain…

Chance inouïe pour les visionnaires d’aujourd’hui, cette révolution de l’information met à la portée d’un simple « clic » une kyrielle d’informations interrogeables, classables, réutilisables, là où, hier, la recherche historique s’étiolait dans d’obscures bibliothèques aux accès restreint. Quelle chance ! Mais demain ? Qu’allons nous laisser comme traces de notre époque à nos arrière petits enfants ?

Bien sur se pose le problème de la pertinence d’une telle conservation. Cependant lorsqu’on voit avec quelle gourmandise les archéologues d’aujourd’hui se penchent sur les outils les plus simples et sur les ordures les plus viles pour tenter de reconstituer le quotidien de nos ancêtres, il semble que la nécessité de conserver intact ce patrimoine est peu sujette à discussion.

Depuis un quart de siècle que je pratique l’informatique, c’est-à-dire, étymologiquement, « la science de l’information », j’ai été confronté à plusieurs reprises à ce problème de la conservation et de la réutilisation des données numériques, expérience que je vous propose de partager aujourd’hui. Le titre de cet article, « la catastrophe numérique », est l’expression de mon inquiétude par rapport à ce que nous préparons pour les historiens du futur : un véritable désastre en ce qui concerne les archives de notre présent.

Il existe, à mon sens trois grands écueils que je vais détailler ici : la conservation des données elles-mêmes, l’exploitabilité de ces données et, enfin, l’absence de mémoire.

Ces notions peuvent paraître technico-techniciennes, mais elles sont en fait assez simples à comprendre.

*
* *

Premier soucis : la conservation des données

Toute donnée numérique, bien qu’immatérielle, est stockée sur un support physique. Ce support a une durée de vie qui n’est pas infinie. Ainsi les disquettes se démagnétisent, les CD se rayent, et cætera. Contrairement aux vieux manuscrits sur parchemin qui résistent à un lavage à grande eau, ou aux manuscrits de la Mer Morte qui ont traversé les siècles, les supports modernes sont de plus en plus fragiles. Ce phénomène a déjà été subi avec les phénomènes d’acidité du papier et des boites d’archives qui se fragilisent, voire s’autodétruisent. Les bibliothèques et les archives croulent sous le papier acide. Depuis des années, les institutions culturelles essayent d’assurer la conservation à long terme de ces papiers. Le problème est relativement facile à résoudre car :

  • il est visible ;
  • il existe des traitements chimiques fiables permettant un traitement de désacidification de masse ;
  • une solution alternative de plus en plus utilisée est la numérisation des documents qui semble être une solution ne présentant que des avantages.

Dans le cas des documents numériques, le problème est plus insidieux : la détérioration n’est le plus souvent pas visible, et, lorsqu’elle le devient, il est beaucoup trop tard, et le traitement de masse n’est pas possible. En outre un traitement de conservation des données numériques ne devient définitif que par changement du support de stockage, ce qui, nous le verrons ensuite, n’est ni facile, ni suffisant.

La seule alternative possible pour la préservation de la donnée numérique est un stockage protégé (absence d’humidité, de champs magnétiques, de variation importante de température, et cætera). Mais ce n’est que reculer pour mieux stocker.

Ceci étant dit, si le problème est pris en compte suffisamment tôt, il n’est pas particulièrement complexe à contourner puisqu’il suffit de transposer régulièrement l’information d’un support à un autre pour en assurer la survie. Encore faut il que la volonté politique soit là, car les coûts d’une telle opération ne se justifient pas en terme de retour sur investissement, du moins sur les périodes de temps considérées de nos jours par les analystes financiers.

*
* *

Deuxième problème : l’utilisabilité des données numériques

Une fois les données extraites de leur support physique, il reste à les interpréter. Il faut tout d’abord garder présent à l’esprit le fait que les données en question ne sont qu’une suite de chiffres binaires, zéro et un, ou bits.

Sans rentrer dans les détails des différentes technologies utilisées, on peut assimiler ces suite de chiffres à l’utilisation d’un alphabet. Pour celui qui ne connaît pas les clefs de lecture, nulle interprétation n’est possible. Le problème est le même que pour les hiéroglyphes avant Champollion ou les Rongo-Rongo de l’Ile de Pâques encore inviolés aujourd’hui…

Et encore ce problème de base est probablement le plus simple à résoudre. D’abord car ces traces écrites sont une œuvre collective, disposant d’une certaine pérennité et d’une certaine universalité dans la civilisation qui les a vu naître. A l’inverse, les codages informatiques sont éphémères, sont le fruit d’une minorité et donc encore plus abstraits que la simple écriture, d’où une plus grande difficulté de déchiffrement a posteriori.

De plus, dans le cas de la simple écriture, la combinatoire reste relativement faible et l’information relativement restreinte. Dans le domaine informatique, plus le temps passe, plus les systèmes proposent des informations riches : aux tous débuts, il ne s’agissait que de traitement de données chiffrées, puis est venu la gestion des textes, des textes enrichis, des images, des sons, des vidéos, de « réalités virtuelles », et cætera…

La généralisation de l’informatique à provoqué en outre une multiplication des standards liés aux différences linguistique : des milliers de codages des caractères écrits coexistent pour permettre de rendre compte de la richesses des langues de par le monde.

Comme si tout cela ne suffisait pas, les nécessité du marché et la recherche du profit ont conduit à ajouter à cette multiplicité d’encodages, une volonté de maîtrise des informations avec les techniques de gestion des droits numériques, DRM en anglais, qui rendent, en théorie, impossible une utilisation libre des informations en leur ajoutant des contraintes visant à interdire leur duplication, voire à leur inclure des attributs d’expiration dans le temps. Ces mécanismes sont encore assez facile à contourner à ce jour, mais deviennent de plus en plus perfectionnés et le temps n’est pas loin où certaines archives numériques ne seront plus exploitables sans l’accord explicite du producteur, accord qu’il ne sera pas forcément en mesure de donner, pour des raisons toutes simples comme par exemple la perte des clefs de chiffrement…

De plus, ce tableau n’est que partiel : les données ne sont pas les seules choses utiles à sauvegarder. En effet, tout comme les outils de nos ancêtres recèlent en eux même un éclairage essentiel à la compréhension de leur société, les outils modernes, comme les traitements de textes ou les jeux vidéos, sont un élément important à l’analyse de notre mode de vie. Et là le problème est plus complexe car non seulement les données sont à récupérer, mais leur utilisation dépend de composants matériels fragiles qui ne font pas l’objet d’une véritable politique de conservation, sauf par quelques passionnés dont les collections disparaîtront probablement avec eux…

*
* *

Troisième problème : la persistance de l’information ou l’absence chronique de mémoire

Au-delà des premiers problèmes évoqués, conservation et réutilisation, qui sont somme toute de simples écueils techniques, se pose de plus en plus le souci de la persistance des données. En effet, s’il était courant aux débuts de l’informatique d’empiler les cartes perforées dans de belles boîtes prévues à cet effet, et de les conserver plus où moins longtemps, les supports modernes sont de plus en plus réutilisables. De ce fait les informations qu’ils contiennent sont de plus en plus souvent effacées pour laisser la place aux nouveautés et l’archivage disparaît.

En outre, de plus en plus de services de stockage voient le jour, comme les « pages perso », ou les « webmails » qui éloignent le producteur du support physique et lui rendent difficile, voire impossible, la moindre sauvegarde.

Enfin, la tendance est à une information en « temps réel » où seul compte l’instant présent et où les historiques ne sont pas conservés.

Ainsi l’information n’a même plus de persistance et n’est plus accessible passé un certain délai, de plus en plus court.

Certaines initiatives privées, majoritairement américaines, existent cependant comme « Google groups » qui archive les discussions tenues sur les forums Usenet depuis 1981 ou « archive.org » qui conserve une image des versions des sites web Internet depuis 1996. Mais ce ne sont que des archivages partiels et leur caractère privé et commercial est tout sauf un gage de pérennité.

*
* *

En conclusion de ce tableau alarmiste, quelques mots d’espoir : je pense qu’il n’est pas trop tard et que la mémoire humaine est encore à même de combler les manques de ce que nous avons déjà perdu dans ce gouffre du « tout numérique ». Mais dans quelques années des pans entiers de notre histoire seront perdus à jamais.

Accepter passivement cette « catastrophe numérique » reviendrait à admettre que la chaîne reliant générations passées et générations futures puisse être brisée et cela ne me semble pas acceptable.

Il nous est probablement possible d’œuvrer à une évolution de notre société visant à mettre en place des gardes fous visant à nous protéger contre ce risque. Ceci pourrait se faire, par exemple, en faisant évoluer notre législation pour renforcer les obligations de dépôt légal et de transparence sur les formats numériques ou en créant un institut national, une extension de l’INA, facilitant cet archivage et ayant en charge la conservation de ce capital intangible, mais oh combien précieux, qu’est notre présent, future histoire des hommes de demain.

La discussion est ouverte...

Messages

  • Je suis étonné qu’il n’y ait eu aucune réaction à votre publication alarmiste, mais pour le moins optimiste. Optimiste, parce qu’il semble évident aujourd’hui qu’il n’y aura pas de futur pour l’homme. Donc, la question de la pérennité des données semble désormais sans fondement. Néanmoins, dans le cas improbable où nous aurions un avenir, n’est-il pas évident que les traces usuelles, c’est à dire exploitables, tels l’urbanisme, les lignes de chemin de fer, les routes, les satellites, la robotisation et bien entendu, les milliards de bribes d’informations numériques, même incomplètes, glanées de-ci de-là par les futurs historiens, seront amplement suffisantes. Il n’est pas fait mention d’un intellect supérieur de nos descendants, qui n’auront probablement aucun mal à déchiffrer tout ça avec la technologie qui sera la leur, je pense notamment à l’IA, mais pas que. Dans le cas inverse, c’est-à-dire une régression, cela n’aura, pour eux, que peu d’intérêt. Alors, pourquoi s’en soucier aujourd’hui ?

Un message, un commentaire ?

modération a priori

Ce forum est modéré a priori : votre contribution n’apparaîtra qu’après avoir été validée par un administrateur du site.

Qui êtes-vous ?
Votre message

Pour créer des paragraphes, laissez simplement des lignes vides.

Les spams donneront systématiquement lieu à dépôt de plainte. Les messages peu aimables ou comportant trop de fautes d'orthographe seront purement et simplement supprimés sans publication. Aucune obligation de publication ne pourra être opposée au webmaster, sauf éventuel droit de réponse dûment justifié.
ipv6 ready ipv6 test
Suivre ce site :
Recommander cette page :
Bookmark and Share
Traduire :