IRCAM - Centre PompidouServeur © IRCAM - CENTRE POMPIDOU 1996-2005.
Tous droits réservés pour tous pays. All rights reserved.

La numérithèque entre réalités et fantasmes

Michel Fingerhut

Livres Hebdo,n° 381 (p. 80-84), 12 mai 2000
© Michel Fingerhut 2000


Lorsque les bibliothèques débattent de leur avenir à l'ère du numérique, c'est en général pour affirmer qu'on ne pourra pas tout numériser et que leur rôle sert de trier et servir de médiateur entre les documents et le public. Michel Fingerhut, directeur de la médiathèque de l'Ircam, pose la problématique autrement. Et si justement on pouvait tout numériser un jour, tout diffuser sur Internet, via ce qu'il estime l'invention la plus prometteuse: le papier électronique (digital e-paper), lisible sans souris, sans clavier, sans stylet. La numérithèque du futur ne posséderait plus alors que des livres blancs où chaque lecteur pourrait tout inscrire. Dans cette optique, avant de se demander quoi numériser, le problème crucial est aujourd'hui celui de la conservation des supports et des formats numériques, mille fois plus problématique que celle du papier.

La numérisation est un procédé aussi vieux que l'informatique (si on exclut ses débuts analogiques): les descriptions des processus et les données qu'ils manipulent y sont codées de façon binaire. C'est ce qui permet de stocker des documents de toute nature (textes, images fixes ou animées, sons...), d'y effectuer des recherches (dans leurs contenus ou dans des métadonnées associées) et de les éditer à la demande, de près ou de loin, sur écran ou papier. 

La chute des prix des moyens de stockage1 et du matériel et logiciels nécessaires à la numérisation du texte2, et surtout l'explosion du Web et le développement de standards de codage numérique plus aptes à la diffusion et à l'édition3, ont créé un tsunami de numérisation et de mise en ligne, individuelle ou institutionnelle, de quantité de documents de toute nature (texte, image fixe ou animée, son...), récents ou anciens, avec ou sans respect des droits afférents, disparates ou formant une collection cohérente. 

Ce phénomène indiscutablement bénéfique a rendu disponible des textes jusque là inaccessibles à la majeure partie du public – parce qu'ils étaient anciens, rares, épuisés, confidentiels voire secrets ou simplement consultables en des lieux limités ou difficilement accessibles.  Dans certains cas, leur mise en ligne a été enrichie d'outils permettant d'y effectuer des recherches tout à fait impossibles manuellement.

De tels développements ont entraîné les espoirs les plus fantasmatiques:  on peut tout numériser, on peut tout mettre sur Internet, tout est sur Internet4.  De ce point de vue se pose alors la question du futur de la bibliothèque (ou, par euphémisme, celle de la « bibliothèque du futur »), et de celui des éditeurs (doit-on encore en avoir, puisqu'on peut publier soi-même sur le Web). Le débat « La bibliothèque du futur : Les usages du livre électronique laisseront-ils encore une place à la bibliothèque ? », qui s'est tenu lundi 20 mars sur le stand eBook du Salon du livre, abordait ainsi la problématique du positionnement des bibliothèques face au phénomène du numérique. Les participants à cette table ronde, et non des moindres 5, ont loué les vertus de la numérisation comme la solution tant attendue aux problèmes de conservation et de diffusion, tout en mentionnant qu'« on ne pouvait tout numériser » ni tout publier : le rôle de la bibliothèque - et celui des éditeurs en amont - sera donc, encore plus, celui de médiation : les uns choisissent les textes qui valent la peine d'être publiés, les autres proposent une offre collective organisée, comme l'a si bien dit Martine Blanc-Montmayeur, directrice de la Bibliothèque publique d'information. Mais l'ont-ils dit pour se rassurer ? Et si, avec des développements futurs, on pouvait un jour tout numériser ? Envisagerait-on alors une bibliothèque sans livres ? Et entre temps, que faut-il numériser, et que faut-il garder sur papier ?  

Pour tenter de répondre à cette question, il aurait fallu analyser la nature et le devenir de cette fameuse offre numérique : or cet aspect n'a pas été abordé. Pour tenter de le faire, nous allons considérer deux aspects techniques: le support sur lequel on enregistre le document numérisé, et le format dans lequel il est codé numériquement.

Les supports s’altèrent

Les supports d'enregistrement informatique comprennent principalement des matériels de type bande (magnétique) ou disque (mou, dur, optonumérique, compact, DVD...), de capacité variable mais croissante: il y a une vingtaine d'années, les disques durs offraient un volume de stockage de quelques dizaines de mégaoctets, tandis aujourd'hui ils en possèdent mille fois plus pour un coût dix fois moins élevé (soit un facteur de 10 000 en réduction de prix/octet).  Ces supports peuvent être combinés en des systèmes de plus en plus sophistiqués, présentant des volumes de stockage de l'ordre de téra-octets en un espace physique réduit à la taille d'un tiroir.  On peut donc y emmagasiner les textes numérisés de milliers de livres et créer ainsi des étagères virtuelles de bibliothèques quasi-infinies.

Contrairement aux livres physiques qui tapissent les murs de nos anciennes bibliothèques, les supports de stockage informatique ont une durée de vie estimée à une dizaine d'années. En d'autres termes: pour assurer la pérennité d'une information stockée sur des médias de ce type, il faudrait régulièrement les recopier (ce qui, dans certains cas, peut être fait en partie implicitement, notamment dans les systèmes redondants de type RAID). 

Non seulement la durée de vie de ces supports est limitée dans le temps, mais leur nature évolue: on n'est plus assuré de pouvoir remplacer une bande magnétique par une bande d'un modèle identique, ni même d'assurer le bon service d'un lecteur de médium (bande, disque) au fil des années, leur obsolescence étant tout aussi rapide que celle des médias qu'ils permettent de lire.  Il va sans dire que les ordinateurs auxquels sont reliés ces équipements, évoluent tout aussi rapidement.

Les formats évoluent

Ce n'est pas uniquement le support qui vieillit vite, ce sont les représentations numériques de l'information qui changent rapidement : du codage du texte6 à sa mise en forme7, une pléthore de formats et de logiciels nécessaires à leur traitement, loin d'être immuables ou universels, paraissent et disparaissent, rendant plus ardue l’accès « universel » à l’information numérique. Il est parfois difficile de lire sur un PC un fichier Word réalisé sous Macintosh, et la consultation d'un site Web peut différer d'un navigateur à l'autre.

Pour ce qui en est de l'image ou du son, la multiplicité des formats est tout aussi spectaculaire: si MP3 a atteint une grande notoriété pour la diffusion des clips audio, il existe une grande variété de systèmes de codage numérique du son8.  Or, ces standards évoluent et sont atteints eux aussi d'obsolescence.

Jusqu’à quand ?

Il est peu probable que cette évolution - dans la nature (et qualité) des supports et des formats - s'arrête: elle reflète, d'une part, des innovations intéressantes, et permet ainsi de nouvelles représentations ; mais elle fait aussi partie de la stratégie des industries qui souhaitent proposer de nouveaux produits, plus novateurs que ceux de leur concurrence, et renouvelant ainsi l'intérêt pour leurs propres produits. En sus, il est de leur intérêt (commercial, stratégique) de ne pas trop assurer de compatibilité avec les formats précédents (qui possède encore aujourd'hui un lecteur de disques tournant à 96, voire 78 ou 45 tours?) ou avec ceux de la concurrence (voyez les divergences entre Netscape et Internet Explorer), ce qui leur permet aussi de rééditer - et donc de vendre - des anciens documents sur de nouveaux supports et de fidéliser ainsi leur clientelle. 

La numérisation sert-elle à conserver ?

On est donc en droit de se demander si la numérisation pourra assurer, comme on le prétend, la conservation d'un patrimoine qui aurait disparu autrement, ou principalement une diffusion (bien plus vaste qu'auparavant, on ne le conteste pas). Si un livre peut être encore lu cinq cents ans après avoir été imprimé, peut-on être assuré de pouvoir accéder au contenu d'un « disque floppy 8 pouces » tel qu'il en existait il y a dix ans?  Pourra-t-on lire, dans cinq cents ans, les textes codés aujourd'hui en PDF ou SGML? Pour pouvoir assurer cette pérennité de l'information numérique, il faudra peut-être réinventer le métier antique de copiste, chargé, cette fois-ci, de reprendre périodiquement les collections et les transférer d'un support à l'autre et d'un format à un autre. 

Là où il est nécessaire de passer par un moyen de reproduction - le son enregistré - on est contraint de le faire: du disque de cire au vynil, puis au laser, mais, on le sait, ces recopies ne se font pas sans déperdition: combien de documents rares disparaissent, faute d'intérêt économique pour leur reproduction?  Retrouve-t-on sur disque compact l'enregistrement de la voix de Johannes Brahms, prononçant quelques mots avant d'attaquer au piano une de ses danses hongroises?   

Quant bien même les éditeurs et les bibliothèques pourront assurer, lors de projets modestes ou pharaoniques, la numérisation de volumes importants de documents, auront-ils les moyens d'assurer leur disponibilité pour les générations futures?

Le livre du futur

Là on l'on peut « craindre » le numérique, c'est pour son influence possible sur l'objet-livre au quotidien et sur la lecture. Cette dernière est déjà fort malmenée par le zapping: d'abord introduit par l'invention de la télécommande du petit écran, puis renforcé par l'utilisation de l'hypertexte popularisé par le Web et enfin repris par les livres électroniques.

Toutefois, une invention bien plus intéressante et passée sous silence 9 est susceptible de changer fondamentalement le paysage du livre et son économie. Il s'agit du papier électronique (« digital e-paper », en anglais), matériau fin, léger et souple, tout comme une feuille de papier - et réutilisable. À la différence des écrans informatiques, il est réflectif: la lumière ambiante suffit pour en lire le contenu, tel le papier, différence primordiale dans la qualité de lecture qu'il offre. Pas besoin de souris, de clavier ou de stylet.

On peut alors imaginer le livre futur: un volume de quelques centaines de ces pages vierges, vides, blanches, prêt à accueillir tous les livres du monde. On y insère une carte à puce, et le contenu, texte et images, s'inscrit sur toutes ses pages, le titre sur sa couverture et le nombre de cartes vendues en 4e de couverture... On peut le feuilleter, le lire n'importe où, même sur une île déserte (équipée tout de même d'électricité!).

Mais alors, la bibliothèque du futur, déchargée de la nécessité de garder ses fonds en étagères et réserves, n'aurait-elle plus qu'un livre (blanc) par place assise ? Une seule étagère comprendrait ces quelques livres aveugles, et les cartes électroniques contenant les livres remplaceraient les anciennes fiches des catalogues manuels qui ne contenaient que leurs titres ?

Et la librairie du futur pourra se réduire à la taille d'un bureau de tabac, débitant ces cartes à puces rangées dans des boîtes à chaussure telles les cartes postales anciennes chez les bouquinistes, désormais seuls repositaires des livres à contenu perpétuel.

Les éditeurs, profitant de cette manne, proposeront alors ces cartes à durée déterminée, à lire dans la semaine ou le mois suivant l'achat, leur contenu s'effaçant ce délai passé. Procédé fort utile pour la diffusion des quotidiens, appliqué au livre il en rendra la lecture une mission impossible.

Et enfin, notre bibliothèque personnelle disparaîtra, remplacée par une cartothèque à puce et un seul livre de chevet. Ou un exemplaire par « membre du foyer ». Ou plusieurs, pour ceux qui aiment lire plus d'un livre à la fois.

Papier : conserver ; numérique : diffuser

Le texte (ainsi que l’image fixe) se situe ailleurs que les documents nécessitant un mode de reproduction codée (musique, image animée...): son support principal ne requiert pas forcément l'utilisation de moyens intermédiaires (électriques, électroniques) pour y accéder, et bénéficie d'une pérennité remarquable, tandis que les documents numérisés doivent être reproduits périodiquement pour être conservés. On serait donc tenter de conclure que la numérisation est une technologie qui se prête particulièrement bien à la diffusion, mais que, pour le texte du moins, c’est encore le papier qui en assure la conservation.

On peut alors se demander si les choix de numérisation et de publication électronique, dans le cas du texte au moins, ne devraient pas concerner surtout des documents à contenus que l'on sait « périssables » ou éphémères, plutôt que ceux qu'on voudrait préserver pour les générations futures (ce qui implique le devoir d'effectuer des choix – mais, excepté au dépôt légal peut-être, on doit toujours en faire).  Pour ces derniers, les modes de reproduction stables – papier, microfiche, microfilm... – auraient probablement plus de chance d'être lisibles par nos descendants, comme nous pouvons déchiffrer les papyrus de nos ancêtres. 

La bibliothèque se verra alors chargée du rôle-clef de charnière entre le passé et le futur, celui de conservateur d'un patrimoine écrit et imprimé de nature constante et structurée, et de guide dans un monde numérique en perpétuelle mutation.

21 mars 2000



1 Disques durs, disques compacts (ré)inscriptibles, bandes numériques...

2 Scanners, logiciels de reconnaissance

3 HTML, XML ou PDF pour le texte; GIF et JPEG pour l'image; RealAudio, Quicktime, MP3 pour le son...

4 Voir : « Le titre d'un livre n'est pas le livre », dans LH 346 du 27.8.99.

5 Cette table ronde était animée par François Dupuigrenet-Desroussilles, directeur de l'Enssib, avec, comme intervenants : Claude Jolly, sous-directeur des bibliothèques et de la documentation de l'enseignement supérieur, Daniel Renoult, directeur général adjoint de la BNF, Martine Blanc-Montmayeur, directrice de la BPI, Patrick Buzin, directeur de la Part-Dieu de Lyon, Danielle Roger, directrice de la bibliothèque de l'ENS-Lettres, Emmanuel Aziza, DLL, Jean-Pierre Sakoun, P-DG de Bibliopolis, Michelle Huignard, Xerox.

6 Codage en 5 bits (pour le telex), puis en 7 bits (ASCII), 8 bits (EBCDIC, ASCII avec ses variantes d'une plate-forme informatique à l'autre, voire d'un logiciel à un autre), enfin un codage "universel" (Unicode) mais encore très rarement utilisé

7 RTF, Postscript et PDF, HTML, XML ou SGML, TeX... 

8 AU, AIFF, ALAW, MP3, MPEG, MP3, MOD, MULAW, SND, VOC, WAV…

9 Annoncé en juin 1999, le papier électronique est le fruit d'une nouvelle technologie développée pendant quatre ans par Xerox. Il est composé de « billes bi chromatiques », qui représentent chaque point, et suspendues individuellement dans une cavité remplie d'huile  selon la face qu'elles exposent suite à un changement de voltage, une image ou un texte s'y compose. Pour en savoir plus, consulter par exemple : http://www.currents.net/newstoday/99/06/30/news4.html.