Covid-19 / Dans le cadre du dépôt légal du web, la BnF archive le web du coronavirus

La Bibliothèque nationale de France collecte le web français et offre à ses lecteurs la possibilité de consulter des archives remontant à 1996. En prise directe avec l’actualité, les équipes chargées du dépôt légal numérique rassemblent minutieusement la matière sur laquelle travailleront les futurs chercheurs. Tout naturellement, depuis le mois de janvier 2020, la BNF a commencé la collecte de contenus web liés au Covid-19.
Dans le « cluster » de l’Oise, l’abstention bat des records à cause du coronavirus. francetvinfo.fr. Capture du 16 mars 2020.

Peu après l’apparition du coronavirus en Chine et les débuts de sa propagation en Europe, le service du Dépôt légal numérique de la BnF, qui a pour mission le dépôt légal du web, a mis en place une collecte dédiée.

« Si on veut constituer le patrimoine de demain, et qu’il soit le miroir juste et pertinent de notre société, il faut être exactement là où circulent toutes les informations et toutes les opinions », explique Laurence Engel, présidente de la BnF, à 20 Minutes. « On ne peut pas se contenter des oeuvres d’art, sinon on aurait une vision très partielle de notre monde. Le web aujourd’hui fait partie de ces espaces ».

Commencée début janvier 2020, avec le suivi de hashtags comme #JeNeSuisPasUnVirus ou #CoronavirusEnFrance qui faisaient alors leur apparition sur Twitter, la collecte Covid-19 suit l’évolution et l’impact global de la pandémie sur le web français.

Elle s’attache à embrasser toutes les facettes de la crise sanitaire, via ses aspects médicaux et scientifiques, mais aussi sociaux, économiques et politiques, ou encore culturels et moraux.

Une sélection documentaire dynamique et réactive

Pour cela, l’équipe du dépôt légal numérique sélectionne des contenus en veillant à ce que les sites web, blogs et médias sociaux archivés forment un ensemble cohérent, significatif et représentatif.

Elle détermine également la fréquence des collectes effectuées par le biais de robots – plusieurs fois par jour pour les réseaux sociaux, une fois par jour pour les sites de presse nationale et régionale, etc.

Cette démarche n’a rien d’inédit pour la BnF, qui organise régulièrement des collectes dites d’« actualités éphémères » afin e saisir les répercussions d’un événement sur le web et les réseaux sociaux, comme ce fut le cas lors du mouvement des « gilets jaunes » ou de l’incendie de Notre-Dame.

« Les dernières opérations de collecte d’urgence que nous avons menées concernaient par exemple les attentats de 2015, le mouvement #metoo, mais aussi celui des “gilets jaunes”, l’incendie de Notre-Dame », énumère au Monde, Benoît Tuleu, directeur du département du dépôt légal à la BNF.

À la mi-avril, la collecte Covid-19 couvrait ainsi près de 2 000 sources, et comprenait de nombreuses pages qui ont d’ores et déjà disparu du web vivant.

« Fin janvier, l’équipe permanente avait commencé à s’intéresser au coronavirus en France dans sa veille habituelle notamment via les premiers hashtags francophones qui apparaissaient comme #JeNeSuisPasUnVirus qui dénonçait la stigmatisation de la communauté asiatique », explique Benoît Tuleu, « mais le fait que la population soit confinée du jour au lendemain tout en restant très connectée nous paraissait inédit et nécessairement intéressant à archiver pour les études dans le futur. »

Cette fois, l’expérience a été d’autant plus inédite que le personnel de la BNF était lui-même confiné et en télétravail. Mais depuis un mois, l’équipe permanente du dépôt légal numérique a été renforcée par la veille de 50 bibliothécaires supplémentaires en interne à la BNF.

  • Une collecte qui s’appuie sur un réseau de correspondants étendu

Une telle réactivité est rendue possible à la fois par l’expertise de la BnF en matière de collecte du web, qu’elle pratique depuis 1999, et par l’appui de nombreux correspondants, à la fois en interne et sur tout le territoire français.

Depuis 2015, un réseau a ainsi été déployé dans les 26 bibliothèques territoriales et services d’archives qui partagent la mission de dépôt légal du web et qui participent aux collectes collaboratives comme celles qui touchent l’activité électorale française.

Ce travail d’ampleur a par ailleurs permis à la BnF d’apporter sa contribution au projet d’archivage international Novel Coronavirus (2019-nCoV) outbreak, lancé en février 2020 par le consortium International Internet Preservation Consortium (IIPC) en association avec Internet Archive.

Ainsi s’amassent, sur les serveurs de la BnF, les fonds qu’exploreront les chercheurs du futur, et qui pour l’heure constituent une mémoire collective de la crise sanitaire. C’est là tout l’enjeu du dépôt légal du web, qui conjugue valeur documentaire et valeur mémorielle.

Pour en savoir plus sur cette collecte et découvrir des exemples de sites collectés dans ce cadre, consultez le billet dédié sur le carnet de recherche Webcorpora.

QU’EST-CE QUE LE DÉPÔT LÉGAL DU WEB ?

Le dépôt légal du web a été instauré par la loi Dadvsi de 2006 dans la lignée de ses illustres prédécesseurs. Mais si les livres, journaux et autres documents imprimés, multimédias ou audiovisuels font l’objet d’un dépôt obligatoire, le web peut difficilement être appréhendé la même manière. De fait, contrairement aux autres dépôts légaux, celui du web ne se fixe pas pour objectif l’exhaustivité mais la représentativité. Autre différence : si le dépôt légal du livre, comme son nom l’indique, impose aux éditeurs de déposer leurs productions, celui du web est opéré directement par la Bibliothèque, sans que ni les producteurs ni les hébergeurs de contenus n’aient de démarche à effectuer.

Enfin, ces collections, constituées par la Bibliothèque nationale de France (BnF) au titre du Dépôt légal de l’internet, sont accessibles uniquement dans les salles de recherche sur les différents sites de la BnF, ainsi que dans les établissements partenaires en région. Par respect du droit de la propriété intellectuelle, les collections ne sont pas accessibles en ligne

Laisser un commentaire