Accueil » Projet

Le projet

Constitution d'une collection numérisée des gazettes de langue française

La presse européenne de langue française sous l'Ancien Régime, essentiellement constituée de gazettes, se caractérise par sa vitalité, par le nombre des journaux créés, par sa très large expansion géographique – jusqu'en Russie ou dans l'empire Ottoman avec une forte concentration en Allemagne et dans les Pays-Bas.  Moyen de diffusion du savoir et des nouvelles entre les élites sociales, politiques et intellectuelles dans des zones géographiques très vastes et connectées entre elles, les gazettes jouent un rôle de médiation et d'unification linguistiques et culturelles. On peut les considérer comme un lieu stratégique de création et d'affirmation d'une conscience européenne au début de l'ère moderne, ce qui leur confère un caractère historique très particulier.

Ces gazettes transmettent une information essentiellement politique de caractère international. La presse du 18e siècle d'expression française se caractérise par sa dimension européenne : c'est aussi pour concurrencer la Gazette de France, très contrôlée par le pouvoir royal, qui avait un privilège exclusif sur tout le royaume, que de nombreuses entreprises éditoriales ont vu le jour, à Londres, Bruxelles, Rotterdam, La Haye, Leyde, Amsterdam, Utrecht, Clèves, Cologne, Trèves, Berne et Avignon (qui n'était pas française à l'époque)... Cet ensemble offre donc une masse considérable de textes en langue française, diffusés dans toute l'Europe, jusqu'à Moscou et l'Amérique, une ressource précieuse pour les chercheurs, tant historiens que littéraires : politique, histoire des idées, des sciences et des arts, naissance des formes et du discours journalistique... Toute l'histoire du monde y est inscrite presque au jour le jour ; un même événement peut être relaté à travers des nouvelles émanant de divers endroits, on y lit aussi bien le quotidien des grandes villes européennes (et au-delà, jusqu'à Constantinople et Saint Petersbourg), ou des bourgs de province, jusqu'aux colonies, avec la naissance des états d'Amérique, ou à l'Afrique et l'Asie.

Malheureusement, cette richesse en fait la difficulté : il est très rare de pouvoir consulter une collection complète, les exemplaires étant souvent dispersés dans différents pays. Il est donc important de mettre à disposition des chercheurs cet outil précieux qui permet de relier la culture et l'histoire d'une époque avec ses media d'information. Sous la direction de Pierre Rétat, le Centre d'étude du XVIIIe siècle de Lyon a mené à bien ce travail en publiant sur CD-Rom la collection de la Gazette d'Amsterdam (1691-1796) et a poursuivi en numérisant d'autres journaux : Gazette dite de Leyde, Courrier d’Avignon, Gazette de Nice.

Historique : l'expérience de la Gazette d'Amsterdam, une numérisation en mode image

Notre laboratoire s'est intéressé depuis 1993 à l'édition numérique des gazettes. La première réalisation fut la collection de la Gazette d'Amsterdam (1691 à 1796). Cet ensemble de 12 cédéroms, premier élément d'un projet plus vaste de collection des gazettes européennes de langue française sous l'Ancien Régime, a été publié en 2000 par la Voltaire Foundation.

Pierre Rétat avait découvert dans les réserves du fond ancien des archives du Ministère des affaires étrangères une belle collection annotée de la Gazette d'Amsterdam. Pascale Ferrand et Pierre Rétat ont alors travaillé à la reconstitution et à l'archivage numérique de cette gazette, avec l'appui technique du responsable informatique de l'ISH qui était alors Daniel Roux. Pour exploiter le corpus d'une ampleur considérable que constitue une gazette, il fallait d'abord résoudre le difficile problème qui a fait que cette source historique a longtemps été négligée “non seulement à cause des orientations passées de la science historique, mais aussi à cause de graves difficultés de consultation des collections”. Celles que l'on trouve sont en effet rares, dispersées, toujours lacunaires et d'un accès difficile. La reproduction se heurtait à l'obstacle majeur que constitue la massivité des corpus. En reproduction papier de type fac simile, il aurait fallu constituer d'énormes collections difficilement publiables. Chaque livraison d'une gazette telle que celle d'Amsterdam, représente plus de 80.000 pages. C'est donc la possibilité de reproduire les gazettes sous forme numérique qui a permis de franchir cet obstacle et a suscité l'intérêt des chercheurs désireux d'avoir à leur disposition un “reprint électronique” de la totalité d'une collection de gazette. Cette réalisation s'est faite en trois étapes : recherche et identification de l'archive ; recueil sous forme de microfilms ; numérisation et organisation des données numériques.

A partir de 1996, nous avons donc reconstitué la collection complète de la Gazette d'Amsterdam, à partir des microfilms qui nous ont été fournis par huit bibliothèques : Bibliothèque du Ministère des affaires étrangères, Archives nationales, Archivio di Stato de Naples, Bibliothèque publique et universitaire de Genève, Bibliothèque municipale de Grenoble, Bibliothèque de l'Institut de France, Bibliothèque Mazarine, Bibliothèque Sainte-Geneviève. Ces bibliothèques ont bien sûr été choisies en fonction de leurs collections, mais aussi parce qu'elles acceptaient le microfilmage de leurs gazettes et ne nous demandaient pas de copyright, le problème de la négociation des droits demeurant un point délicat.

Nous avons fait numériser ces microfilms en format image, ce mode ayant l'avantage de reproduire le document en conservant sa forme originale. Nous avons choisi comme format de diffusion le pdf, tout juste développé à l'époque, qui présentait l'avantage d'être multi plateformes et accessible avec Acrobat Reader, libre de droit. Ce choix s'est révélé judicieux puisque ce format s'est généralisé dans les années qui ont suivi.

Les trois phases de repérage, d'archivage et de numérisation étant achevées, la question s'est posée de la présentation et donc de l'indexation de cette archive massive.  Nous avons écarté une indexation en full text. D'une part parce que les essais d'OCR réalisés à l'époque étaient restés sans succès (90% des caractères étaient rejetés), d'autre part parce que l'utilité d'une telle indexation, rapportée au temps qu'il aurait fallu investir pour constituer un OCR efficace, n'était pas probante. Ce choix d'une réalisation en mode image ne nous est pas propre puisqu'il est aussi celui de la BnF dans son projet d'archivage des journaux publiés entre 1814 et 1944.

Le projet Gazette de Leyde

Un partenariat avec la Bibliothèque royale de Belgique nous a permis d’avoir accès à ses collections. Elles ont été numérisées à Bordeaux par l’entreprise E-criture. Pascale Ferrand (UMR LIRE) et sa collaboratrice Laura Donvito ont mis en forme les fichiers ; les informaticiens-documentalistes Christophe Lemius (ISH-UMR LIRE) et Raphael Tournoy (ISH-SID) ont aidé à l’élaboration du site et à la mise en ligne.

Nous avons numérisé les années 1750-1789 de la gazette de Leyde en nous appuyant sur l'aide de la région Rhône-Alpes et d'autres structures pour poursuivre cette entreprise. Nous souhaitons pouvoir d’ici quelques années élargir la collection à la première moitié du siècle.

Développements du projet

Elargissement à d'autres gazettes

Le Courrier, dit Courrier d'Avignon, a été numérisé par les bibliothèques municipales d'Avignon et de Marseille. Le Centre d'étude du 18e siècle  de Lyon a acheté des copies sur CD Rom et a mis en ligne en 2011 les collections de cette gazette. Ces deux bibliothèques nous ont accordé la possibilité d'une mise en ligne accessible à tous.

Création d’un répertoire de liens vers la presse ancienne numérisée

Un répertoire de liens vers la presse ancienne numérisée et disponible en ligne a été réalisé par Denis Reynaud depuis 2009. Cette bibliothèque virtuelle ordonnée de la presse d'Ancien Régime et de la presse de la Révolution est régulièrement enrichie.

Certaines entrées sont enrichies de liens vers le Dictionnaire des journaux de Jean Sgard (pour les périodiques nés avant juillet 1789) ou vers Les Journaux de 1789 de Pierre Rétat.

Publications annexes

Ces dictionnaires ont été numérisés et indexés par l'IHRIM et le service d’ingénierie documentaire de l’ISH en 2010-2011 (Direction : Jean Sgard, avec la participation de Denis Reynaud et A. M. Mercier-Faivre ; réalisation : Pascale Ferrand et Cécile Cordier).