Le projet AGODA. Océrisation des débats parlementaires français de la Troisième République : problèmes, défis et perspectives - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2022

Le projet AGODA. Océrisation des débats parlementaires français de la Troisième République : problèmes, défis et perspectives

Résumé

Dans cette intervention, Aurélien Pellet et Marie Puren présenteront le projet AGODA, financé par le DataLab de la Bibliothèque nationale de France, qui a pour objectif de mettre en ligne les comptes-rendus annotés des débats parlementaires de la fin de la Troisième République (1889-1893). Ce projet est conçu comme une preuve de concept, permettant de mettre en place les différents outils nécessaires au traitement de cette importante masse de documents historiques. Les intervenants se concentreront plus particulièrement sur l’océrisation de ces documents : l’extraction du texte, à partir de ces documents numérisés, est en effet une étape décisive, qui n’est pas sans poser beaucoup de problèmes. La qualité des documents et de la numérisation rend en effet difficile cette opération. Aurélien Pellet et Marie Puren présenteront ainsi les problèmes rencontrés et les solutions choisies pour les surmonter.
pellet_puren-semOMNSHS-250422.pdf (5.78 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03651146 , version 1 (25-04-2022)

Licence

Paternité

Identifiants

  • HAL Id : hal-03651146 , version 1

Citer

Aurélien Pellet, Marie Puren. Le projet AGODA. Océrisation des débats parlementaires français de la Troisième République : problèmes, défis et perspectives. Séminaire OMNSH-Epitech : le numérique au service des sciences humaines et sociales, Apr 2022, Le Kremlin-Bicêtre, France. ⟨hal-03651146⟩
82 Consultations
11 Téléchargements

Partager

Gmail Facebook X LinkedIn More