Numérisation et exploration des manuscrits médiévaux

Résumé : Cette thèse s'attache à l'étude des images de manuscrits médiévaux numérisés. C'est l'une des premières thèses dédiées aux développements de méthodes informatiques spécifiques aux corpus médiévaux. Elle comporte 3 parties. Dans la première nous avons étudié les manuscrits du Moyen Age par rapport à l'ensemble du patrimoine écrit. Les caractères très particuliers de ces documents font que les algoruthmes de traitement et d'analyse de documents développés jusqu'à présent pour des documents imprimés ou les manuscrits plus récents sont inopérantes et que, pour les explorer, nous devons créer des méthodes adaptées à leur complexité et leur variabilité, tant au niveau des formes que des contenus. Dans le seconde partie nous nous sommes attachés à analyser la structure des documents à travers la couleur et la mise en page. Dans le seconde partie nous nous sommes attachés à analyser la structure des docuemnts à travers la couleur et la mise en page. Afin de résoudre de nombreux problèmes concrets telles que la séparation recto / verso, l'analyse des couleurs ou la binarisation, nous avons élaboré une méthode de segmentation couleur particulièrement adaptative et appropriée aux images de documents anciens. Dans l'optique de faciliter l'indexation des manuscrits médiévaux et de les caractériser, nous avons ensuite proposé une technique de segmentation des colonnes et comptage des lignes adaptée à notre corpus. Dans la troisième partie, nous nous sommes intéressés à l'accès au contenu. Les méthodes de reconnaissance optique développées pour les documents récents ne pouvant être utilisées ou adaptées, nous avons proposé une "alternative" rendant possible l'exploration du contenu. Notre solution permet de retrouver toutes les occurences d'un mot sélectionné par l'opérateur à l'intérieur d'un manuscrit. Celle-ci s'appuie sur la similarité des formes des mots. Pour cela, nous avons développé une méthode de comparaison souple mais cohésive
Type de document :
Pré-publication, Document de travail
4312; T. 2006
Liste complète des métadonnées

https://hal.archives-ouvertes.fr/hal-01466678
Contributeur : Équipe Gestionnaire Des Publications Si Liris <>
Soumis le : lundi 13 février 2017 - 16:38:49
Dernière modification le : mardi 14 février 2017 - 01:10:33

Identifiants

  • HAL Id : hal-01466678, version 1

Collections

Citation

Yann Leydier. Numérisation et exploration des manuscrits médiévaux. 4312; T. 2006. 〈hal-01466678〉

Partager

Métriques

Consultations de la notice

91