S. Diwersy, A. Falaise, M. Lay, and G. Souvay, Ressources et méthodes pour l'analyse diachronique, pp.21-44, 2017.

G. Souvay and J. Pierrel, LGeRM Lemmatisation des mots en Moyen Français, pp.149-172, 2009.

J. M. Pierrel, J. Dendien, and P. Bernard, Le TLFi ou Trésor de la Langue Française informatisé », dans Proceedings of the 11th EURALEX International Congress, dir. Geoffrey Williams et Sandra Vessier, pp.165-170, 2004.

, Une entité nommée est une expression linguistique référentielle, souvent associée aux noms propres et aux descriptions définies. Nous proposons d'en rester aux quatre étiquettes proposées pour la ConLL shared task, PER pour les personnes (Jacques) -LOC pour les lieux (Paris) -ORG pour les organisations (L'Académie française, vol.10, 2003.

, DATE pour les dates, QUANTITY pour les quantités ou MONEY pour les sommes d'argent) comme défini par d'autres projets 11 . Ce jeu d'étiquettes est utilisé avec le format BIO -beginning inside outside afin d'identifier les suites de tokens. -Afin de compenser nos choix de lemmatisation et d'étiquetage morpho-syntaxique très minimalistes pour ce qui concerne les noms propres (uniquement les tokens commençant avec une majuscule), nous optons ici pour une approche très maximaliste. Tout ce qui se rapporte à l'entité est annoté : titre (Monsieur, Président, Marquis?)

. -le-premier-token and . Le-suffixe--b, LOC-B ou PER-B) et tous les suivants avec le suffixe -I (LOC-I ou PER-I), y compris la ponctuation (Bussy-Rabutin ? PER-B PER-I PER-I). Le suffixe -B est donc placé en fonction du contexte (le comte de Bussy-Rabutin ? 0 PER-B PER-I PER-I PER-I PER-I))

E. F. Tjong-kim-sang-et-fien-de and . Meulder, Introduction to the CoNLL-2003 Shared Task : Language-Independent Named Entity Recognition », dans Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL 2003, pp.142-147, 2003.

R. Weischedel, M. Palmer, M. Marcus, E. Hovy, S. Pradhan et al., OntoNotes Release 5.0 with OntoNotes DB Tool, rapp. tech., v0.999 beta, p.20

A. Références and L. Et-université-de, Dictionnaire du Moyen Français (1330-1500), 2015.

J. Camps, Geste : un corpus de chansons de geste, p.2016, 2016.

. Clérice, Référentiel du Latin pour Pyrrha, d'après le dictionnaire et travaux du LASLA de D. Longrée et al, vol.2020

(. Diwersy and . Sascha, Falaise (Achille), Lay (Marie-Hélène) et Souvay (Gilles), « Ressources et méthodes pour l'analyse diachronique, pp.21-44, 2017.

. Guillot, « Base de français médiéval : une base de référence de sources médiévales ouverte et libre au service de la communauté scientifique, Diachroniques : Revue de Linguistique française diachronique-7, pp.168-184

. Guillot, Principes d'annotation Cat-tex09, rapp. tech., version ?0, Prévost (Sophie) et Lavrentiev (Alexei), p.20

, dans Proceedings of the 11th EURALEX International Congress, dir. Geoffrey Williams et Sandra Vessier, pp.165-170, 2004.

. Prévost, Guillot (Céline), Lavrentiev (Alexei) et Heiden (Serge), Jeu d'étiquettes morphosyntaxiques CATTEX2009, rapp. tech., version ?0, p.20

(. Souvay and . Gilles), LGeRM Lemmatisation des mots en Moyen Français, pp.149-172, 2009.

, Tjong Kim Sang (Erik F.) et De Meulder (Fien), « Introduction to the CoNLL-2003 Shared Task : Language-Independent Named Entity Recognition », dans Proceedings of the Seventh Conference on Natural Language Learning at HLT-NAACL 2003, pp.142-147, 2003.

). Michelle, Ramshaw (Lance), OntoNotes Release 5.0 with OntoNotes DB Tool, rapp. tech., v0.999 beta, p.20