. Muzerelle, qui ont permis d'annoter manuellement en coréférences un corpus de texte contenant environ un million de mots ; puis les travaux décrits dans, qui ces denières années ont abouti à la constitution du corpus ANCOR-Centre, composé de trois corpus de parole conversationnelle annotés manuellement en relations de coréférences, 2000.

L. De-données-Étant-très-longue-et-coûteuse and A. Orfeo, Outils et Ressources pour le Français Ecrit et Oral) est parti d'une démarche alternative, avec pour objectif la constitution d'un Corpus d'Etude pour le Français Contemporain (CEFC) qui rassemblera des données à partir de différents corpus. Ces données, obtenues automatiquement ou semi-automatiquement, seront de nature diverse, dont l'alignement texte et son, et des annotations morphologiques, syntaxiques, sémantiques, conversationnelles et prosodiques. Cela correspond à un traitement massif de données écrites ou orales, qui n'est pas parfait mais qui donne accès à un grand

B. T. Delplano-m, N. A. Bechet-f, and . Favre-b, Syntactic annotation of spontaneous speech : application to call-center conversation data, Proceedings of the 8th international conference on Language Resources and Evaluation, LREC 2012, 2012.

D. J. Dubois-charlier, Les verbes français, 1997.

N. A. Bechet-f and R. J. Roux-j, MACAON : a linguistic tool suite for processing word lattices, Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics : demonstration session, 2011.

T. A. Trouilleux-f, C. C. Gaussier-e, Z. A. Andg, and . R. Antoniadis-s, Annotating a large corpus with anaphoric links, Proceedings of Discourse, Anaphora and Reference Resolution Conference, p.2000, 2000.