L. Des, C. Pour-réaliser-cette-tâche-est, and . Qu, ils requièrent assez peu de paramétrages (il n'est pas nécessaire de comprendre toute la théorie des CRF pour utiliser CRF++) et assez peu de données de référence, mais qu'ils sont malgré tout suffisamment souples pour intégrer des connaissances linguistiques externes. Nous avons surtout utilisé ici la compréhension que nous avions des étiquettes pour nous focaliser sur l'apprentissage de sous-étiquettes plus simples et cohérentes, Si nous avions disposé d'un dictionnaire des étiquettes possibles pour chaque mot (ou chaque lemme), il aurait aussi été possible d'introduire des features qui prennent en compte cette nouvelle information

. Au-vu-de-nos-expériences, il semble difficile d'améliorer la correction des étiquettes apprises en jouant sur leur décomposition en sous-étiquettes plus simples. Mais cette décomposition permet d'améliorer considérablement le temps d'apprentissage. Pour confirmer ces résultats, cette stratégie devra bien sûr à l

Y. Altun, M. Johnson, and T. Hofmann, Investigating loss functions and optimization methods for discriminative learning of label sequences, Proceedings of the 2003 conference on Empirical methods in natural language processing -, 2003.
DOI : 10.3115/1119355.1119374

C. Benzitoun, L'annotation syntaxique de corpus oraux constitue-t-elle un problème spécifique ?, 2004.

C. Blanche-benveniste, Sémantique et corpus. Les aspects dynamiques de la composition sémantique de l'oral, pp.39-74, 2005.

C. Blanche-benveniste and C. Jeanjean, Le Français parlé, Transcription et édition, 1987.

A. Dister, De la transcription à l'étiquetage morphosyntaxique. Le cas de la banque de données textuelle orale VALIBEL, Thèse de Doctorat, 2007.

F. Jousse, Transformations d'Arbres XML avec des Modèles Probabilistes pour l'Annotation, thèse de Doctorat en informatique, 2007.

J. Lafferty, A. Mccallum, and F. Pereira, Conditional random fields : Probabilistic models for segmenting and labeling sequence data, Proceedings of ICML'01, pp.282-289, 2001.

A. Mccallum and W. Li, Early results for named entity recognition with conditional random fields, Proceedings of CoNLL, 2003.

P. Mertens, Les corpus de français parlé Elicop : consultation et exploitation, 2002.

D. Pinto, A. Mccallum, X. Lee, and W. Croft, Table extraction using conditional random fields, Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval , SIGIR '03, 2003.
DOI : 10.1145/860435.860479

F. Sha and F. Pereira, Shallow parsing with conditional random fields, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology , NAACL '03, 2003.
DOI : 10.3115/1073445.1073473

C. Sutton and A. Mccallum, An Introduction to Conditional Random Fields for Relational Learning, Introduction to Statistical Relational Learning, 2006.

A. Valli and J. Veronis, « Étiquetage grammatical des corpus de parole : problèmes et Perspectives » L'oral spontané. Revue Française de Linguistique Appliquée, pp.113-133, 1999.

A. Zidouni, H. Glotin, and M. Quafafou, Recherche d'Entités Nommées dans les journaux radiophoniques par contextes hiérarchique et syntaxique, actes de Coria, pp.421-432, 2009.