. Ces-travaux-mettent-aussi-en-Évidence-une-difficulté-d, utilisation des CRF : quelle stratégie employer pour sélectionner les caractéristiques produisant le meilleur modèle ? Peu de travaux abordent ce point, l'approche couramment utilisée étant de déléguer cette sélection à l'algorithme d'apprentissage des CRF, qui va assigner un poids nul aux fonctions caractéristiques non pertinentes (McCallum, 2003) Or nos expériences ont montré que cette approche n'est pas suffisante et qu'une exploration plus systématique des combinaisons possibles des fonctions caractéristiques permet d'obtenir de meilleurs résultats. Encore une fois

R. Ghani, K. Probst, Y. Liu, M. Krema, and A. Fano, Text mining for product attribute extraction, ACM SIGKDD Explorations Newsletter, vol.8, issue.1, pp.41-48, 2006.
DOI : 10.1145/1147234.1147241

J. Lafferty, A. Mccallum, and F. Pereira, « Conditional Random Fields : Probabilistic models for segmenting and labeling sequence data, Proceedings of ICML 2001, pp.282-289, 2001.

A. Mccallum, « Efficiently inducing features of Conditional Random Fields, Nineteenth Conference on Uncertainty in Artificial Intelligence (UAI03), 2003.

A. Mccallum and W. Li, « Early results for named entity recognition with Conditional Random Fields, 2003.

T. Poibeau, Extraction automatique d'information, 2003.
URL : https://hal.archives-ouvertes.fr/hal-00005506

D. P. Putthividhya and J. Hu, « Bootstrapped named entity recognition for product attribute extraction, ACL, issue.11, pp.1557-1567, 2011.

C. Raymond and J. Fayolle, « Reconnaissance robuste d'entités nommées sur de la parole transcrite automatiquement, 2010.

S. Sarawagi, Information extraction », Foundations and trends in databases, pp.261-377, 2008.

F. Sha and F. Pereira, Shallow parsing with conditional random fields, Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology , NAACL '03, pp.213-220, 2003.
DOI : 10.3115/1073445.1073473

URL : http://acl.ldc.upenn.edu/N/N03/N03-1028.pdf

I. Tellier and M. Tommasi, « Champs Markoviens Conditionnels pour l'extraction d'information, Modèles probabilistes pour l'accès à l'information textuelle, 2011.