DEFT2013, une cuisine de caractères
Résumé
Nous présentons dans cet article les méthodes utilisées par l'équipe HULTECH pour sa participation au DÉfi Fouille de Textes 2013 (DEFT2013). Cette neuvième édition porte sur l'analyse automatique de recettes de cuisine en langue française. Elle comporte quatre tâches : trois de classification de documents et une d'extraction d'information. Notre équipe participe aux quatre tâches. Nous nous appuyons pour chaque tâche sur une technique d'algorithmique du texte : la détection de chaînes de caractères répétées maximales (rst r max). Les méthodes développées sont simples et non supervisées.
ABSTRACT DEFT2013, a distinctive character-based cuisine We present here the HULTECH (Human Language Technology) team approach for the DEFT2013 (french text mining challenge). The aim of the challenge is to automatically analyze recipes in French. It has four tasks : three of document classification and one of information extraction. Our team participate in four tasks. Our methods relie on a text algorithmics technic : detection of maximal repeated strings (rst r ma x). The developed methods are simple and unsupervised. MOTS-CLÉS : classification, extraction d'information, appariement, algorithmique du texte.
Origine : Fichiers produits par l'(les) auteur(s)