Skip to Main content Skip to Navigation
Conference papers

DEFT2013, une cuisine de caractères

Gaël Lejeune 1 Charlotte Lecluze 1 Romain Brixtel 1
1 Equipe Hultech - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image et Instrumentation de Caen
Résumé : Nous présentons dans cet article les méthodes utilisées par l'équipe HULTECH pour sa participation au DÉfi Fouille de Textes 2013 (DEFT2013). Cette neuvième édition porte sur l'analyse automatique de recettes de cuisine en langue française. Elle comporte quatre tâches : trois de classification de documents et une d'extraction d'information. Notre équipe participe aux quatre tâches. Nous nous appuyons pour chaque tâche sur une technique d'algorithmique du texte : la détection de chaînes de caractères répétées maximales (rst r max). Les méthodes développées sont simples et non supervisées. ABSTRACT DEFT2013, a distinctive character-based cuisine We present here the HULTECH (Human Language Technology) team approach for the DEFT2013 (french text mining challenge). The aim of the challenge is to automatically analyze recipes in French. It has four tasks : three of document classification and one of information extraction. Our team participate in four tasks. Our methods relie on a text algorithmics technic : detection of maximal repeated strings (rst r ma x). The developed methods are simple and unsupervised. MOTS-CLÉS : classification, extraction d'information, appariement, algorithmique du texte.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-01074649
Contributor : Greyc Référent Connect in order to contact the contributor
Submitted on : Wednesday, October 15, 2014 - 10:04:20 AM
Last modification on : Tuesday, October 19, 2021 - 11:34:56 PM
Long-term archiving on: : Friday, January 16, 2015 - 10:15:31 AM

File

ACTN-LEJEUNE-2013-1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01074649, version 1

Citation

Gaël Lejeune, Charlotte Lecluze, Romain Brixtel. DEFT2013, une cuisine de caractères. 20ème conférence du Traitement Automatique du Langage Naturel 2013 (TALN 2013), Jun 2013, Sables d'Olonne, France. ⟨hal-01074649⟩

Share

Metrics

Les métriques sont temporairement indisponibles