Skip to Main content Skip to Navigation
Conference papers

Tentative d'approche multilingue en extraction d'information

Gaël Lejeune 1 Nadine Lucas 1 Antoine Doucet 1
1 Equipe Hultech - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image et Instrumentation de Caen
Résumé : Nous présentons ici un système d'extraction d'information basé uniquement sur des critères positionnels et stylistiques. L'idée est de concevoir un modèle faisant appel à des ressources aussi limitées que possible de façon à limiter le travail nécessaire pour traiter plusieurs langues. Spécialisé dans le domaine de la veille épidémiologique sur la presse, le système que nous allons décrire s'appuie sur les lois du genre journalistique et les théories de la communication pour extraire des évènements épidémiologiques. Testée en premier lie sur le français, cette approche s'est avérée efficace et très adaptée aux problématiques multilingues.
Document type :
Conference papers
Complete list of metadata

https://hal.archives-ouvertes.fr/hal-01067147
Contributor : Greyc Référent Connect in order to contact the contributor
Submitted on : Tuesday, September 23, 2014 - 11:23:05 AM
Last modification on : Tuesday, October 19, 2021 - 11:34:56 PM
Long-term archiving on: : Wednesday, December 24, 2014 - 8:52:07 PM

File

ACTI-LEJEUNE-2010-1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01067147, version 1

Citation

Gaël Lejeune, Nadine Lucas, Antoine Doucet. Tentative d'approche multilingue en extraction d'information. JADT Journées internationales d'Analyse statistique des Données Textuelles, Jun 2010, rome, Italie. pp.1259-1267. ⟨hal-01067147⟩

Share

Metrics

Les métriques sont temporairement indisponibles