Participation de l'IRISA à DEFT 2011: expériences avec des approches d'apprentissage supervisé et non-supervisé

Christian Raymond 1 Vincent Claveau 1
1 TEXMEX - Multimedia content-based indexing
IRISA - Institut de Recherche en Informatique et Systèmes Aléatoires, Inria Rennes – Bretagne Atlantique
Résumé : Cet article présente la participation de l'équipe TexMex de l'IRISA à DEFT 2011. Nous avons participé aux deux tâches proposées et à toutes les pistes. Nous avons exploré différentes approches. Nous avons notamment employé des techniques d'apprentissage particulières à base de boosting et de lazy-learning et des pondérations issues du domaine de la recherche d'information. Ces différentes approches nous ont permis d'ob- tenir de bons résultats et de nous classer premiers sur la tâche de datation et d'obtenir une précision de 99 % et 99.5 % sur la tâche d'appariement. Abstract. This article presents the participation of IRISA TexMex team at DEFT in 2011. We participated in the two proposed tasks and all tracks. We explored different approaches. We employed specific learning techniques based on boosting over decision trees and lazy-learning together with weights from the information retrieval field. These different approaches enabled us to obtain good results since we rank first on the task of dating and we obtained an accuracy of 99% and 99.5% on the pairing task.
Document type :
Conference papers
Complete list of metadatas

https://hal.archives-ouvertes.fr/hal-00643724
Contributor : Vincent Claveau <>
Submitted on : Tuesday, November 22, 2011 - 4:28:25 PM
Last modification on : Friday, November 16, 2018 - 1:24:16 AM

Identifiers

  • HAL Id : hal-00643724, version 1

Citation

Christian Raymond, Vincent Claveau. Participation de l'IRISA à DEFT 2011: expériences avec des approches d'apprentissage supervisé et non-supervisé. Challenge DeFT (défi fouille de texte), 2011, France. ⟨hal-00643724⟩

Share

Metrics

Record views

187