Skip to Main content Skip to Navigation
Conference papers

Coopération multiniveau d'approches non supervisées et supervisées pour la détection des ruptures thématiques dans les discours présidentiels français

Alain Lelu 1 Martine Cadot 2 Sylvain Aubin 3
1 KIWI - Knowledge Information and Web Intelligence
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
2 ABC - Machine Learning and Computational Biology
LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
Résumé : Notre réponse à la tâche de détection des ruptures thématiques repose sur la construction d'un petit nombre d'indicateurs numériques à valeur croissante avec la probabilité pour une phrase d'être un début de paragraphe thématique, chacun traduisant un point de vue différent. Deux indicateurs expriment directement ce qu'on peut induire des débuts de phrases. Une phase de forte réduction de dimensions du problème, non supervisée, était un préalable pour les autres points de vues, que ce soit le rhétorique, où chaque phrase a été réduite à un vecteur à 100 dimensions, ou le sémantique, où chaque paragraphe a été réduit à 200 dimensions. Ce dernier cas a posé un difficile problème d'apprentissage de données complexes multiniveau, auquel nous avons apporté un début de réponse. L'apprentissage final par règles de décision de nos 5 indicateurs, perfectible, nous a conduit à des performances honorables par rapport aux autres équipes.
Document type :
Conference papers
Complete list of metadata

Cited literature [7 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-00516867
Contributor : Alain Lelu <>
Submitted on : Sunday, September 12, 2010 - 9:55:51 PM
Last modification on : Friday, February 26, 2021 - 3:28:08 PM
Long-term archiving on: : Monday, December 13, 2010 - 2:33:45 AM

File

DEFT06AL-MC2.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-00516867, version 1

Collections

Citation

Alain Lelu, Martine Cadot, Sylvain Aubin. Coopération multiniveau d'approches non supervisées et supervisées pour la détection des ruptures thématiques dans les discours présidentiels français. Semaine du Document Numérique - SDN'06, Sep 2006, Fribourg, Suisse. pp.1. ⟨hal-00516867⟩

Share

Metrics

Record views

401

Files downloads

151