Skip to Main content Skip to Navigation
Conference papers

Approches statistiques et sémantiques pour la recherche des signaux faibles

Bernard Dousset 1
1 IRIT-SIG - Systèmes d’Informations Généralisées
IRIT - Institut de recherche en informatique de Toulouse
Résumé : Nous présentons dans cet article une méthode d’extraction de signaux faibles basée sur une double approche. Dans un premier temps un traitement sémantique permet de détecter tous les multi-termes utilisés dans l’ensemble des documents analysés qu’ils soient issus d’une base homogène ou de la fusion de plusieurs bases hétérogènes et ce par traitement du texte libre enrichi par le vocabulaire contrôlé (mots clés, thésaurus, …). Dans un second temps, ne sont retenus que les termes récents à forte densité dans certains documents. Ce vocabulaire retenu est ensuite croisé avec lui-même dans une matrice de cooccurrences qui est ensuite triée par blocs afin d’en extraire des clusters sémantiques cohérents et nouveaux. Ces clusters correspondent à des signaux faibles qu’il est ensuite facile de valider en les croisant avec les autres champs : auteurs, laboratoires, pays, journaux, reste du vocabulaire.
Complete list of metadatas

Cited literature [8 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02779970
Contributor : Open Archive Toulouse Archive Ouverte (oatao) <>
Submitted on : Thursday, June 4, 2020 - 5:23:26 PM
Last modification on : Thursday, June 11, 2020 - 4:50:17 AM
Long-term archiving on: : Friday, December 4, 2020 - 5:02:24 PM

File

dousset_22147.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-02779970, version 1
  • OATAO : 22147

Citation

Bernard Dousset. Approches statistiques et sémantiques pour la recherche des signaux faibles. VSST 2016 : Veille Stratégique Scientifique & Technologique, Oct 2016, Rabat, Maroc. pp.0. ⟨hal-02779970⟩

Share

Metrics

Record views

25

Files downloads

33