Structuration de données par apprentissage non-supervisé : applications aux données textuelles

Résumé : En fouille de données, le succès d'une méthode tient au fait qu'elle permet de répondre par un algorithme intuitif à un besoin pratique bien théorisé. C'est avec cet éclairage que nous présentons un ensemble de contributions, élaborées durant ces dix dernières années, et répondant au besoin pratique de structurer automatiquement un ensemble de données. Dans un premier temps nous proposons de nouveaux modèles théoriques de structuration complexe en classes d’individus ; il s’agit alors d'extraire automatiquement d'un ensemble de données, des structures de classification plus proches de leur organisation réelle telle qu’observée (classification recouvrante, formes symétriques), de rendre ces structures à la fois robustes (tolérance au bruit) et manipulables par l’homme (visualisation, paramétrage) et enfin d’être en mesure de les expliquer (sémantique des classes). Dans un second temps nous nous intéressons aux données textuelles via la mise en oeuvre de modèles rendant compte de la structure thématique d’une collection de textes courts dans un contexte de recherche d’information ; enfin, nous présentons un méta-modèle permettant d’apprendre automatiquement un modèle de structuration sémantique d’un ensemble de termes.
Complete list of metadatas

Cited literature [109 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/tel-01250318
Contributor : Guillaume Cleuziou <>
Submitted on : Monday, January 4, 2016 - 3:46:29 PM
Last modification on : Thursday, January 17, 2019 - 3:10:02 PM

Identifiers

  • HAL Id : tel-01250318, version 1

Collections

Citation

Guillaume Cleuziou. Structuration de données par apprentissage non-supervisé : applications aux données textuelles. Informatique [cs]. Université d'Orléans, 2015. ⟨tel-01250318⟩

Share

Metrics

Record views

354

Files downloads

982