Découverte de labels dupliqués par l'exploration du treillis des classifieurs binaires

Quentin Labernia 1 Victor Codocedo 1 Mehdi Kaytoue 1 Céline Robardet 1
1 DM2L - Data Mining and Machine Learning
LIRIS - Laboratoire d'InfoRmatique en Image et Systèmes d'information
Résumé : L'analyse des données comportementales représente aujourd'hui un grand enjeu. Tout individu génère des traces d'activité et de mobilité. Lors-qu'elles sont associées aux individus, ou labels, qui les ont créées, il est possible de construire un modèle qui prédit avec précision l'appartenance d'une nouvelle trace. Sur internet, il est cependant fréquent qu'un utilisateur possède différentes identités virtuelles, ou labels doublons. Les ignorer provoque une grande réduc-tion de la précision de l'identification. Il est ainsi question dans cet article du pro-blème de déduplication de labels, et l'on présente une méthode originale basée sur l'exploration du treillis des classifieurs binaires. Chaque sous-ensemble de labels est classifié face à son complémentaire et des contraintes rendent possible l'identification des labels doublons en élaguant l'espace de recherche. Des ex-périmentations sont menées sur des données issues du jeu vidéo STARCRAFT 2. Les résultats sont de bonne qualité et encourageants.
Type de document :
Communication dans un congrès
16 ème journées Francophones Extraction et Gestion des Connaissances, Jan 2016, Reims, France. Hermann-Editions, 16 ème journées Francophones Extraction et Gestion des Connaissances, E-30, pp.255--266, 2016
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01265202
Contributeur : Mehdi Kaytoue <>
Soumis le : dimanche 31 janvier 2016 - 12:36:58
Dernière modification le : mercredi 31 octobre 2018 - 12:24:25
Document(s) archivé(s) le : vendredi 11 novembre 2016 - 22:38:24

Fichier

egc.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01265202, version 1

Collections

Citation

Quentin Labernia, Victor Codocedo, Mehdi Kaytoue, Céline Robardet. Découverte de labels dupliqués par l'exploration du treillis des classifieurs binaires. 16 ème journées Francophones Extraction et Gestion des Connaissances, Jan 2016, Reims, France. Hermann-Editions, 16 ème journées Francophones Extraction et Gestion des Connaissances, E-30, pp.255--266, 2016. 〈hal-01265202〉

Partager

Métriques

Consultations de la notice

174

Téléchargements de fichiers

122