Découverte de labels dupliqués par l'exploration du treillis des classifieurs binaires - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Découverte de labels dupliqués par l'exploration du treillis des classifieurs binaires

Victor Codocedo
Mehdi Kaytoue
Céline Robardet

Résumé

L'analyse des données comportementales représente aujourd'hui un grand enjeu. Tout individu génère des traces d'activité et de mobilité. Lors-qu'elles sont associées aux individus, ou labels, qui les ont créées, il est possible de construire un modèle qui prédit avec précision l'appartenance d'une nouvelle trace. Sur internet, il est cependant fréquent qu'un utilisateur possède différentes identités virtuelles, ou labels doublons. Les ignorer provoque une grande réduc-tion de la précision de l'identification. Il est ainsi question dans cet article du pro-blème de déduplication de labels, et l'on présente une méthode originale basée sur l'exploration du treillis des classifieurs binaires. Chaque sous-ensemble de labels est classifié face à son complémentaire et des contraintes rendent possible l'identification des labels doublons en élaguant l'espace de recherche. Des ex-périmentations sont menées sur des données issues du jeu vidéo STARCRAFT 2. Les résultats sont de bonne qualité et encourageants.
Fichier principal
Vignette du fichier
egc.pdf (320.13 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01265202 , version 1 (31-01-2016)

Identifiants

  • HAL Id : hal-01265202 , version 1

Citer

Quentin Labernia, Victor Codocedo, Mehdi Kaytoue, Céline Robardet. Découverte de labels dupliqués par l'exploration du treillis des classifieurs binaires. 16 ème journées Francophones Extraction et Gestion des Connaissances, Jan 2016, Reims, France. pp.255--266. ⟨hal-01265202⟩
151 Consultations
176 Téléchargements

Partager

Gmail Facebook X LinkedIn More