Degrés d'équivalence de mesures de comparaison pour données binaires et pour données numériques

Marie-Jeanne Lesot 1 Maria Rifqi 1
1 MALIRE - Machine Learning and Information Retrieval
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : Résumé. Afin d'aider au choix d'une mesure pour comparer des données, pro-blème au coeur de la conception de systèmes dans les domaines de la fouille de données, l'apprentissage automatique ou la recherche d'information, nous comparons les mesures les plus courantes selon l'ordre qu'elles induisent sur les données et nous quantifions leur accord par des degrés d'équivalence. Nous proposons une étude systématique des mesures de comparaison appliquées aux données binaires et aux données numériques, en examinant les principales me-sures de similarité, distance et produits scalaires. Nous établissons leurs degrés d'équivalence, en considérant des bases de données artificielles et réelles et iden-tifions des mesures équivalentes et quasi-équivalentes, qui peuvent être considé-rées comme redondantes dans un cadre de recherche d'information.
Complete list of metadatas

Cited literature [14 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01078647
Contributor : Maria Rifqi <>
Submitted on : Wednesday, October 29, 2014 - 4:58:17 PM
Last modification on : Thursday, March 21, 2019 - 1:09:53 PM
Long-term archiving on: Friday, January 30, 2015 - 10:36:18 AM

File

LesotRifqi.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-01078647, version 1

Citation

Marie-Jeanne Lesot, Maria Rifqi. Degrés d'équivalence de mesures de comparaison pour données binaires et pour données numériques. Revue des Nouvelles Technologies de l'Information, Hermann, 2012, Mesurer et évaluer la Qualité des Données et des Connaissances, RNTI-E-22, pp.145-164. ⟨hal-01078647⟩

Share

Metrics

Record views

654

Files downloads

748