Skip to Main content Skip to Navigation
Conference papers

Calcul de similarité entre phrases : quelles mesures et quels descripteurs ?

Résumé : Cet article présente notre participation à l’édition 2020 du Défi Fouille de Textes DEFT 2020 et plus précisément aux deux tâches ayant trait à la similarité entre phrases. Dans notre travail nous nous sommes intéressé à deux questions : celle du choix de la mesure du similarité d’une part et celle du choix des opérandes sur lesquelles se porte la mesure de similarité. Nous avons notamment étudié la question de savoir s’il fallait utiliser des mots ou des chaînes de caractères (mots ou non-mots). Nous montrons d’une part que la similarité de Bray-Curtis peut être plus efficace et surtout plus stable que la similarité cosinus et d’autre part que le calcul de similarité sur des chaînes de caractères est plus efficace que le même calcul sur des mots.
Document type :
Conference papers
Complete list of metadatas

Cited literature [12 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-02784738
Contributor : Sylvain Pogodalla <>
Submitted on : Wednesday, June 17, 2020 - 4:42:30 PM
Last modification on : Wednesday, July 8, 2020 - 8:58:02 AM

File

210.pdf
Publisher files allowed on an open archive

Identifiers

  • HAL Id : hal-02784738, version 2

Citation

Davide Buscaldi, Ghazi Felhi, Dhaou Ghoul, Josepth Le Roux, Gaël Lejeune, et al.. Calcul de similarité entre phrases : quelles mesures et quels descripteurs ?. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition), 2020, Nancy, France. pp.14-25. ⟨hal-02784738v2⟩

Share

Metrics

Record views

7

Files downloads

8