Combining Subword information and Language model for Information Retrieval

Jibril Frej 1, 2, 3, 4 Philippe Mulhem 1, 2, 3 Didier Schwab 1, 2, 4 Jean-Pierre Chevallet 1, 2, 3
Résumé : En recherche d'information, certains procédés sont utilisés pour améliorer les performances des modèles de langue. Lorsque l'on considère la sémantique des mots, il a été montré que les plongements de mots neuronaux capturent des similarités sémantiques entre les mots (Mikolov et al., 2013). De telles représentations distribuées qui plongent les mots dans un espace vectoriel dense sont apprises de façon efficace sur de grandes collections. Récem-ment, elles ont été utilisées pour calculer les probabilités de traduction entre termes dans le cadre des modèles de langue neuronaux (Zuccon et al., 2015) pour la recherche d'information afin de gérer le problème de la disparité des termes. Dans cet article, nous proposons d'uti-liser de nouvelles représentations distribuées qui prennent en compte la structure interne des mots (Bojanowski et al., 2016) dans le cadre des modèles de langue neuronaux.
Type de document :
Communication dans un congrès
15e Conférence en Recherche d’Information et Applications, May 2018, Rennes, France
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01781181
Contributeur : Didier Schwab <>
Soumis le : dimanche 29 avril 2018 - 17:07:30
Dernière modification le : mercredi 7 novembre 2018 - 13:32:03
Document(s) archivé(s) le : jeudi 20 septembre 2018 - 04:36:49

Fichier

CORIA2018_Frej-et-al.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01781181, version 1

Citation

Jibril Frej, Philippe Mulhem, Didier Schwab, Jean-Pierre Chevallet. Combining Subword information and Language model for Information Retrieval. 15e Conférence en Recherche d’Information et Applications, May 2018, Rennes, France. 〈hal-01781181〉

Partager

Métriques

Consultations de la notice

194

Téléchargements de fichiers

119