A COMPARATIVE STUDY BETWEEN POLYCLASS AND MULTICLASS LANGUAGE MODELS

I Zitouni 1 K Smaïli 2 S Deligne 3 F Bimbot 4
1 PAROLE - Analysis, perception and recognition of speech
INRIA Lorraine, LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications
2 SMarT - Statistical Machine Translation and Speech Modelization and Text
LORIA - NLPKD - Department of Natural Language Processing & Knowledge Discovery
4 PANAMA - Parcimonie et Nouveaux Algorithmes pour le Signal et la Modélisation Audio
Inria Rennes – Bretagne Atlantique , IRISA-D5 - SIGNAUX ET IMAGES NUMÉRIQUES, ROBOTIQUE
Abstract : In this work, we introduce the concept of Multiclass for language modeling and we compare it to the Polyclass model. The originality of the Multiclass is its capability to parse a string of classes/tags into variable length independent sequences. A few experimental tests were carried out on a class corpus extracted from the French « Le Monde » word corpus labeled automatically. This corpus contains a set of 43 million of words. In our experiments, Multiclass outperform first-order Polyclass but are slightly outperformed by second-order Polyclass.
Type de document :
Communication dans un congrès
Proceedings of the Fifth International Conference on Spoken Language Processing, 1998, Sydney, Australia. 1998
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01112912
Contributeur : Kamel Smaïli <>
Soumis le : mardi 3 février 2015 - 19:20:25
Dernière modification le : mardi 18 décembre 2018 - 16:38:02
Document(s) archivé(s) le : samedi 12 septembre 2015 - 08:25:22

Fichier

ImedICSLP98.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01112912, version 1

Citation

I Zitouni, K Smaïli, S Deligne, F Bimbot. A COMPARATIVE STUDY BETWEEN POLYCLASS AND MULTICLASS LANGUAGE MODELS. Proceedings of the Fifth International Conference on Spoken Language Processing, 1998, Sydney, Australia. 1998. 〈hal-01112912〉

Partager

Métriques

Consultations de la notice

377

Téléchargements de fichiers

228