Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels

Résumé : Nous proposons des travaux préliminaires sur une approche permettant d'ajouter des termes bilingues à un système de Traduction Automatique Statistique (TAS) à base de segments. Ces termes sont, non seulement, inclus individuellement, mais aussi avec des contextes induits autour de ces mots. Tout d'abord nous générons ces contextes en généralisant des motifs (ou patrons) observés pour des mots de même nature syntaxique dans un corpus bilingue. Enfin, nous filtrons les contextes qui n'atteignent pas un certain seuil de confiance, à l'aide d'une méthode de sélection de bi-segments inspirée d'une approche de sélection de données, précédemment appliquée à des textes bilingues alignés.
Type de document :
Communication dans un congrès
22ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2015, Caen, France
Liste complète des métadonnées

Littérature citée [14 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01157850
Contributeur : Christophe Servan <>
Soumis le : jeudi 28 mai 2015 - 16:35:03
Dernière modification le : jeudi 11 octobre 2018 - 08:48:03
Document(s) archivé(s) le : mardi 15 septembre 2015 - 07:55:37

Fichier

terminology-final-version.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01157850, version 1

Collections

Citation

Christophe Servan, Marc Dymetman. Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels. 22ème Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2015, Caen, France. 〈hal-01157850〉

Partager

Métriques

Consultations de la notice

289

Téléchargements de fichiers

161