Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2015

Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels

Résumé

Nous proposons des travaux préliminaires sur une approche permettant d'ajouter des termes bilingues à un système de Traduction Automatique Statistique (TAS) à base de segments. Ces termes sont, non seulement, inclus individuellement, mais aussi avec des contextes induits autour de ces mots. Tout d'abord nous générons ces contextes en généralisant des motifs (ou patrons) observés pour des mots de même nature syntaxique dans un corpus bilingue. Enfin, nous filtrons les contextes qui n'atteignent pas un certain seuil de confiance, à l'aide d'une méthode de sélection de bi-segments inspirée d'une approche de sélection de données, précédemment appliquée à des textes bilingues alignés.
Fichier principal
Vignette du fichier
terminology-final-version.pdf (184.06 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01157850 , version 1 (28-05-2015)

Identifiants

  • HAL Id : hal-01157850 , version 1

Citer

Christophe Servan, Marc Dymetman. Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels. 22ème Conférence sur le Traitement Automatique des Langues Naturelles, ATALA, Jun 2015, Caen, France. ⟨hal-01157850⟩
178 Consultations
156 Téléchargements

Partager

Gmail Facebook X LinkedIn More