Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels

Résumé : Nous proposons des travaux préliminaires sur une approche permettant d'ajouter des termes bilingues à un système de Traduction Automatique Statistique (TAS) à base de segments. Ces termes sont, non seulement, inclus individuellement, mais aussi avec des contextes induits autour de ces mots. Tout d'abord nous générons ces contextes en généralisant des motifs (ou patrons) observés pour des mots de même nature syntaxique dans un corpus bilingue. Enfin, nous filtrons les contextes qui n'atteignent pas un certain seuil de confiance, à l'aide d'une méthode de sélection de bi-segments inspirée d'une approche de sélection de données, précédemment appliquée à des textes bilingues alignés.
Document type :
Conference papers
Liste complète des métadonnées

Cited literature [14 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01157850
Contributor : Christophe Servan <>
Submitted on : Thursday, May 28, 2015 - 4:35:03 PM
Last modification on : Tuesday, February 12, 2019 - 10:30:06 AM
Document(s) archivé(s) le : Tuesday, September 15, 2015 - 7:55:37 AM

File

terminology-final-version.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01157850, version 1

Collections

Citation

Christophe Servan, Marc Dymetman. Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels. 22ème Conférence sur le Traitement Automatique des Langues Naturelles, ATALA, Jun 2015, Caen, France. ⟨hal-01157850⟩

Share

Metrics

Record views

297

Files downloads

170