Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels

Christophe Servan; Marc Dymetman

Communication Dans Un Congrès Année : 2015

Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels

(1, 2) , (2)

1
2

Christophe Servan

Fonction : Auteur
PersonId : 4128
IdHAL : servan
ORCID : 0000-0003-2306-7075
IdRef : 147053609

Groupe d’Étude en Traduction Automatique/Traitement Automatisé des Langues et de la Parole

Xerox Research Centre Europe [Meylan]

Marc Dymetman

Fonction : Auteur

Xerox Research Centre Europe [Meylan]

Résumé

Nous proposons des travaux préliminaires sur une approche permettant d'ajouter des termes bilingues à un système de Traduction Automatique Statistique (TAS) à base de segments. Ces termes sont, non seulement, inclus individuellement, mais aussi avec des contextes induits autour de ces mots. Tout d'abord nous générons ces contextes en généralisant des motifs (ou patrons) observés pour des mots de même nature syntaxique dans un corpus bilingue. Enfin, nous filtrons les contextes qui n'atteignent pas un certain seuil de confiance, à l'aide d'une méthode de sélection de bi-segments inspirée d'une approche de sélection de données, précédemment appliquée à des textes bilingues alignés.

Mots clés

Traduction Automatique Statistique Génération Automatique de Texte contexte phrastique terminologie bilingue

Domaines

Traitement du texte et du document

Fichier principal

terminology-final-version.pdf (184.06 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Christophe Servan : Connectez-vous pour contacter le contributeur

https://hal.science/hal-01157850

Soumis le : jeudi 28 mai 2015-16:35:03

Dernière modification le : jeudi 4 avril 2024-21:36:17

Archivage à long terme le : mardi 15 septembre 2015-07:55:37

Dates et versions

hal-01157850 , version 1 (28-05-2015)

Identifiants

HAL Id : hal-01157850 , version 1

Citer

Christophe Servan, Marc Dymetman. Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels. 22ème Conférence sur le Traitement Automatique des Langues Naturelles, ATALA, Jun 2015, Caen, France. ⟨hal-01157850⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS LIG LIG_TDCGE_GETALP AFFUMT ANR LIG_SIDCH

178 Consultations

156 Téléchargements

Adaptation par enrichissement terminologique en traduction automatique statistique fondée sur la génération et le filtrage de bi-segments virtuels

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager