Utilisation de la méthode des cooccurrences pour l’alignement des mots de textes bilingues - Université Denis Diderot - Paris VII Accéder directement au contenu
Communication Dans Un Congrès Année : 2002

Utilisation de la méthode des cooccurrences pour l’alignement des mots de textes bilingues

Résumé

The focus of bilingual text alignment is automatic reconstruction of translation correspondences between the segments of source text and the segments of its translation. Progress in alignment technology would allow for new translation support tools based on existing translation resources. Quite a few algorithms have already been proposed for aligning sentences of bilingual texts. The challenge is now to discover the links between finer segments on the word level. Using lexicometrics in bilingual text analysis facilitates the discovery of translation correspondences on the basis of word frequency distributions. The purpose of this article is to demonstrate how the statistical study of the intensity of lexical relations through collocation may allow an identification of translation equivalence within the lexical environments of a couple of words representing mutual translations.
L’alignement de corpus bilingues vise la constitution automatique de correspondances de traduction entre le maximum d’éléments de textes source et cible afin de rendre possible la réalisation d'outils d’extraction et la réutilisation des ressources de traductions existantes. La recherche dans l’alignement a déjà abouti au développement de méthodes permettant d’apparier les phrases. L’appariement des mots et des syntagmes demeure une opération complexe. L’approche lexicométrique du matériau bi-textuel fournit des informations fréquentielles susceptibles de laisser apparaître les correspondances de traduction au niveau des mots et des syntagmes. L’article montre comment une application particulière de la méthode des cooccurrences permet de repérer des similitudes traductionnelles parmi les combinaisons lexicales qui s’opèrent dans les deux textes autour d’un couple de formes - traductions mutuelles.
Fichier non déposé

Dates et versions

hal-01224594 , version 1 (04-11-2015)

Identifiants

  • HAL Id : hal-01224594 , version 1

Citer

William Martinez, Maria Zimina. Utilisation de la méthode des cooccurrences pour l’alignement des mots de textes bilingues. JADT 2002, Mar 2002, Saint-Malo, France. pp.495-506. ⟨hal-01224594⟩
98 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More