Utilisation de la méthode des cooccurrences pour l’alignement des mots de textes bilingues

Résumé : L’alignement de corpus bilingues vise la constitution automatique de correspondances de traduction entre le maximum d’éléments de textes source et cible afin de rendre possible la réalisation d'outils d’extraction et la réutilisation des ressources de traductions existantes. La recherche dans l’alignement a déjà abouti au développement de méthodes permettant d’apparier les phrases. L’appariement des mots et des syntagmes demeure une opération complexe. L’approche lexicométrique du matériau bi-textuel fournit des informations fréquentielles susceptibles de laisser apparaître les correspondances de traduction au niveau des mots et des syntagmes. L’article montre comment une application particulière de la méthode des cooccurrences permet de repérer des similitudes traductionnelles parmi les combinaisons lexicales qui s’opèrent dans les deux textes autour d’un couple de formes - traductions mutuelles.
Type de document :
Communication dans un congrès
JADT 2002, Mar 2002, Saint-Malo, France. Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, pp.495-506, 2002, 〈http://lexicometrica.univ-paris3.fr/jadt/jadt2002/PDF-2002/martinez_zimina.pdf〉
Liste complète des métadonnées

https://hal-univ-diderot.archives-ouvertes.fr/hal-01224594
Contributeur : Maria Zimina <>
Soumis le : mercredi 4 novembre 2015 - 20:50:02
Dernière modification le : mardi 11 octobre 2016 - 13:49:10

Identifiants

  • HAL Id : hal-01224594, version 1

Collections

Citation

William Martinez, Maria Zimina. Utilisation de la méthode des cooccurrences pour l’alignement des mots de textes bilingues. JADT 2002, Mar 2002, Saint-Malo, France. Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, pp.495-506, 2002, 〈http://lexicometrica.univ-paris3.fr/jadt/jadt2002/PDF-2002/martinez_zimina.pdf〉. 〈hal-01224594〉

Partager

Métriques

Consultations de la notice

90