Alignement lexical dans les corpus bilingues : la méthode des spécificités - Université Denis Diderot - Paris VII Accéder directement au contenu
Communication Dans Un Congrès Année : 2001

Alignement lexical dans les corpus bilingues : la méthode des spécificités

Résumé

The approach suggested in this article enables statistic identification of low-frequency word correspondences of bilingual texts aligned on phrase level. Corresponding lexical units are discovered through characteristic element computation in parallel contexts. An extensive description of translation equivalence is obtained through the study of multiple co-occurrences. The calculation undergoes systematic reiteration in order to embrace the entire corpus. The exploratory results show that the use of quantitative methods in combination with a bilingual lexicon or a dictionary offers new prospects for improving automatic word alignment.
Dans les corpus alignés au niveau de la phrase, le repérage des équivalences lexicales à faible fréquence peut être effectué sur des bases quantitatives. Basée sur la pratique du calcul des spécificités, notre méthode explore parallèlement les contextes équivalents pour repérer des correspondances dans les emplois caractéristiques des différents types d'unités textuelles. L'intégration du calcul des co-occurrences multiples permet d'affiner la description des unités lexicales complexes. La réitération systématique de ce processus dans le corpus, éventuellement appuyée sur l'utilisation d'un dictionnaire ou d'un lexique bilingue, offre de nouveaux moyens d'appariement des mots et des syntagmes.
Fichier principal
Vignette du fichier
ZIMINA RJC 2001.pdf (942.51 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-01224610 , version 1 (03-03-2022)

Identifiants

  • HAL Id : hal-01224610 , version 1

Citer

Maria Zimina. Alignement lexical dans les corpus bilingues : la méthode des spécificités. RJC 2001, Université de la Sorbonne nouvelle - Paris 3, ED268 : LANGAGE & LANGUES : Description, Théorisation, Transmission, Oct 2001, Paris, France. pp.143-155. ⟨hal-01224610⟩
86 Consultations
7 Téléchargements

Partager

Gmail Facebook X LinkedIn More