Vers un dictionnaire de collocations multilingue

Résumé : Cet article présente un projet de recherche ayant comme objectifs le développement des outils d’extraction semi-automatique de collocations, basés sur des corpus alignés, paramétrables pour plusieurs langues (en premier lieu : allemand, français et roumain) et la création d’un dictionnaire multilingue électronique de collocations. Nous avons développé et comparé plusieurs méthodes d’extraction de collocations : une méthode statistique indépendante des langues suivie d’un filtrage linguistique, ainsi qu’une approche symbolique (disponible pour l’allemand) basée sur des patrons lexico-syntaxiques. Nous avons analysé une classe particulière de collocations, les constructions verbo-nominales (VN), et leurs propriétés morpho-syntaxiques, sur la base d’un modèle inspiré par la grammaire systémique fonctionnelle. À partir de corpus étiquetés et annotés, nous avons défini des patrons d’extraction et de filtrage pour identifier les candidats collocationnels intéressants (prédicateurs complexes et prédicats complexes). Nous présentons la structure du dictionnaire multilingue et la méthodologie de sélection des candidats à partir de corpus monolingues et multilingues (alignés au niveau propositionnel et lexical).
Document type :
Journal articles
Complete list of metadatas

https://hal-univ-diderot.archives-ouvertes.fr/hal-01220294
Contributor : Christopher Gledhill <>
Submitted on : Monday, October 26, 2015 - 9:49:22 AM
Last modification on : Thursday, November 14, 2019 - 10:18:02 AM

Identifiers

  • HAL Id : hal-01220294, version 1

Citation

Amalia Todirascu, Christopher Gledhill, Ulrich Heid, Marion Weller, Dan Stefânescu, et al.. Vers un dictionnaire de collocations multilingue. Cahiers de Linguistique, EME EDITION, 2008, 33 (1), pp.172-196. ⟨hal-01220294⟩

Share

Metrics

Record views

169