Vers un dictionnaire de collocations multilingue

Résumé : Cet article présente un projet de recherche ayant comme objectifs le développement des outils d’extraction semi-automatique de collocations, basés sur des corpus alignés, paramétrables pour plusieurs langues (en premier lieu : allemand, français et roumain) et la création d’un dictionnaire multilingue électronique de collocations. Nous avons développé et comparé plusieurs méthodes d’extraction de collocations : une méthode statistique indépendante des langues suivie d’un filtrage linguistique, ainsi qu’une approche symbolique (disponible pour l’allemand) basée sur des patrons lexico-syntaxiques. Nous avons analysé une classe particulière de collocations, les constructions verbo-nominales (VN), et leurs propriétés morpho-syntaxiques, sur la base d’un modèle inspiré par la grammaire systémique fonctionnelle. À partir de corpus étiquetés et annotés, nous avons défini des patrons d’extraction et de filtrage pour identifier les candidats collocationnels intéressants (prédicateurs complexes et prédicats complexes). Nous présentons la structure du dictionnaire multilingue et la méthodologie de sélection des candidats à partir de corpus monolingues et multilingues (alignés au niveau propositionnel et lexical).
Liste complète des métadonnées

https://hal-univ-diderot.archives-ouvertes.fr/hal-01220294
Contributeur : Christopher Gledhill <>
Soumis le : lundi 26 octobre 2015 - 09:49:22
Dernière modification le : jeudi 14 décembre 2017 - 09:57:00

Identifiants

  • HAL Id : hal-01220294, version 1

Collections

Citation

Amalia Todirascu, Christopher Gledhill, Ulrich Heid, Marion Weller, Dan Stefânescu, et al.. Vers un dictionnaire de collocations multilingue. Cahiers de Linguistique, EME EDITION, 2008, 33 (1), pp.172-196. 〈http://www.eila.univ-paris-diderot.fr/_media/user/christopher_gledhill/dictionnaire_de_collocations_multilingue_todirascu_gledhill_et_al.pdf〉. 〈hal-01220294〉

Partager

Métriques

Consultations de la notice

104