Extracting collocations in context: the case of verb-noun constructions in Romanian

Résumé : Les constructions Verbo-Nominales (VN) sont composées d’un V générique et d’un N spécifique, lequel est soit (i) qualifieur structurel du Prédicateur comme faire faillite, soit (ii) Complément syntaxique comme faire des recommandations. Dans chaque cas, le N exprime la Portée sémantique de la construction (Banks 2000, Gledhill2007). Mais malgré quantité d’études sur les ‘verbes supports’ ou ‘verbes légers’, aucune propriété morpho-syntaxique ne permet de distinguer ces constructions des autres séquences V plus N, au moins en anglais. Du point de vue de l’analyste de corpus, ce manque de marque formelle rend difficile la conception d’un outild’extraction automatique. Dans le cadre d’un projet lexicographique, nous avons étudié plusieurs modèlesdestinés à extraire des VN des corpus multilingues. Nos résultats préliminaires indiquent que des méthodes purement statistiques ne sont pas suffisantes : les données révèlent parfois de ‘véritables’ constructions VN,mais aussi pour la plupart des exemples ‘non-pertinents’ de cooccurrences VN, ou tout simplement du bruit.
Type de document :
Communication dans un congrès
Liste complète des métadonnées

https://hal-univ-diderot.archives-ouvertes.fr/hal-01220405
Contributeur : Christopher Gledhill <>
Soumis le : lundi 26 octobre 2015 - 11:58:02
Dernière modification le : vendredi 31 août 2018 - 10:41:07

Identifiants

  • HAL Id : hal-01220405, version 1

Collections

Citation

Amalia Todirascu, Christopher Gledhill, Dan Stefânescu. Extracting collocations in context: the case of verb-noun constructions in Romanian. RANLP, Sep 2007, Borovets, Bulgaria. Proceedings of RANLP, 2007, 〈https://www.academia.edu/1995459/Extracting_collocations_in_context_the_case_of_verb-noun_constructions_in_English_and_Romanian〉. 〈hal-01220405〉

Partager

Métriques

Consultations de la notice

61