Résumé de communication (table-ronde Lexicométrie et corpus multilingues)

Résumé : Par delà l’alignement automatique de corpus, fondamental mais bénéficiant déjà d’une certaine maturité et d’une bonne notoriété, cette table-ronde s’intéresse à l’extension des techniques et applications lexicométriques en contexte multilingue. Sont bien évidemment concernés les corpus parallèles, pour l’analyse et l’exploitation desquels peuvent être proposés de nouveaux outils et méthodes. Sont également en jeux les corpus comparables (non alignés), qu’il s’agit d’être capable d’exploiter moyennent l’adaptation de procédures d’analyse statistique jusque là pratiquées sur des corpus monolingues. Sont enfin également considérés les corpus dont la langue introduit de nouvelles questions théoriques et techniques pour les logiciels de lexicométrie, par exemple pour le codage des caractères, le découpage en « mots », ou le codage des informations morphosyntaxiques. Des normes internationales récentes et en cours d’élaboration guident maintenant le codage des corpus et des ressources linguistiques de tous ordres. Prenant en compte la diversité des langues, elles visent à favoriser la comparabilité et la réutilisabilité des données textuelles.
Type de document :
Autre publication
Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, 10-12 mars 2.. 2004, pp.1203-1206
Liste complète des métadonnées

https://hal-univ-diderot.archives-ouvertes.fr/hal-01224679
Contributeur : Maria Zimina <>
Soumis le : mercredi 4 novembre 2015 - 23:02:16
Dernière modification le : mardi 11 octobre 2016 - 13:49:01

Identifiants

  • HAL Id : hal-01224679, version 1

Collections

Citation

Maria Zimina. Résumé de communication (table-ronde Lexicométrie et corpus multilingues). Actes des 6es Journées internationales d’Analyse statistique des Données Textuelles, 10-12 mars 2.. 2004, pp.1203-1206. 〈hal-01224679〉

Partager

Métriques

Consultations de la notice

54