ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 45/3 - 2004  - pp.103-122
TITRE
Extraction de terminologies bilingues à partir de corpus comparables d'un domaine spécialisé

RÉSUMÉ
Cet article présente et évalue une chaîne de traitements qui identifie au sein de corpus comparables d'un domaine de spécialité, des termes simples et complexes et leurs traductions candidates. La chaîne est constituée d'un extracteur de termes complexes fonctionnant sur les deux langues et d'un module d'alignement fondé sur une méthode statistique exploitant le contexte des termes. Après avoir rappelé les difficultés que pose l'alignement des termes complexes et précisé notre approche, nous présentons le processus d'extraction de terminologies bilingues adopté et les ressources utilisées pour nos expérimentations. Enfin, nous évaluons cette chaîne de traitements et mettons à jour ses limites malgré des premiers résultats encourageants concernant l'alignement de termes complexes non compositionnels.


ABSTRACT
This article presents and evaluates a system for extracting bilingual terms composed of single-word terms (SWTs) and multi-word terms (MWTs) from comparable corpora of a technical domain. The system is composed of a MWT extractor applying on the two languages, and an alignment module which uses statistical methods to align single words, SWTs and MWTs by exploiting the term contexts. After explaining the difficulties involved in MWTs and specifying our approach, we show the adopted process for bilingual terminology extraction and the resources used in our experiments. Finally, we evaluate our system and demonstrate its significance for non-compositional MWT alignment but show also its limit.


AUTEUR(S)
Emmanuel MORIN, Béatrice DAILLE

MOTS-CLÉS
terminologie bilingue, corpus comparable, domaine spécialisé, termes simples et complexes.

KEYWORDS
bilingual terminology, comparable corpora, technical domain, single- and multiword terms.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (99 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier