ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 46/1 - 2005  - pp.41-70
TITRE
Résolution des anaphores et détermination des chaînes de coréférences. Différences entre variétés de textes

RÉSUMÉ
Dans cet article, nous nous intéressons au problème de la partition des expressions référentielles d'un texte en chaînes de coréférences disjointes. Nous portons une attention particulière à l'identification automatique des chaînes chapeautées par des noms propres, grâce à un algorithme simple (c'est-à-dire nécessitant ni analyse syntaxique complète, ni identification des parties du discours) et partiellement adaptable au type de texte, en utilisant un petit ensemble de noms caractéristiques pour chaque domaine. Pour élaborer cet algorithme, nous avons comparé trois types de textes appartenant à des domaines différents et nous avons utilisé le codage XML pour représenter les données. Aussi, nous nous sommes attaqués à quelques sous-problèmes comme l'identification automatique des syntagmes nominaux (trouver les bonnes bornes gauches et droites) et la sélection des chaînes de coréférences importantes.


ABSTRACT
In this paper, we have considered the problem of partitioning a text's referring expressions into mutually-exclusive coreference chains. In the present work, we have emphasized the automatic identification of chains headed by a proper noun, using a simple algorithm (i.e. which does not require a complete syntactic parse or complete POS tagging) partially adapted to the type of text and domain by giving a special role to a small set of domain nouns. To design this algorithm, we have compared three types of texts from vastly differing domains and we have used the XML markup language to represent the relevant metadata. We have also had to consider a few subproblems, such as the automatic identification of noun phrases (i.e. finding the left and right boundaries) and the characterisation of the "important" coreference chains.


AUTEUR(S)
Sylvie BOUDREAU, Richard KITTREDGE

MOTS-CLÉS
résolution d'anaphores, chaîne de coréférences, variété de textes, linguistique de corpus, langage de balisage XML.

KEYWORDS
anaphora resolution, coreference chains, text type, corpus linguistics, XML.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (243 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier