ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 44/3 - 2003  - pp.167-186
TITRE
Marier apprentissage endogène et ressources exogènes dans un analyseur syntaxique de corpus Le cas du rattachement verbal à distance de la préposition « de »

RÉSUMÉ
Nous présentons les résultats d`expérimentations visant à introduire des ressources lexico-syntaxiques génériques dans un analyseur syntaxique de corpus (SYNTEX) qui s'appuie sur des techniques d'apprentissage endogène. Le problème traité est celui du rattachement à distance de la préposition « de » à un verbe. La ressource lexico-syntaxique utilisée est une liste de verbes du français construite à partir de tables du lexique-grammaire développées au LADL. Nous présentons les problèmes liés à la projection d'une telle ressource sur un corpus et à son introduction dans l'analyseur à base endogène. Nous décrivons une stratégie mixte, qui marie la liste de verbes issue des tables du lexique-grammaire avec les résultats de l'apprentissage endogène. Sur les cas de rattachement au verbe, cette stratégie permet un gain d'environ 8 % en rappel et en précision par rapport à une stratégie purement endogène.


ABSTRACT
We report the results of experiments aimed at integrating general lexico-syntactic resources into a corpus syntactic parser (SYNTEX) based on endogenous learning. We tackle the issue of prepositional phrase attachment and focus on long-distance verb attachment for the French preposition "de". We make use of French lexico-syntactic resources to compile a list of verbs which subcategorize the preposition « de ». The list is applied to the corpus and we investigate the problems related to its integration in the parser. We describe an hybrid approach combining the exogenous verb list with endogenous procedures and show how it improves the parser output - +8% in recall and precision for verb attachment compared with an endogenous approach alone.


AUTEUR(S)
Cécile FRÉROT, Didier BOURIGAULT, Cécile FABRE

MOTS-CLÉS
analyse syntaxique automatique, apprentissage sur corpus, cadres de souscatégorisation, ambiguïté, rattachement prépositionnel, lexique-grammaire.

KEYWORDS
syntactic parsing, corpus-based learning, subcategorization frames, ambiguity, prepositional phrase attachment, lexicon-grammar.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (211 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier