ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 44/3 - 2003  - pp.141-165
TITRE
Grammaires à substitution d'arbres polynomiales et discriminantes

RÉSUMÉ
Les Grammaires à Substitution d'Arbres Polynomiales (pSTSG), une sous-classe des STSG pour laquelle la recherche de l'arbre d'analyse le plus probable n'est plus NP-difficile mais polynomiale, sont définies et caractérisées en termes de propriétés générales sur leurs arbres élémentaires. Des conditions nécessaires et suffisantes pour une polynomialité effective sont d'abord données. Puis deux principes de sélection sont présentés, reposant sur cette caractérisation et permettant l'extraction automatique des pSTSG à partir d'un corpus d'arbres. Par ailleurs, les STSG standard utilisent un modèle probabiliste de nature générative, dans lequel les probabilités sont conditionnées par les racines des arbres et dont les paramètres sont déterminés de façon heuristique. Les expériences montrent que ce type de modèles induit des comportements indésirables en analyse syntaxique. Nous proposons ici une approche probabiliste non générative pour les STSG, selon laquelle les probabilités sont conditionnées par les feuilles des arbres syntaxiques, et qui utilise un apprentissage discriminant. Les performances des pSTSG sont évaluées, avec et sans apprentissage discriminant.


ABSTRACT
Polynomial Tree Substitution Grammars (pSTSGs), a subclass of STSGs for which finding the most probable parse is no longer NP-hard but polynomial, are defined and characterized in terms of general properties on the elementary trees they contain. Necessary and sufficient conditions for effective polynomiality are first given. Then, building upon these conditions, we describe two selection principles that allow the automatic extraction of pSTSGs out of a treebank. Moreover, standard STSGs use generative probabilistic models, in which tree probabilities are conditioned by the root symbol, and parameters are trained empirically, leading to several drawbacks when they are used in analysis. We propose a novel non-generative probabilistic model of STSGs, based on a discriminant training method, where probabilities are conditioned by the leaves of the syntactic trees. Performance of polynomial STSGs is evaluated, with and without this new discriminative probability model.


AUTEUR(S)
Antoine ROZENKNOP, Jean-Cédric CHAPPELIER, Martin RAJMAN

MOTS-CLÉS
SCFG, STSG, Gibbs-Markov, apprentissage discriminant, vraisemblance conditionnelle, STSG polynomiale, Data-Oriented Parsing.

KEYWORDS
SCFG, STSG, Gibbs-Markov, discriminant training, conditionnal likelihood, polynomial STSG, Data-Oriented Parsing.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (239 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier