ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 42/2 - 2001  - pp.347-380
TITLE
Building a Tree-Bank of Modern Hebrew

RÉSUMÉ

Cet article décrit la construction d’un corpus arboré de l’Hébreu moderne. L’objectif premier vise à réduire le coût des annotations faites à la main à l’aide de moyens automatiques. A cette fin, nous montrons l’utilité de combiner un analyseur morphologique, un analyseur probabiliste et un corpus de référence de taille réduite manuellement annoté. Le corpus initial arboré consiste en 500 phrases annotées à la main par des informations morphologiques et syntaxiques. Un analyseur morphologique et un analyseur syntaxique probabiliste ont eŽté appliquées à ce corpus arboré. En fonction des résultats de quelques expérimentations avec ces outils, une procédure semi-automatique est mise au point pour annoter de nouveaux textes.

ABSTRACT

This paper describes the process of building the first tree-bank for Modern Hebrew texts. A major concern in this process is the need for reducing the cost of manual annotation by the use of automatic means. To this end, the joint utility of an automatic morphological analyzer, a probabilistic parser and a small manually annotated tree-bank was explored. An initial tree-bank that consists of 500 annotated sentences from a daily newspaper is described. The annotation scheme that underlies the tree-bank analyses integrates morphology and syntax. An existing morphological analyzer and a language-independent probabilistic parser were applied to this tree-bank. Based on the results of some experiments with these tools, a semi-automatic procedure for future enlargement of the tree-bank is outlined.

AUTEUR(S)
Khalil SIMA’AN, Alon ITAI, Yoad WINTER, Alon ALTMAN, Noa NATIV

MOTS-CLÉS
Hébreu moderne, corpus arboré, annotation semi-automatique, analyse morphologique et syntaxique probabiliste.

KEYWORDS
Modern Hebrew, Corpus, Tree-Bank, Syntactic and Morphological Analysis, Probabilistic Parsing, Semi-Automatic Annotation.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (477 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier