ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 43/3 - 2002  - pp.155-179
TITLE
Querying treebanks of spontaneous speech with VIQTORYA

RÉSUMÉ
Ce papier présente un outil de requête pour des corpus annotés syntaxiquement. L'outil a été developpé pour la recherche dans les corpus arborés annotés à l'Université de Tübingen qui sont constitués de retranscriptions de dialogues. En principe une adaption à d'autres corpus est possible. L'outil tient compte des structures de données spécifiques nécessaires pour l'annotation des corpus de parole spontanée. En particulier il ne suppose pas que ces structures soient nécessairement des arbres. Le langage de requête permet la recherche de tokens, de catégories syntaxiques, de fonctions grammaticales et de relations binaires de dominance (immédiate) et de précédence linéaire. L'approche générale est d'extraire dans une première phase d'initialisation les informations pertinentes du corpus pour les stocker, sous une forme compacte, dans une base de données relationnelle. Lors de l'interrogation, chaque requête posée est traduite en une requête SQL puis évaluée par rapport à la base de données. Une interface graphique permet d'aider l'utilisateur à construire des requêtes.


ABSTRACT
This paper presents a query tool for syntactically annotated corpora. The query tool is developed to search the Tübingen treebanks that consist of spoken dialogs. In principle it can also be adapted to other corpora. It takes into account the specific data structures needed to annotate spontaneous speech and therefore does not assume that the graphs used as annotations are trees. The query language allows to search for tokens, syntactic categories, grammatical functions and binary relations of (immediate) dominance and linear precedence between nodes. The overall idea is to extract in an initializing phase the relevant information from the corpus and store it in a compact way in a relational database. An incoming query is then translated into a corresponding SQL query that is evaluated on the database. A graphical user interface allows to specify queries in a user-friendly way.


AUTEUR(S)
Laura KALLMEYER, Ilona STEINER

MOTS-CLÉS
corpus de parole spontanée, corpus arborés, outil de requête, langage de requête.

KEYWORDS
corpora of spontaneous speech, treebank, query tool, query language.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (328 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier