ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 42/3 - 2001  - pp.785-812
TITLE
Exploiting Rich Contextual Data for the Automatic Extraction of Semantic Knowledge

RÉSUMÉ
Nous traitons le problème de l'extraction automatique d'informations sémantiques d'un corpus de textes, en nous concentrant sur la portabilité de la méthode dans des domaines, langues et applications différents. Afin d'exploiter des corpus d'un genre spécifique qui est riche en contexte mais limité en taille, la similarité sémantique est calculée sur base de la similarité complète des contextes des phrases. Le processus comprend trois étapes : segmentation sémantique, extraction des relations de similitude et regroupement sémantique. Plusieurs algorithmes pour l'extraction des collocations, l'évaluation de la similarité de contexte et le regroupement sont considérés. Bien que notre méthode provienne d'une perspective de la connaissance pauvre, on montre que l'intégration des outils linguistiques génériques est commode et bénéfique.


ABSTRACT
We address the problem of automatic extraction of semantic knowledge from text corpora focusing on portability across domains, languages and applications. In order to exploit rich-in-context but limited-in-size specific-domain corpora, semantic similarity is estimated on the basis of full sentence context similarity. The process consists of three stages: semantic tokenization, extraction of similarity relations and semantic clustering. Several algorithms for extraction of collocations, estimation of context similarity and clustering are considered. Although our method originates from a knowledge-poor perspective, integration of generic linguistic tools is proved to be both convenient and beneficial.


AUTEUR(S)
Aristomenis THANOPOULOS, Nikos FAKOTAKIS, George KOKKINAKIS

MOTS-CLÉS
extraction de connaissance sémantique, regroupements sémantiques, extraction de collocations.

KEYWORDS
Semantic knowledge extraction, semantic clustering, collocation extraction.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (1,7 Mo)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier