ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 43/1 - 2002  - pp.151-161
TITRE
Structurer des termes et des informations en langue générale pour décrire des documents audiovisuels

RÉSUMÉ
L'INA (Institut national de l'audiovisuel) a pour mission d'archiver des émissions télévisées. Pour ce faire, le processus d'indexation, manuel, comprend une analyse et une reformulation linguistique de l'émission. Or, les archives sont aujourd'hui réindexées thématiquement, tâche coûteuse. Comme le passage au numérique permet l'intégration de métadonnées alignées sur le document lui-même, nous faisons l'hypothèse de construire des métadonnées à partir de documents textuels existants ­ liés au document audiovisuel (scénarios, transcriptions, articles de presse...). Nous en avons sélectionné dans les domaines politique et sportif. Ils sont proches de la langue générale : quelles sont les (im)possibilités de structurer ce type de langue ? Nous proposons une chaîne de traitements fondée sur une ontologie pivot, selon une approche à la fois ascendante (globale) et descendante (locale).


ABSTRACT
The INA (the National Broadcasting Institute) archives the programs broadcast by public channels. The manual indexing process requires an analysis and a linguistic reformulation of the program. Now, archives are being reindexed into themes, a high-cost task. As digitalisation allows to add metadata in the audiovisual document itself, we propose to build metada from existing textual documents linked to the audiovisual document (scenarii, sound-track transcription, articles...). We selected some of these texts from the political and sports fields. They are close to general language, hence our question : what are the possibilities to structurate this type of language ? Here is presented a plateform based on an ontology, in an approach combining global and local techniques.


AUTEUR(S)
Estelle LE ROUX, Karine LESPINASSE

MOTS-CLÉS
sémantique distributionnelle, acquisition de syntagmes nominaux, extraction d'information, ontologie du domaine, indexation, document audiovisuel.

KEYWORDS
distributional semantics, noun phrase acquisition, information extraction, domain ontology, indexing, audiovisual document.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (224 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier