ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 44/2 - 2003  - pp.199-224
TITLE
Improving Dictionary Accessibility by Maximizing Use of Available Knowledge

RÉSUMÉ
La recherche de mots inconnus dans un dictionnaire est particulièrement difficile en japonais car elle demande de connaître la prononciation correcte de ces mots. Nous proposons un système qui supplée à une connaissance partielle de la prononciation des mots en permettant à des apprenants du japonais de rechercher des mots selon une estimation peut-être incorrecte de leur prononciation. Cela constitue un progrès notable par rapport aux systèmes existants qui ne proposent aucun traitement en cas de prononciation incorrecte. A cette fin nous calculons d'abord les prononciations possibles de chaque kanji (sinogramme), et les différents types d'alternance phonologique et d'erreur de prononciation qui peuvent se produire et nous leur associons une probabilité. Partant de ces probabilités et de fréquences calculées en corpus, nous calculons une mesure de plausibilité pour chaque prononciation générée pour une entrée de dictionnaire donnée, selon le modèle bayesien naïf. Une hypothèse de prononciation étant entrée par l'utilisateur, le système propose un choix d'entrées candidates trouvées dans le dictionnaire. Ce système est hébergé sur un site web et libre d'accès. Dans une évaluation effectuée sur les données du Japanese Proficiency Test (test de compétence linguistique d'apprenants du japonais) et sur des erreurs relevées en lecture naturelle, le système a réduit de façon significative le nombre de recherches infructueuses dans le dictionnaire dues à des prononciations incorrectes.


ABSTRACT
The dictionary lookup of unknown words is particularly difficult in Japanese due to the requirement of knowing the correct word reading. We propose a system which supplements partial knowledge of word readings by allowing learners of Japanese to look up words according to their expected, but not necessarily correct, reading. This is an improvement from previous systems which provide no handling of incorrect readings. In preprocessing, we calculate the possible readings each kanji character can take and different types of phonological alternations and reading errors that can occur, and associate a probability with each. Using these probabilities and corpus-based frequencies we calculate a plausibility measure for each generated reading given a dictionary entry, based on the naive Bayes model. In response to a user-entered reading, the system displays a list of candidate dictionary entries for the user to choose from. The system is implemented in a web-based environment and available for general use. In the evaluation on Japanese Proficiency Test data and naturally occurring misreading data, the system significantly reduced the number of unsuccessful dictionary queries when queried with incorrect readings.


AUTEUR(S)
Slaven BILAC, Timothy BALDWIN, Hozumi TANAKA

MOTS-CLÉS
apprentissage des langues, consultation de dictionnaires, japonais, kanji.

KEYWORDS
language learner, dictionary lookup, Japanese, kanji.

LANGUE DE L'ARTICLE
Anglais

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (343 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier