ACCUEIL

Consignes aux
auteurs et coordonnateurs
Nos règles d'éthique
Autres revues >>

Traitement Automatique des Langues

1248-9433
Changement d'éditeur au 1er janvier 2007
 

 ARTICLE VOL 44/1 - 2003  - pp.63-92
TITRE
Modèles n-grammes et n-classes pour la reconnaissance de l'écriture manuscrite en ligne

RÉSUMÉ
Dans ce travail, nous étudions l'apport d'un modèle de langage pour améliorer les performances des systèmes de reconnaissance de l'écriture manuscrite en ligne. Pour cela, nous avons exploré des modèles basés sur des approches statistiques construits par apprentissage sur des corpus écrits. Deux types de modèles ont été étudiés : les modèles n-grammes et ceux de type n-classes. Dans ce dernier cas, les classes résultent soit de critères syntaxiques, soit de critères contextuels. En vue de l'intégration dans un système de faible capacité (engin nomade), un modèle n-classe combinant ces deux critères a été défini, il a permis d'obtenir des résultats surpassant ceux obtenus avec un modèle beaucoup plus lourd de type n-gramme. Les résultats présentés ici montrent qu'il est possible de prendre en compte les spécificités d'un langage en vue de reconnaître l'écriture manuscrite avec des modèles de taille tout à fait raisonnable.


ABSTRACT
This works highlights the interest of a language model in increasing the performances of on-line handwriting recognition systems. Models based on statistical approaches, trained on written corpora, have been investigated. Two kinds of models have been studied: n-gram models and n-class models. In the latter case, these classes result either from syntactic criteria or from contextual criteria. In order to integrate it into small capacity systems (mobile device), a n-class model has been designed by combining these criteria. It outperforms bulkier models based on ngram. The results we obtain show that it is possible to take advantage of language specificities to recognize handwritten sentences by using reasonable size models.


AUTEUR(S)
Freddy PERRAUD, Emmanuel MORIN, Christian VIARD-GAUDIN, Pierre-Michel LALLICAN

MOTS-CLÉS
reconnaissance de l'écriture manuscrite, modèle de langage, n-gramme, n-classe, perplexité.

KEYWORDS
handwriting recognition, language modelling, n-gram, n-class, perplexity.

LANGUE DE L'ARTICLE
Français

 PRIX
• Abonné (hors accès direct) : 34.95 €
• Non abonné : 34.95 €
|
|
--> Tous les articles sont dans un format PDF protégé par tatouage 
   
ACCÉDER A L'ARTICLE COMPLET  (361 Ko)



Mot de passe oublié ?

ABONNEZ-VOUS !

CONTACTS
Comité de
rédaction
Conditions
générales de vente

 English version >> 
made by WAW Lavoisier