Reconnaissance optique de caractères (OCR) est la traduction des bitmaps numérisés optiquement de caractères de texte imprimés ou écrits en codes de caractères, tels que ASCII. Ce est un moyen efficace de transformer des matériaux papier en fichiers de données qui peuvent être modifiés et autrement manipulés sur un ordinateur. Ce est la technologie utilisée depuis longtemps par les bibliothèques et les organismes gouvernementaux à faire de longs documents rapidement disponibles électroniquement. Les progrès de la technologie OCR ont stimulé son utilisation croissante par les entreprises. Pour de nombreuses tâches document entrée, OCR est le plus rentable et rapide méthode disponible. Et chaque année, la technologie libère acres d'espace de stockage, une fois consacrées à des classeurs et des boîtes pleines de documents papier. Avant OCR peut être utilisé, le matériel source doit être numérisé en utilisant un scanner optique (et parfois une carte de circuit spécialisé dans le PC) pour lire dans la page sous forme de bitmap (un motif de points). Logiciel de reconnaître les images est également nécessaire.
Notre logiciel se propose de résoudre la classification de chiffres et de caractères des personnages UJI Pen Set de données en utilisant les réseaux de neurones isolés manuscrites. Les données se compose d'échantillons de 26 caractères et 10 chiffres écrits par 11 auteurs sur une tablette PC. Les caractères (au format standard) UNIPEN sont écrits à la fois en majuscules et minuscules et il ya un ensemble de deux jeux de caractères par l'écrivain. Ainsi, la sortie doit être dans l'une des 35 classes. L'objectif ultime est de construire un modèle indépendant de l'écrivain pour chaque caractère.
La sélection des caractéristiques intéressantes est crucial dans la reconnaissance de caractères, donc une nouvelle et significative ensemble de fonctionnalités, l'uniforme différentiel normalisé Coordonnées (UDNC), introduit par C. Agell, est adopté. Ces caractéristiques sont présentés pour améliorer le taux de reconnaissance en utilisant des algorithmes de classification simples de sorte qu'ils sont utilisés pour former un réseau de neurones et de tester ses performances sur UJI Pen Personnages ensemble de données.
Index Conditions:. Matlab, source, code, OCR, la reconnaissance optique de caractères, le texte numérisé, texte écrit, ascii, caractère isolé
Exigences :
Matlab
Commentaires non trouvées