jPDFText est une bibliothèque Java permettant d'extraire du texte à partir de documents PDF. Avec jPDFText, les documents PDF peuvent être traités pour extraire le contenu textuel à des fins d’archivage, de stockage, de recherche ou d’indexation. jPDFText est basé sur la technologie PDF propriétaire de Qoppas. Vous n'avez donc pas besoin d'installer de logiciel ou de pilote tiers. Comme il est écrit en Java, il permet à votre application de rester indépendante de la plate-forme et de fonctionner sous Windows, Linux, Unix (Solaris, HP UX, IBM AIX), Mac OS X et toute autre plate-forme prenant en charge l'environnement d'exécution Java.
Caractéristiques principales:
Chargez des documents PDF à partir de fichiers, de lecteurs réseau, d'URL ou de flux d'entrée.
Extrayez le texte dans l'ordre de lecture logique.
Extrait des mots en tant que vecteur de chaînes.
Fonctionne sous Windows, Linux, Unix et Mac OS X (100% Java).
Pas besoin d'installer ou de configurer des pilotes ou logiciels supplémentaires lors du déploiement.
Testé sur JDK 1.4.2 et supérieur.
Commentaires non trouvées