pdfminer3k est un port de pdfminer écrit en Python 3.
PDFMiner est un outil pour extraire des informations à partir de documents PDF. Contrairement à d'autres outils liés PDF, il se concentre entièrement sur l'obtention et l'analyse de données textuelles.
PDFMiner permet d'obtenir l'emplacement exact des textes dans une page, ainsi que d'autres informations telles que des polices ou des lignes. Il comprend un convertisseur de PDF qui peut transformer les fichiers PDF dans d'autres formats de texte (tel que HTML). Il dispose d'un analyseur PDF extensible qui peut être utilisé à d'autres fins au lieu de l'analyse de texte
Ce qui est nouveau dans cette version:.
- < li> Ajout pdfexplore, un outil pour déboguer des fichiers PDF en explorant leurs données.
- Ne essayez pas de zones de texte du groupe quand il ya un trop grand nombre (ce est trop long).
- références d'objets de soutien que les filtres dans les ruisseaux.
- Analyser chaque objet dès qu'un objectid ne peut être trouvé.
- Amélioration de la gestion des erreurs idiome STRICT base.
- Lorsque les tables de xréfs sont corrompus, analyser et cache:
- Correction d'un assertion fausse dans les présentations.
Tous
Quoi de neuf en version 1.2.4 objets comme une solution de repli.
Ce qui est nouveau dans la version 1.2.3:.
- Correction d'un crash sur les codes de CMAP inégales
- Correction d'un méta-accident causé par le mauvais PSParser repr.
Exigences :
- Python
Commentaires non trouvées