6 Punkte von xguru 2020-03-04 | 1 Kommentare | Auf WhatsApp teilen
  • Eine schnelle Open-Source-Bibliothek auf Basis von XPDF, in C geschrieben

  • Bietet ausführbare Dateien für Windows/Mac/Linux

  • Extrahiert Texte innerhalb von PDFs einschließlich Schriftarten mit x,y-Koordinaten

1 Kommentare

 
xguru 2020-03-04

Es gibt bereits eine JavaScript-Version von pdf2json, die pdf.js verwendet, aber dieses hier nutzt XPDF.

https://github.com/mozilla/pdf.js/

https://github.com/modesty/pdf2json

Für allgemeine PDF-Funktionen kann man Apache PDFBox verwenden.

https://pdfbox.apache.org/

PDFBox ist eine Java-Bibliothek und kann PDFs erstellen, Inhalte extrahieren, Dateien aufteilen und zusammenführen sowie in Bilder umwandeln.