17 Punkte von xguru 2021-11-09 | 2 Kommentare | Auf WhatsApp teilen
<p>- Aus gewöhnlichen PDFs durchsuchbare PDF/A-Dateien erstellen<br /> - OCR-erkannten Text unter dem Bild einfügen und so Copy/Paste unterstützen <br /> - Die Auflösung bereits eingebetteter Bilder bleibt unverändert erhalten<br /> - OCR-Informationen einfügen, ohne die Datei zu beschädigen <br /> - PDF-Bilder optimieren, um die Dateigröße zu reduzieren <br /> - Verteilte Verarbeitung unter Nutzung aller CPU-Kerne <br /> - Mit Tesseract OCR werden unverändert mehr als 100 Sprachen unterstützt (einschließlich Koreanisch)<br /> - Skaliert gut und verarbeitet auch Dateien mit Tausenden von Seiten <br /> - Mit mehreren Millionen Dateien getestet <br /> - Linux/Mac/Windows (WSL)</p>

2 Kommentare

 
alstjr7375 2021-11-09
<p>Großartig.</p>
 
xguru 2021-11-09
<p>Es soll deutlich mehr Funktionen bieten als pdfsandwich, das vor ein paar Tagen vorgestellt wurde.<br /> - pdfsandwich - Tool zum Erstellen von PDF-Dateien mit einer Sandwich-Struktur aus Bild und OCR: https://de.news.hada.io/topic?id=5334<br /> </p>