<p>- „Sandwich“-PDF: eine PDF-Datei, die nur aus Bildern besteht und per OCR verarbeitet wurde, sodass der Text unsichtbar hinter den Bildern jeder Seite eingefügt wird<br />
→ dadurch kann Text gesucht, markiert und kopiert werden<br />
- Kommandozeilen-Tool zum OCR-Scannen von Büchern oder Zeitschriften<br />
→ unterstützt auch mehrspaltigen Text <br />
- tesseract + unpaper + convert + ghostscript <br />
→ unterstützt alle von tesseract unterstützten Sprachen (einschließlich Koreanisch)<br />
- Linux/Mac. Unterstützt Parallelverarbeitung auf Multiprozessor-Systemen </p>
Noch keine Kommentare.