- Vollständig kostenlos und Open Source. Keine Abos / kostenpflichtigen Funktionen / versteckter Code
- Flexibel einsetzbar – von der hochwertigen Verarbeitung anspruchsvoller Vorlagen bis zur Massenerkennung von Volltext in Druckwerken
- Leistungsstarke Unterstützung für Layout- und Textannotation
- Mit dem LAREX-Editor lassen sich Layout- und Textelemente manuell annotieren, korrigieren oder vergleichen
- Vollständig kompatibel mit dem OCR-D-Ökosystem
- Auf Benutzerfreundlichkeit ausgelegt: Komplexe OCR-Workflows lassen sich über die UI erstellen, ohne Code oder CLI zu verwenden
- Einfache plattformübergreifende Entwicklung: Unabhängig vom Betriebssystem mit Docker und einem einzigen Befehl ausführbar
1 Kommentare
Hacker-News-Kommentare
Komplexe Segmentierungs-Pipelines waren vor einigen Jahren nötig, sind jetzt aber fehleranfällig und nehmen dem Modell wichtigen Kontext. Für den Übergang zu Handschrift wird Kontext benötigt
OCR4all ist Software zur Wiederherstellung und Erkennung digitaler Texte aus frühneuzeitlichen Druckwerken
OCR4all adressiert die Bedürfnisse nichttechnischer Nutzer klar und intuitiv
Apples Vision Framework bietet eine schnellere und genauere Bibliothek zur Texterkennung als Tesseract
Die Kombination von Tesseract und LLMs zur Korrektur von Fehlern und zur Verbesserung der Formatierung ist derzeit der Sweet Spot bei Geschwindigkeit/Effizienz/Genauigkeit
Es wurde eine KI-gestützte OCR-API entwickelt
Dieser Workflow dient der Digitalisierung historischer Druckdokumente
OCR4all bietet einen Workflow zur automatischen Texterkennung durch die Kombination verschiedener Open-Source-Lösungen
Es ist unklar, ob es sich um eine neue SOTA-OCR-Engine oder um ein Tool handelt, das andere bekannte Engines nutzt
Ich dachte, OCR sei mit Tesseract weitgehend gelöst, suche aber nach einer Bibliothek oder Implementierung für MRC-Kompression in Ergebnis-PDFs