- Bietet Funktionen zur PDF-Konvertierung, Informationsextraktion und Formatierung der Ergebnisse nach einem vom Nutzer definierten Schema
- Konvertiert PDFs in Bilder, um eine detaillierte KI-Verarbeitung zu ermöglichen
- Nutzt die API von OpenAI, um Informationen zu extrahieren und zu strukturieren
- Extraktionsschemata für verschiedene Dokumentformate können vom Nutzer angepasst werden
- So konzipiert, dass es sich flexibel sowohl lokal als auch in Cloud-Umgebungen bereitstellen lässt
- Entwickelt auf Basis von Zerox
5 Kommentare
Jedenfalls ist es zwar Open Source, aber da sich derzeit alles nur um AI dreht, ist es einfach schade, dass kaum noch leichte und kostenlos nutzbare Tools herauskommen...
Dass hochmoderne KI-basierte Software auf das 40 Jahre alte Ghostscript angewiesen ist … irgendwie subtil ironisch, haha.
Man wandelt also Text in PDF um, PDF in Bilder und Bilder wieder in Text.
Das ist ein Service, der intern entwickelt wird ... und jetzt erscheint er also als Open Source, haha.
Arbeitet Ihr Unternehmen vielleicht bei HK?