-
Projektvorstellung
- Dieses Projekt ist ein Tool, das mit
llama-ocrundTogether AIOCRBilder in strukturiertes Markdown umwandelt. - Nutzer können Bilder hochladen, Text extrahieren und in das Markdown-Format konvertieren.
- Dieses Projekt ist ein Tool, das mit
-
Hauptfunktionen
- Bietet eine Funktion zum Hochladen von Bildern
- Extrahiert Text aus Bildern und wandelt ihn in Markdown um
- Stellt Beispielbilder bereit, mit denen Nutzer die Funktionen testen können
-
Codebeispiel
- Es wird ein Codebeispiel bereitgestellt, das mit der Bibliothek
llama-ocrText aus Bildern extrahiert. - Die Funktion
ocrerzeugt Markdown, indem ihr der Pfad zur Bilddatei und der API-Schlüssel übergeben werden.
- Es wird ein Codebeispiel bereitgestellt, das mit der Bibliothek
-
Bedeutung des Projekts
- Dieses Projekt verbessert die Effizienz bei der Dokumentarbeit, indem es das einfache Extrahieren von Text aus Bildern und dessen Umwandlung in Markdown ermöglicht.
- Im Vergleich zu bestehenden OCR-Tools bietet es eine besonders einfache Nutzung und eine Markdown-Konvertierungsfunktion.
1 Kommentare
Hacker-News-Kommentare
Der Autor von llama-ocr hat ein Tool entwickelt, das Bilder über eine einfache API in strukturiertes Markdown umwandelt. Künftig sind zusätzlich PDF-Parsing und JSON-Ausgabe geplant.
Zur Verarbeitung von Gebotsformularen einer Wohltätigkeitsauktion wurde llama3.2-vision verwendet; selbst bei schwer lesbarer Handschrift war es ziemlich genau.
Allgemeine OCR-Modelle eignen sich nicht gut zum Digitalisieren von Text in Familienfotos; Gemini Flash war am besten.
Es wird bezweifelt, ob dies für einen "Show HN"-Post geeignet ist, da der Bezug zum Namen Llama gering ist.
Ein mit einem genetischen Algorithmus erzeugter Satz wurde als echter Kreis gezeichnet, aber nicht als Text erkannt.
Es wurde eine mehrseitige PDF hochgeladen, woraufhin mitgeteilt wurde, dass dies nicht unterstützt wird.
Ein HN-Screenshot wurde hochgeladen, aber es wurde kein Markdown-Code ausgegeben.
Japanische OCR funktioniert über die ChatGPT API gut.
Auf einem Walmart-Kassenbon wurde die Zahl 9 fälschlich als 0 erkannt.