5 Punkte von GN⁺ 2024-01-04 | 1 Kommentare | Auf WhatsApp teilen
  • Antwort auf die Frage eines Lesers, wie man auf dem Mac kostenlos OCR mit CLI oder Python ausführen kann.
  • Es wird gezeigt, wie man auf dem Mac über Terminal, CLI und Python kostenlos einen lokalen OCR-"Service" einrichtet.
  • Die App Kurzbefehle öffnen, einen neuen Kurzbefehl erstellen und dann die Aktion "Text aus Bild extrahieren" hineinziehen, um Text aus Bildern zu extrahieren.
  • "Kurzbefehlseingabe" auswählen und die Aktion "In Zwischenablage kopieren" unter der Aktion "Text extrahieren aus ..." platzieren.
  • Dem Kurzbefehl einen Namen geben und im Terminal mit dem Befehl shortcuts run ocr-text -i <Bildpfad> OCR ausführen.
  • In Python wird OCR mit dem Modul subprocess ausgeführt und das Ergebnis ausgegeben.

Meinung von GN⁺

  • Der Beitrag enthält nützliche Informationen für Mac-Nutzer, da er zeigt, wie sich OCR-Funktionen kostenlos einsetzen lassen und so die Effizienz bei der Dokumentarbeit steigern können.
  • Durch die einfache Einrichtung mit der App Kurzbefehle lässt sich Text in Bildern extrahieren, sodass auch Nutzer ohne Programmierkenntnisse leicht darauf zugreifen können.
  • Durch die Beschreibung, wie sich ein automatisierter Prozess mit Python umsetzen lässt, ist der Inhalt auch für Entwickler attraktiv.

1 Kommentare

 
GN⁺ 2024-01-04
Hacker-News-Kommentare
  • Beeindruckende Erfahrungen mit Apples Vision-Framework

    • Der Verfasser des Originalposts (OP) nutzte Apples Vision-Framework in einem privaten Projekt, bei dem Zehntausende Screenshots von Tabellen per OCR verarbeitet und in eine Postgres-Datenbank importiert wurden.
    • Da macOS und Nvidia nicht kompatibel waren, wurden andere CPU-basierte OCR-Methoden ausprobiert, doch Werkzeuge wie Tesseract lieferten oft fehlerhafte Ergebnisse.
    • Das Vision-Framework bot die qualitativ besten Ergebnisse, die er je gesehen hatte, und benötigte dabei die geringsten Rechenressourcen.
    • Es gab Probleme mit der Stabilität des Frameworks, allerdings könnte dies auch auf Fehler in der eigenen Implementierung zurückzuführen sein.
    • Verwendet wurde eine Kombination aus RHetTbulls vision.py und ocrmac, und mit der Performance auf einem Hackintosh mit i7 6700k war er zufrieden.
    • Er ist zwar kein Programmierer, kann Probleme mit genügend Zeit aber lösen, auch wenn es sehr zeitaufwendig ist.
  • Ähnliche Erfahrungen unter Windows und das OCR-Tool von Microsoft PowerToys

    • Ein anderer Nutzer versuchte unter Windows eine ähnliche Aufgabe und stellte fest, dass PowerToys, ein bereits installiertes Microsoft-Projekt, ein sehr gutes OCR-Tool enthält.
    • Mit Win+Shift+T kann man einen zu scannenden Bereich auswählen, woraufhin der Text in die Zwischenablage kopiert wird.
  • Kostenlos verfügbares Open-Source-OCR-Tool

    • Ein Nutzer entwickelte ein kostenloses Open-Source-OCR-Tool, das sowohl CLI als auch UI bietet.
  • Automatische OCR-Funktion in Mac-Anwendungen

    • Ein Nutzer stellte fest, dass viele Mac-Anwendungen wie Safari, Preview und Notes Bilder automatisch per OCR verarbeiten, sodass sich Text im Bild leicht auswählen und an anderer Stelle kopieren und einfügen lässt.
  • Lob für ein kleines OCR-Tool für den Mac

    • Ein Nutzer ist ein großer Fan eines kleinen OCR-Tools, das er per brew auf seinem MacBook installiert hat.
  • Empfohlenes OCR-Tool für Windows: Text Extractor in PowerToys

    • Ein Kommentar empfiehlt Windows-Nutzern den Text Extractor von PowerToys.
  • Integrierte OCR-Funktion in macOS Ventura

    • Ab macOS Ventura ist eine standardmäßige OCR-Funktion in die UI für die Bilderfassung integriert; beim Scannen als PDF mit einem AirPrint-kompatiblen Scanner erscheint auf der rechten Seite ein OCR-Kontrollkästchen.
  • Lösung zur Textextraktion mit PyXA

    • PyXA bietet eine Lösung, die das Vision-Framework verwendet, um Text aus einem oder mehreren Bildern gleichzeitig zu extrahieren.
    • Da dies nur ein Teil des Pakets ist, könnte es für einmalige Aufgaben überdimensioniert sein, wurde aber als Option genannt.
  • Raycasts Funktion zum Suchen und Kopieren von Text in Bildern

    • Raycast ist nur für macOS verfügbar und bietet die Möglichkeit, Text in Bildern zu durchsuchen und zu kopieren.
    • Ein Link zu einem offiziellen Demo-Video wurde bereitgestellt.
  • Frage nach ähnlicher Technik zur Apple-Vision-Funktion „Copy Subject“

    • Ein Nutzer ist stark auf Apples „Copy Subject“-Funktion angewiesen, empfindet deren Zugänglichkeit aber als sehr eingeschränkt und fragt nach ähnlicher Technik.