3 Punkte von hcmhcs0 2026-03-16 | 2 Kommentare | Auf WhatsApp teilen

Hallo, ich bin ein studentischer Entwickler!

In letzter Zeit interessiere ich mich für AI Agents und habe die auf OpenClaw veröffentlichten Systemanweisungen auseinandergenommen und studiert. Ich wollte verstehen, warum Agents deutlich bessere Ergebnisse liefern als simples Reasoning eines LLM und aus welchen Systemanweisungen und welcher Struktur sie bestehen. (Ich wollte einen AI Agent bauen, der zu meiner Situation passt und meine Produktivität steigert, haha.) Da in VS Code die Systemanweisungen im Code alle auf Englisch waren und auch die zugehörigen Dokumente komplett auf Englisch, musste ich ständig zwischen einem Übersetzer-Tab und dem Editor hin- und herwechseln, kopieren und einfügen, um sie zu lesen. Dadurch ging der Kontext immer wieder verloren, und ich konnte mich nicht konzentrieren. Bei Bildern oder PDFs, aus denen sich Text nicht kopieren lässt, war es noch frustrierender.

Dann kam mir beim Blick auf mein oft genutztes ScreenHint (eine App, die Captures auf dem Bildschirm fixiert) der Gedanke: „Mit genau dieser UX könnte man den erfassten Bereich doch direkt übersetzen.“ Als Student war es für mich außerdem belastend, bei jeder Übersetzung für eine API zu bezahlen, deshalb habe ich On-Device-Betrieb als Grundprinzip gewählt. Dank Claude Code konnte ich diese Idee schnell umsetzen, und so ist mein erstes Open-Source-Projekt entstanden.

ScreenTranslate — eine macOS-App, die nach einem Bildschirm-Capture sofort OCR → Übersetzung ausführt. Sie läuft in der Menüleiste und kann direkt per Tastenkürzel verwendet werden.

Es gibt im Wesentlichen zwei Funktionen:

  1. Bildschirm-Capture-Übersetzung — Tastenkürzel → Bereich ziehen → per OCR erkennen → Übersetzungs-Popup
  2. Textübersetzung — Text markieren → Tastenkürzel → direkt übersetzen (ohne OCR)

Sie ist kostenlos und Open Source (GPL v3). Da sie On-Device arbeitet, werden keinerlei Übersetzungsdaten an einen Server gesendet.

Besonderheiten:

  • Basiert auf Apple Vision OCR + Apple Translation, funktioniert ohne Internet
  • Gefühlt deutlich schneller als die Standard-App von DeepL. Vom Capture bis zum Übersetzungs-Popup etwa 1 Sekunde
  • Wenn eine Cloud-Engine benötigt wird, können DeepL, Google Cloud und Azure per BYOK (API-Schlüssel selbst eingeben) genutzt werden
  • Speicherung des Übersetzungsverlaufs, automatisches Kopieren in die Zwischenablage
  • Unterstützung für 20 Sprachen

Technischer Stack:

  • macOS 15+ / Swift 6 / SwiftUI / SwiftData
  • Interner Ablauf: Vision(VNRecognizeTextRequest) → Zeilenumbruch-Vorverarbeitung → Translation oder API → Popup
  • Keine externen Abhängigkeiten. Es werden nur native Apple-Frameworks verwendet (Anforderung: macOS 15+ – sowohl Apple Silicon als auch Intel werden unterstützt)

GitHub: https://github.com/hcmhcs/screenTranslate
Demo-Video: https://www.youtube.com/watch?v=ItYNAyue7eo
Download: DMG über GitHub Releases oder direkt selbst bauen (siehe README.md)

Anfangs habe ich das nur leichtgewichtig für mich selbst gebaut, deshalb ist es mir ein bisschen peinlich, aber ich finde, es ist insgesamt ziemlich gut geworden. Deshalb habe ich es auch zum ersten Mal auf Product Hunt veröffentlicht, nehme echte Nutzer auf, sammle Feedback und aktualisiere das Projekt laufend.
Da es mein erstes Solo-Open-Source-Projekt ist, gibt es sicher noch viele Schwächen. Ich würde mich sehr über Feedback oder PRs freuen :)

2 Kommentare

 
guarder 2026-03-24

Ich nutze es sehr gern!

 
hcmhcs0 2026-03-24

Vielen Dank für den netten Kommentar! Ich optimiere die Benutzerfreundlichkeit in letzter Zeit ohnehin laufend und es motiviert mich wirklich sehr zu hören, dass Sie die App gut nutzen. :) Wenn Ihnen beim Verwenden irgendetwas Unbequemes oder Störendes auffällt, sagen Sie jederzeit gern Bescheid :)