25 Punkte von GN⁺ 2025-06-21 | 2 Kommentare | Auf WhatsApp teilen
  • Open-Source-Grammatikprüfer. Ein Produkt, das als Ersatz für den bekannten kommerziellen Dienst Grammarly verwendet werden kann
  • Kann von allen kostenlos genutzt werden, und der Code sowie die Algorithmen sind transparent offengelegt
  • Bietet Funktionen zur automatischen Erkennung und Korrektur von Grammatik-, Stil- und Rechtschreibproblemen in englischen Texten
  • Geeignet für verschiedene Nutzergruppen wie Entwickler, Autoren und Studierende und bietet freie Möglichkeiten zur Anpassung
  • Da Self-Hosting auf dem eigenen Server und lokaler Betrieb möglich sind, bietet es Vorteile bei Privatsphäre und Datenschutz

Einführung in Harper

  • Harper ist ein Open-Source-Grammatik- und Stilprüfer mit ähnlichen Funktionen wie Grammarly
  • Wird vollständig kostenlos bereitgestellt, und jeder kann den Quellcode frei einsehen und nutzen
  • Implementiert Korrekturfunktionen für englische Texte wie Rechtschreibprüfung, Erkennung von Grammatikfehlern und Empfehlungen zur Stilverbesserung
  • Nutzer können Harper auf einem lokalen Server oder in der eigenen Infrastruktur installieren, um den Datenschutz zu stärken
  • Dank hoher Erweiterbarkeit und Anpassbarkeit lassen sich Algorithmen modifizieren und Funktionen erweitern leicht an individuelle Anforderungen anpassen

Hauptfunktionen und Vorteile

  • Als Open-Source-Projekt ermöglicht es die interne Verwaltung und Verbesserung von Ideen ohne Abhängigkeit von einem Dienstanbieter
  • Ist für Englisch optimiert, bietet aber auch Potenzial für eine künftige Erweiterung auf Mehrsprachenunterstützung
  • Die Community-Unterstützung ist aktiv, sodass Feedback und Funktionsverbesserungen laufend eingebracht werden
  • Bietet hohe Flexibilität durch serverbasierten Betrieb oder direkte Installation

Zielgruppen und Anwendungsbeispiele

  • Geeignet für Nutzer wie Softwareingenieure, technische Autoren und Studierende, die an einer Verbesserung der Qualität englischer Texte interessiert sind
  • Vorteilhaft für Organisationen, die einen eigenen Dokumentkorrekturprozess aufbauen möchten, ohne personenbezogene Daten externen Diensten preiszugeben
  • Effektiv in Umgebungen, die fortgeschrittene Anpassungen wie benutzerdefinierte Regeln oder die Integration in Workflows benötigen

2 Kommentare

 
GN⁺ 2025-06-21
Hacker-News-Kommentare
  • Bei den meisten Dokumenten kann Harper Vorschläge in unter 10 ms liefern; 10 l oder 10 kg akzeptiert man als vertraute Einheiten, aber warum wirkt 10 ms irgendwie abschreckend?

  • Dass Grammatikregeln in einem Open-Source-Programm fest einkodiert sind und man sie selbst anpassen kann, wird deutlich bevorzugt gegenüber Prompt-Tuning oder einem Ansatz, bei dem sie implizit in den Trainingsdaten eines LLM fest einkodiert sind. Die LSP-Konfiguration für Neovim sieht ziemlich gut aus Neovim-Integrationsdokumentation Solche Werkzeuge sind genau die Zukunft Es wird vorgeschlagen, dass Automattic so etwas auf der Homepage stärker hervorheben sollte

    • Es gibt auch die Ansicht, dass so ein Ansatz die natürliche Entwicklung von Sprache übersehen könnte
  • Persönlich wird gerade der Verzicht auf LLMs als großer Vorteil gesehen. Grammarly ist mit den hinzugefügten AI-Funktionen immer instabiler geworden und wirkt inkonsistent, etwa wenn vor einer Stunde noch empfohlen wurde, ein Komma zu entfernen, und kurz darauf wieder, es einzusetzen

    • Allgemeine LLM-basierte Modelle sind bei Interpunktion tatsächlich oft verwirrt; das wurde als klarer Nachteil erlebt, und es ist erstaunlich, dass ein Dienst wie Grammarly dieses Verhalten einfach bestehen lässt

    • In den letzten zwölf Monaten sind die Vorhersagen von Grammarly und gboard sehr schlecht geworden

    • Es kommt die Frage auf, ob es ähnliche Werkzeuge gibt, die auf LLMs basieren. LLMs sind nicht immer besser, aber ein Vergleich der Unterschiede zwischen beiden Ansätzen wäre interessant

    • Als scherzhafte Reaktion heißt es, die ständig wechselnden Vorschläge zur Interpunktion erinnerten an Englischlehrer

  • LanguageTool, ein Konkurrent von Grammarly, ist ebenfalls Open Source und kann lokal ausgeführt werden GitHub, Docker-Image Ich selbst lasse LanguageTool meist lokal in einem Docker-Container laufen Harper wurde zwar nicht im Detail genutzt, war aber schon länger bekannt, und es ist erfreulich, dass es verschiedene Optionen gibt Auf Harpers Website sollte klarer stehen, dass mindestens eines der Konkurrenztools ebenfalls lokal laufen kann

  • In dem Satz „Me and Jennifer went to have seen the ducks cousin.“ wird überhaupt kein Fehler erkannt. Daraus folgt der Hinweis, dass noch viel mehr Regeln ergänzt werden müssten, um das Niveau von Grammarly zu erreichen

    • Zunächst war es beeindruckend, aber nach mehreren Tests lautete das Fazit, dass selbst ziemlich grundlegende Fehler nicht erkannt werden und die Leistung stark schwankt

    • Ähnlich wird auch „My name John. What your name? What day today?“ nicht als grammatikalisch fehlerhaft markiert

    • Es wird infrage gestellt, was solche Testsätze eigentlich aussagen sollen

  • Die Meinung lautet, dass eine Website, auf der man vor dem Download oder der Installation einer Erweiterung eine Demo oder einen Test ausprobieren kann, wirklich nützlich wäre. Die Firefox-Erweiterung verlinkt auf diese Seite, aber beim Einfügen längerer Texte funktioniert die Hervorhebung nicht richtig

  • Es kommt die Frage auf, warum in Sprachlernwerkzeugen keine LLMs eingesetzt werden. Sprachprobleme könne man LLMs aus Sicht mancher Leute zu 100 % überlassen Es wird gefragt, ob jemand ChatGPT jemals englische Fehler machen gesehen hat

    • Grammarly macht mit den verstärkten AI-Funktionen auch merkwürdige Vorschläge, etwa indem „wasn't“ aufgetrennt und etwas wie „was trulyn't“ empfohlen wird zugehöriges Bild

    • Fehler von LLMs werden häufig genug beobachtet, und manchmal sind die Vorschläge sehr abwegig. Meist funktioniert es zwar sehr gut, aber niemals auf einem wirklich „vertrauenswürdigen“ Niveau, und oft neigt es sogar dazu, die Fehler der Nutzer einfach zu übernehmen

    • Es wird angemerkt, dass solche Sprachlernwerkzeuge im Kern oft dazu dienen, das „tatsächliche Lernen“ einer Sprache zu umgehen

  • Es wird hinterfragt, wer eigentlich der Zielmarkt von Grammarly ist. Vermutlich sind berufstätige Fachleute gemeint, die Englisch als Zweitsprache verwenden

    • Es wird vermutet, dass Menschen, die nichts von LLMs wissen, ebenfalls eine wichtige Zielgruppe sind
  • Es wird ein hervorragender LSP-Server vorgestellt, der sogar die Grammatikprüfung in Code-Kommentaren übernehmen kann LSP-Dokumentation

  • Da es ein Produkt von Automattic ist, gibt es Zurückhaltung bei der Nutzung aus Sorge, Matt könne es im Erfolgsfall aus Profitgründen ruinieren

    • Dagegen wird eingewandt, dass es Open Source (FOSS) ist und die Community im schlimmsten Fall die letzte gute Version forken und weiterentwickeln könnte

    • Wegen genau dieser Tatsache, also dass es ein Produkt von Automattic ist, wird eine klare Haltung geäußert, es nicht zu nutzen

 
secwind 2025-06-23

Aah, nicht 10l, sondern 10L!