- Open-Source-Grammatikprüfer. Ein Produkt, das als Ersatz für den bekannten kommerziellen Dienst Grammarly verwendet werden kann
- Kann von allen kostenlos genutzt werden, und der Code sowie die Algorithmen sind transparent offengelegt
- Bietet Funktionen zur automatischen Erkennung und Korrektur von Grammatik-, Stil- und Rechtschreibproblemen in englischen Texten
- Geeignet für verschiedene Nutzergruppen wie Entwickler, Autoren und Studierende und bietet freie Möglichkeiten zur Anpassung
- Da Self-Hosting auf dem eigenen Server und lokaler Betrieb möglich sind, bietet es Vorteile bei Privatsphäre und Datenschutz
Einführung in Harper
- Harper ist ein Open-Source-Grammatik- und Stilprüfer mit ähnlichen Funktionen wie Grammarly
- Wird vollständig kostenlos bereitgestellt, und jeder kann den Quellcode frei einsehen und nutzen
- Implementiert Korrekturfunktionen für englische Texte wie Rechtschreibprüfung, Erkennung von Grammatikfehlern und Empfehlungen zur Stilverbesserung
- Nutzer können Harper auf einem lokalen Server oder in der eigenen Infrastruktur installieren, um den Datenschutz zu stärken
- Dank hoher Erweiterbarkeit und Anpassbarkeit lassen sich Algorithmen modifizieren und Funktionen erweitern leicht an individuelle Anforderungen anpassen
Hauptfunktionen und Vorteile
- Als Open-Source-Projekt ermöglicht es die interne Verwaltung und Verbesserung von Ideen ohne Abhängigkeit von einem Dienstanbieter
- Ist für Englisch optimiert, bietet aber auch Potenzial für eine künftige Erweiterung auf Mehrsprachenunterstützung
- Die Community-Unterstützung ist aktiv, sodass Feedback und Funktionsverbesserungen laufend eingebracht werden
- Bietet hohe Flexibilität durch serverbasierten Betrieb oder direkte Installation
Zielgruppen und Anwendungsbeispiele
- Geeignet für Nutzer wie Softwareingenieure, technische Autoren und Studierende, die an einer Verbesserung der Qualität englischer Texte interessiert sind
- Vorteilhaft für Organisationen, die einen eigenen Dokumentkorrekturprozess aufbauen möchten, ohne personenbezogene Daten externen Diensten preiszugeben
- Effektiv in Umgebungen, die fortgeschrittene Anpassungen wie benutzerdefinierte Regeln oder die Integration in Workflows benötigen
2 Kommentare
Hacker-News-Kommentare
Bei den meisten Dokumenten kann Harper Vorschläge in unter 10 ms liefern; 10 l oder 10 kg akzeptiert man als vertraute Einheiten, aber warum wirkt 10 ms irgendwie abschreckend?
Dass Grammatikregeln in einem Open-Source-Programm fest einkodiert sind und man sie selbst anpassen kann, wird deutlich bevorzugt gegenüber Prompt-Tuning oder einem Ansatz, bei dem sie implizit in den Trainingsdaten eines LLM fest einkodiert sind. Die LSP-Konfiguration für Neovim sieht ziemlich gut aus Neovim-Integrationsdokumentation Solche Werkzeuge sind genau die Zukunft Es wird vorgeschlagen, dass Automattic so etwas auf der Homepage stärker hervorheben sollte
Persönlich wird gerade der Verzicht auf LLMs als großer Vorteil gesehen. Grammarly ist mit den hinzugefügten AI-Funktionen immer instabiler geworden und wirkt inkonsistent, etwa wenn vor einer Stunde noch empfohlen wurde, ein Komma zu entfernen, und kurz darauf wieder, es einzusetzen
Allgemeine LLM-basierte Modelle sind bei Interpunktion tatsächlich oft verwirrt; das wurde als klarer Nachteil erlebt, und es ist erstaunlich, dass ein Dienst wie Grammarly dieses Verhalten einfach bestehen lässt
In den letzten zwölf Monaten sind die Vorhersagen von Grammarly und gboard sehr schlecht geworden
Es kommt die Frage auf, ob es ähnliche Werkzeuge gibt, die auf LLMs basieren. LLMs sind nicht immer besser, aber ein Vergleich der Unterschiede zwischen beiden Ansätzen wäre interessant
Als scherzhafte Reaktion heißt es, die ständig wechselnden Vorschläge zur Interpunktion erinnerten an Englischlehrer
LanguageTool, ein Konkurrent von Grammarly, ist ebenfalls Open Source und kann lokal ausgeführt werden GitHub, Docker-Image Ich selbst lasse LanguageTool meist lokal in einem Docker-Container laufen Harper wurde zwar nicht im Detail genutzt, war aber schon länger bekannt, und es ist erfreulich, dass es verschiedene Optionen gibt Auf Harpers Website sollte klarer stehen, dass mindestens eines der Konkurrenztools ebenfalls lokal laufen kann
In dem Satz „Me and Jennifer went to have seen the ducks cousin.“ wird überhaupt kein Fehler erkannt. Daraus folgt der Hinweis, dass noch viel mehr Regeln ergänzt werden müssten, um das Niveau von Grammarly zu erreichen
Zunächst war es beeindruckend, aber nach mehreren Tests lautete das Fazit, dass selbst ziemlich grundlegende Fehler nicht erkannt werden und die Leistung stark schwankt
Ähnlich wird auch „My name John. What your name? What day today?“ nicht als grammatikalisch fehlerhaft markiert
Es wird infrage gestellt, was solche Testsätze eigentlich aussagen sollen
Die Meinung lautet, dass eine Website, auf der man vor dem Download oder der Installation einer Erweiterung eine Demo oder einen Test ausprobieren kann, wirklich nützlich wäre. Die Firefox-Erweiterung verlinkt auf diese Seite, aber beim Einfügen längerer Texte funktioniert die Hervorhebung nicht richtig
Es kommt die Frage auf, warum in Sprachlernwerkzeugen keine LLMs eingesetzt werden. Sprachprobleme könne man LLMs aus Sicht mancher Leute zu 100 % überlassen Es wird gefragt, ob jemand ChatGPT jemals englische Fehler machen gesehen hat
Grammarly macht mit den verstärkten AI-Funktionen auch merkwürdige Vorschläge, etwa indem „wasn't“ aufgetrennt und etwas wie „was trulyn't“ empfohlen wird zugehöriges Bild
Fehler von LLMs werden häufig genug beobachtet, und manchmal sind die Vorschläge sehr abwegig. Meist funktioniert es zwar sehr gut, aber niemals auf einem wirklich „vertrauenswürdigen“ Niveau, und oft neigt es sogar dazu, die Fehler der Nutzer einfach zu übernehmen
Es wird angemerkt, dass solche Sprachlernwerkzeuge im Kern oft dazu dienen, das „tatsächliche Lernen“ einer Sprache zu umgehen
Es wird hinterfragt, wer eigentlich der Zielmarkt von Grammarly ist. Vermutlich sind berufstätige Fachleute gemeint, die Englisch als Zweitsprache verwenden
Es wird ein hervorragender LSP-Server vorgestellt, der sogar die Grammatikprüfung in Code-Kommentaren übernehmen kann LSP-Dokumentation
Da es ein Produkt von Automattic ist, gibt es Zurückhaltung bei der Nutzung aus Sorge, Matt könne es im Erfolgsfall aus Profitgründen ruinieren
Dagegen wird eingewandt, dass es Open Source (FOSS) ist und die Community im schlimmsten Fall die letzte gute Version forken und weiterentwickeln könnte
Wegen genau dieser Tatsache, also dass es ein Produkt von Automattic ist, wird eine klare Haltung geäußert, es nicht zu nutzen
Aah, nicht 10l, sondern 10L!