Ich arbeite bei einem Medienübersetzungsunternehmen und wir bieten einen Untertitel-Editor an.
Im Editor gibt es eine Spellcheck-Funktion; dabei wird der gesamte Untertitel in Text umgewandelt und (in Stücke geschnitten) per API verarbeitet.
Derzeit verwenden wir die Bing-API, aber die Performance ist wirklich schlecht. Dinge, die erkannt werden sollten, werden übersehen, und Dinge, die nicht markiert werden sollten, werden markiert.
Folgende Alternativen habe ich ausprobiert:
- AWS Spellcheck hat ein Limit von 20 Zeichen pro Aufruf, daher ist es sehr schwer sinnvoll einzusetzen
- Grammarly hat die API-Unterstützung letztes Jahr eingestellt
- Ich habe https://sapling.ai/ getestet, aber die Qualität war sogar schlechter als bei Bing
- Ich habe auch alles unter https://rapidapi.com/collection/grammar-spellcheck-api getestet, aber es ist schwer zu sagen, dass irgendetwas dort wirklich besser als Bing war.
Es muss nicht unbedingt "mehrsprachig" sein; selbst wenn es nur für Englisch gut funktioniert, wäre das schon hilfreich. Aber gute Alternativen scheinen rar zu sein. Auch wenn es keine konkrete Produktempfehlung ist, würde ich mich freuen, wenn ihr eure Erfahrungen mit Spellcheck teilen könntet.
1 Kommentare
https://huggingface.co/mzbac/mistral-grammar/tree/main
Weil ich mich an dem Wort „mehrsprachig“ festgebissen hatte, habe ich nach etwas aus der Mistral-Reihe gesucht und bin dabei auf so etwas gestoßen. Ich bin mir allerdings nicht sicher, ob es den Anforderungen auf Produktniveau wirklich genügt...
Es sieht so aus, als wäre das Modell auf Englisch feinabgestimmt worden; vielleicht wäre es einen Versuch wert, dieses Modell einmal auszuprobieren.