Bei englischen Meetings sind naturgemäß die Menschen im Vorteil, die sich im Englischen wohlfühlen. Gerade in Meetings ist das Timing beim Sprechen enorm wichtig: Selbst wenn ich im Kopf alles perfekt formuliert habe, gerate ich ins Stocken, wenn Englisch nicht meine Muttersprache ist, und verzichte am Ende oft ganz auf meinen Beitrag.
Da sich dieses Problem mit LLMs lösen lassen könnte, die besonders stark in der Sprachverarbeitung sind, habe ich begonnen, daraus ein Produkt zu bauen.
Dieses Produkt ist eine separate Desktop-Anwendung, die ein transparentes Fenster über Remote-Meeting-Tools wie Zoom, Google Meet oder Teams legen kann.
Es bietet die folgenden Kernfunktionen:
- In echten Meetings erkennt es sowohl das Gesagte der anderen als auch mein Mikrofonsignal, transkribiert die Aussagen der Gesprächspartner in Echtzeit und übersetzt sie schnell.
- Wenn es während eines Meetings so aussieht, als hätte mein Gegenüber mir eine Frage gestellt, erkennt es das automatisch und erzeugt eine passende Antwort zur Anzeige.
- Wenn mir während eines Meetings ein Satz oder ein Wort, das ich auf Englisch sagen möchte, nicht einfällt, kann ich es eintippen und in sehr hoher Geschwindigkeit eine passende englische Formulierung erhalten.
- Nach dem Meeting gibt es auf Basis des Gesprächsinhalts ausführliches Feedback und eine Analyse zu meinen eigenen Äußerungen und liefert einen Bericht, in dem alles in Formulierungen umgeschrieben ist, wie sie Muttersprachler tatsächlich verwenden würden.
Technisch habe ich mich vor allem darauf konzentriert, die Antworten so schnell wie möglich zu liefern. Denn selbst bei guter Qualität werden Informationen in einem hektisch verlaufenden Meeting schon nach nur 2 Sekunden bedeutungslos.
Die Leistung von LLMs ist bereits gut genug, um beim Englischen wirksam zu unterstützen, aber die Geschwindigkeit der Token-Generierung unterscheidet sich je nach Modell enorm, und ich habe sehr viel Zeit darauf verwendet, diese Balance zu finden. Ich habe Dutzende Foundation-Modelle getestet und optimiere aktuell, indem ich für jedes Ziel die passende Kombination von Foundation-Modellen finde.
Dadurch ist es gelungen, nicht nur für Übersetzungen, sondern auch für Formulierungsvorschläge durchgängig LLMs zu nutzen und trotzdem Ergebnisse in guter Qualität mit nahezu Echtzeit-Reaktionsgeschwindigkeit zu liefern.
Drei Monate lang habe ich mit 150 Alpha-Testern täglich per KakaoTalk und in 1:1-Video-Interviews gesprochen, das Produkt Woche für Woche schrittweise verbessert und es nun endlich offiziell gelauncht.
Ich habe GeekNews jahrelang nur still verfolgt und Benachrichtigungen über Slack erhalten, daher bin ich jetzt etwas nervös, selbst einen Beitrag zu schreiben. Wenn das Produkt Ihr Interesse geweckt hat, schauen Sie es sich gern unter dem Link unten an. Feedback in den Kommentaren wäre für mich eine große Hilfe und ich wäre sehr dankbar dafür.
Sie können es kostenlos und ohne Registrierung einer Kreditkarte ausprobieren.
https://trysmooth.ai
Noch keine Kommentare.