KI-Übersetzer Dodari für Koreanisch↔Englisch
(github.com/vEduardovich)Uneingeschränkte KI-Übersetzung Koreanisch↔Englisch auf dem eigenen Computer ist möglich.
- Die Qualität ist besser als bei gewöhnlicher maschineller Übersetzung.
- Die Übersetzung von
txt- undepub-Dateien ist möglich. - Es werden zwei Dateien ausgegeben: eine Datei mit Übersetzung (Originaltext) und eine Datei nur mit der Übersetzung. Falls die Übersetzung merkwürdig ist, kann sie sofort mit dem Original verglichen werden.
- Die Nutzung ist sehr einfach. Man muss nur die zu übersetzenden Dateien per Drag-and-drop ziehen und anschließend auf die Schaltfläche zum Starten der Übersetzung klicken. Die Übersetzung zwischen Koreanisch und Englisch erfolgt dann automatisch in beide Richtungen.
- Ein Wechsel zu einem anderen KI-Modell ist möglich. Derzeit wird NHNDQ verwendet, das ein gutes Preis-Leistungs-Verhältnis bietet.
14 Kommentare
Hallo, ich habe während der Installation versehentlich
cmdgeschlossen. Seitdem läuft die Installation nicht mehr weiter, auch wenn ich den Ordner lösche und neu installiere,,, gibt es dafür eine Lösung?T_TNatürlich. Das müssen wir lösen.
Allerdings müssen wir zuerst den aktuellen Zustand verstehen und herausfinden, was genau nicht funktioniert.
https://github.com/vEduardovich/dodari/issues
Bitte klicken Sie im obigen Dodari-GitHub auf den Button
New issueund erstellen Sie ein neues Issue.Könnten Sie dann mit einem Screenshot oder einer etwas genaueren Beschreibung erläutern, was genau nicht funktioniert und in welcher Situation es auftritt?
Wir werden das auf jeden Fall lösen.
Wow, das ist beeindruckend.
Ich benutze zwar DeepL, aber ich werde es in Ruhe vergleichen und sorgfältig prüfen.
Vor allem möchte ich die Texte englischsprachiger Literatur bald einmal direkt vergleichen.
Der von Ihnen angesprochene Punkt ist aktuell auch für mich der größte Wermutstropfen.
Das Modell, das derzeit in Dodari verwendet wird, ist das NHNDQ-Modell, also ein auf Koreanisch spezialisiertes, feinabgestimmtes Modell auf Basis von
facebook-nllb, einem multilingualen Übersetzungsmodell für 200 Sprachen. Es ist zwar besser als Google Translate, fällt im Vergleich zu DeepL aber deutlich zurück.Auf der Suche nach einer Lösung habe ich verschiedene Modelle getestet und dabei das
yanolja-eeve-Modell ausprobiert, das als koreanisches Top-Tier-Modell gilt — und ich war wirklich überrascht, wie gut es war. Meinem Eindruck nach erreicht es etwa 80 bis 90 % von DeepL.Allerdings braucht man für dieses Modell mindestens 23 GB VRAM im Rechner des Nutzers. Außerdem ist die Übersetzungsgeschwindigkeit um ein Vielfaches langsamer, sodass man zur Beschleunigung die
vllm-Technologie einsetzen muss. Dadurch wird es zwar deutlich schneller, aber dann ist zwingend ein Linux-OS erforderlich. Im Endeffekt können also nur „Entwickler mit einer 4090 und einem Linux-OS“ das Yanolja-Modell überhaupt ausprobieren.Darüber zerbreche ich mir gerade den Kopf. Schade.
Braucht es noch mehr Erklärung?
Das übergeordnete Modell von NHNDQ ist
facebook-nllb, ein mehrsprachiges Übersetzungsmodell für 200 Sprachen.Deshalb produziert es gelegentlich solchen Kauderwelsch.
Da die Qualität der koreanischen Übersetzung noch etwas schwächelte, schien der Produktname nach dem Spitznamen
도더리des Protagonisten des Fregate-Falls gewählt worden zu sein; daher konnte ich den legendären Fehlgriff bei der Verwendung eines Übersetzers aus jenem Vorfall, „必要韓紙“, nicht unerwähnt lassen.Ob nötig? Eine so traurige Geschichte..
Es scheint wohl irgendeinen komplizierten Vorfall gegeben zu haben. Selbst wenn ich es lese, verstehe ich es nicht richtig schluchz
Den Namen "Dodari" habe ich in einem Gespräch mit dem Modell mixtral-7bx8 entwickelt.
Zuerst hat die AI den Namen "Sprachbrücke" empfohlen, aber ich wollte ein eindeutiges Bild, das sich leicht zeichnen lässt, und habe deshalb zum Spaß gefragt, wie "Dodari" wäre. Ich selbst fand es schließlich auch etwas abwegig.
Aber die AI antwortete, dass Dodari im Sinne von "eine Brücke, die hilft" sehr gut sei. Das war eine Interpretation, auf die ich nie gekommen wäre, und ich fand sie erfrischend. So ist der Name Dodari entstanden.
Das ist schon ein ziemlich alter Vorfall, war damals aber in koreanischen Internet-Communities durchaus bekannt.
Grob zusammengefasst lief es so ab.
Dodeorieines bestimmten Naver-Cafés veröffentlichte eine Ankündigung, dass eine limitierte japanische Musik-CD per Sammelbestellung für 70.000 Won gekauft werde.Dodeoriihn aus dem Café, woraufhin die Sache eskalierte.Dodeorials angeblichen Schriftwechsel mit einer japanischen Firma veröffentlichte, kamen absurde Übersetzungsfehler wie „必要韓紙“ ans Licht, wodurch der Fall auch außerhalb der Community bekannt wurde.Dodeoristark zu pathologischem Lügen neigte; die meisten seiner im Internet geschilderten angeblichen Erlebnisse waren von völlig überzogenem Imponiergehabe und Lügen durchzogen.Übrigens habe ich es auch schon gelegentlich erlebt, dass große Sprachmodelle unerwartete Interpretationen liefern, die dabei erstaunlich plausibel wirken.
Ich habe das Gefühl, dass man inzwischen auch im Gespräch mit Maschinen auf Aspekte gestoßen wird, auf die man allein in Gesprächen mit Menschen nicht gekommen wäre.
Meine Güte. Aber offenbar ist er nicht festgenommen worden.
Persönlich finde ich chatGPT etwas zu brav und deshalb nicht besonders spannend, aber Mixtral ist vielleicht gerade wegen der fehlenden Zensur im Gespräch ausgesprochen interessant.
Laut dem Wiki wurde er sogar angezeigt, kam aber glimpflich davon, nachdem er wohl klein beigegeben und um Nachsicht gebeten hatte. Zum Zeitpunkt der Anzeige leistete er angeblich seinen Ersatzdienst.
Ich selbst habe wegen der Leistung meines PCs noch kein lokales LLM direkt ausprobiert. Ich nutze bisher nur ungefähr auf dem Niveau von GPT-4 und überlege, ob ich Claude-3 zusätzlich abonnieren soll.
Von der Ausführung des Huggingface-Modells über den Aufbau einer
venvbis hin zur Implementierung eines Webservice war dies ein stimmiges Beispiel und sehr hilfreich. Vielen Dank fürs Teilen.Es freut mich sehr, dass es hilfreich sein konnte. Ich bin vielmehr Ihnen dankbar.