Entwicklung eines Workflows zur Übersetzung offizieller Dokumentationen – Übersetzung und Suche in den offiziellen Dokumentationen von Spring & MySQL

(devrunner.dev)

4 Punkte von dankim0124 2026-01-25 | 2 Kommentare | Auf WhatsApp teilen

Einführung

Hallo.

Ich habe diesmal einen Workflow erstellt, um eine Reihe offizieller Dokumentationen zu übersetzen, und die Übersetzungsergebnisse von Mysql und Spring boot in einer durchsuchbaren Form veröffentlicht.

Vor und nach Vorstellungsgesprächen überfliege ich häufig die offizielle Dokumentation, und ich hoffe, dass das auch für andere nützlich ist, die sie zu einem ähnlichen Zweck verwenden möchten.

Die eigentlichen Prompts, Service-Links sowie den OpenAI-Blogbeitrag, auf den ich mich bei der Verwendung von 5.1 diesmal bezogen habe, habe ich unten in der Linksammlung zusammengestellt.

Mein Eindruck von der LLM-Inferenzleistung seit GPT-5.1

Ich halte hier die wahrgenommenen Leistungsunterschiede fest, die ich seit den Zeiten von GPT-3.5 beim Versuch der Übersetzungsautomatisierung erlebt habe.

Mit GPT-3.5 kam es selbst bei relativ kurzen Texten von etwa 5.000 bis 10.000 Zeichen häufig vor, dass schon kleine Aufgaben wie die Korrektur des Markdown-Formats nicht in guter Qualität ausgeführt wurden.

Dagegen konnte GPT-5.1 die folgenden Aufgaben vergleichsweise stabil ausführen.

Aus HTML mit mehr als 100.000 Zeichen stabil über 1.000 TOC-Informationen (6 Spalten) extrahieren, wobei die Reihenfolge erhalten bleibt
Die Entscheidung darüber, welche Begriffe auf Englisch bleiben und welche übersetzt werden sollen, dem LLM überlassen, und trotzdem wird ein gut lesbares Dokument zurückgegeben (z. B. bleibt in der Spring-Dokumentation bean auf Englisch, während factory übersetzt wird)

Wenn während der Arbeit etwas fehlschlug oder ergänzt werden musste, habe ich darauf reagiert, indem ich dem System-Prompt Regeln hinzugefügt habe. Dass die Ergebnisqualität selbst dann nicht stark schwankte, wenn der System-Prompt länger wurde, war etwas, das man von früheren Modellen kaum erwarten konnte.

Linksammlung

Unten habe ich Referenzmaterialien zu dieser Arbeit zusammengestellt.

Ich teile sie, weil sie als Referenz zeigen können, dass selbst bei so schweren Prompt-Anfragen Ergebnisse auf aktuellem Service-Niveau möglich sind.

(Ich glaube nicht unbedingt, dass der Prompt selbst besonders gut geschrieben ist, haha. Solche Prompt-Tipps gibt es reichlich in den Blogs von Anthropic und OpenAI, deshalb füge ich hier ein repräsentatives Beispiel bei.)

2 Kommentare

ng0301 2026-01-26

Ich glaube, die Anzahl der Dokumente in den Suchergebnissen ist immer 0.

dankim0124 2026-01-26

Oh! Vielen Dank für den Hinweis.
Bei mir wird es aktuell in Ordnung angezeigt. Zur Sicherheit habe ich die Auslieferung aber noch einmal geprüft.

Damit ich es trotzdem nachvollziehen kann, wäre ich dankbar, wenn Sie mir mitteilen könnten, welchen Suchbegriff Sie verwendet haben.
Im Moment gibt es hier nämlich kein Synonymwörterbuch für koreanische <-> englische Ausdrücke, daher könnte es sein, dass es wegen fehlender exakter Übereinstimmung nicht angezeigt wurde.