Vergleich ostasiatischer Fachbegriffe der Informatik
(cjk-compsci-terms.netlify.app)Hallo. Seit ich mir einen Account bei GeekNews erstellt habe, habe ich bisher einfach nur gern mitgelesen. Da heute der Tag des koreanischen Alphabets ist, fiel mir die Tabelle „Vergleich ostasiatischer Fachbegriffe der Informatik“ wieder ein, die ich Anfang dieses Jahres erstellt hatte, und ich teile sie nun als Show GN.
Wie in jedem Fachgebiet gibt es auch hier eine gewisse Tendenz, aber in letzter Zeit werden Informatikbegriffe der Bequemlichkeit halber oft nicht mehr mit den schon lange etablierten Übersetzungen verwendet, sondern direkt als englische Fremdwörter übernommen. Zum Beispiel sagt und schreibt man heute oft sogar bei „Wert“ einfach „value“.
Wie auch immer: Auch im Koreanischen gibt es bereits seit Jahrzehnten viele gute etablierte Übersetzungen für Informatikbegriffe. Als ich herausfand, dass viele davon mit Japan oder Taiwan, die demselben chinesischen Schriftkulturkreis angehören, geteilt werden, habe ich aus Spaß diese Vergleichstabelle erstellt. Zum Gedenken an den Tag des koreanischen Alphabets würde ich mich freuen, wenn ihr einmal einen Blick darauf werft.
Der Quellcode liegt unter < https://github.com/dahlia/cjk-compsci-terms >. Die einzelnen Begriffe sind im Verzeichnis tables/ nach Kategorien in YAML-Dateien geordnet, daher sind auch PRs willkommen, die Begriffe ergänzen oder Fehler korrigieren.
Vielen Dank fürs Lesen!
12 Kommentare
Ich habe eine Frage.
Beim Blick auf die chinesischen und japanischen Schreibweisen in YAML habe ich festgestellt, dass für die chinesischen Schriftzeichen die in Korea verwendeten Hanja-Schreibungen verwendet wurden und darunter unter
termdie traditionellen, vereinfachten und japanischen Kurzformen aufgeführt sind.Mich würde interessieren, mit welcher Absicht das so entwickelt wurde.
Zum Beispiel bei Source Code:
Für Festlandchina (
zh-CN) wird angegeben, dass die koreanischen Hanja-Schreibungen „源代碼“ und „源程序“ verwendet werden.Wenn man sich jedoch ansieht, dass unter
termdie vereinfachten Schreibweisen korrekt eingetragen sind, wirkt das nicht besonders konsistent.Zur Referenz: Für Source Code
werden auf dem chinesischen Festland hauptsächlich 源代码, 源码 und 源程序 verwendet.
In Taiwan werden 原始碼 und 原始程式碼 verwendet.
Und in Hongkong werden meines Wissens 原始碼 und 源碼 verwendet.
Außerdem zum Fall von Computer:
Auf dem chinesischen Festland ist offiziell „电子计算机“ gebräuchlich, und in vielen Büchern und Dokumenten wird für Computer die Bezeichnung „计算机“ verwendet,
aber unter dem Einfluss Taiwans und Hongkongs verwenden viele Menschen gemischt auch „电脑“.
Referenz 1: https://zh.wikipedia.org/wiki/…
Referenz 2: 电脑吧 https://tieba.baidu.com/f?kw=%B5%E7%C4%D4&fr=ala0&tpl=5
JD.com CPU-Bereich: https://pcdiy.jd.com/
JD.com Notebook-Bereich: https://list.jd.com/list.html?cat=670,671,672
Daher scheint es in diesem Punkt vieles zu geben, das überprüft werden muss, etwa ob man sich in erster Linie an offiziellen Schreibweisen der Behörden orientieren will.
Da die im chinesischsprachigen Raum verwendeten Bezeichnungen sehr unterschiedlich sind und auch die Häufigkeit je nach Nutzer variiert, dürfte es viele Aspekte geben, die berücksichtigt werden müssen.
Vielen Dank für Ihren wertvollen Kommentar.
Wenn Sie sich zunächst die zuerst im Web veröffentlichte Seite ansehen, werden Sie feststellen können, dass es unter den Begriffen des Festlandchinesischen keine Einträge gibt, die nicht in vereinfachten Zeichen, sondern in koreanischer Hanja-Schreibweise angezeigt werden. Da im YAML-Datensatz nur das Feld
termtatsächlich auf dem Bildschirm angezeigt wird, habe ich, wie Sie gesagt haben, nur beitermdie in der jeweiligen Region verwendete Schreibweise verwendet (mit der Ausnahme, dass Koreanisch statt in Hangul in koreanischen Hanja angegeben ist).Was dann die weiter oben stehenden Zeichenfolgen in der Schriftform des Kangxi Dictionary sind: Das sind schlicht willkürliche Gruppenkennungen, um in den Daten kognate Wörter zwischen verschiedenen Sprachen (oder Dialekten) zusammenzufassen. Weil sie willkürlich sind, müssen es nicht unbedingt Han-Zeichen sein; man könnte ebenso einfach Zahlen oder Hashes verwenden. Dennoch müssen zum Beispiel das japanische „科学“ und das taiwanische Chinesisch „科學“ als ein Kognat verbunden und angezeigt werden, also müssen sie dieselbe Gruppenkennung teilen. Ähnlich müssen auch das koreanische „keompyuteo“ und das japanische „コンピュータ“ mit derselben Gruppenkennung zusammengefasst werden.
Man könnte die Kennung natürlich auch als beliebige bedeutungslose Zeichenfolge wie „foobar“ festlegen, aber ich dachte, es wäre der Verwaltung halber praktischer, wenn ihr Inhalt erkennbar ist und sie nach einer einheitlichen Regel vergeben wird. Deshalb war die naheliegendste Regel, Wörter englischen Ursprungs in lateinischer Schrift und sino-koreanische bzw. sino-xenische Wörter in Han-Zeichen zu notieren. Da es jedoch auch für die Han-Zeichen-Schreibung verschiedene Möglichkeiten gibt, mussten verschiedene Kurzformen und Varianten normalisiert werden (da es sich um eine Gruppenkennung handelt, muss man sie ja zu einer Form zusammenführen), und in diesem Prozess fielen Chinas vereinfachte Zeichen und Japans Shinjitai natürlich als Kandidaten heraus. Der Grund ist, dass dort recht häufig unterschiedliche Zeichen zusammengelegt wurden, nur weil die Aussprache nach regionalem Maßstab gleich ist, weshalb sie für eine Normalisierung ungeeignet sind (Verlust von Klassifikationsinformation). Damit blieb letztlich nur eine Auswahl wie Hongkongs traditionelle Zeichen, Taiwans Standard-Langzeichen oder koreanische Hanja, und ich habe die Schriftform des Kangxi Dictionary als Maßstab gewählt, weil man sagen kann, dass sie keine Implikation einer Verbindung zu irgendeiner heute existierenden politischen Standardorthographie hat.
Das oben Gesagte ist bereits in der Datei
CONTRIBUTING.mdim Repository beschrieben. Dort stehen auch noch weitere Punkte, daher lohnt sich ein Blick darauf vielleicht ebenfalls.Breit zu erfassen, welches von mehreren Wörtern derselben Bedeutung von einer Sprachgemeinschaft am häufigsten verwendet wird, also die Verteilung des Wortschatzes, ist für eine einzelne Privatperson, die keine spezialisierte Forscherin oder kein spezialisierter Forscher ist, wegen des dafür nötigen Aufwands an Kosten und Zeit kaum zu leisten. Falls es Vorarbeiten gibt, die die Verteilung des Terminologiegebrauchs unter Menschen untersucht haben, die in der Informatikforschung tätig sind oder Software entwickeln, würde ich sie ebenfalls sehr gern aktiv nutzen. Wenn es so etwas aber nicht wirklich gibt, bin ich auf die Hilfe mehrerer Mitwirkender angewiesen, insbesondere auf Vorschläge von Muttersprachlerinnen und Muttersprachlern der jeweiligen Sprachen. Natürlich blieb mir bisher, da ich allein recherchiert habe, kaum etwas anderes übrig, als mich vor allem auf die chinesische Wikipedia oder Baidu Baike zu stützen.
Was die von Ihnen angesprochenen konkreten Beispiele betrifft, dürfte eine Pull Request eine schnellere Übernahme ermöglichen.
Vielen Dank, dass Sie den langen Kommentar gelesen haben.
Wenn Sie das vom Hongkonger Staat herausgegebene English-Chinese Glossary of IT Terms als Referenz heranziehen, dürfte das bei der Zusammenstellung der in Hongkong verwendeten Begriffe hilfreich sein.
https://ogcio.gov.hk/en/our_work/…
Großartig :D
Vielen Dank für die gute Zusammenstellung.
Wenn sich später einmal die Gelegenheit ergibt, würde ich auch gern Material zu nordkoreanischen Computerbegriffen sehen. Ich weiß nicht, ob es im Nordkorea-Datenzentrum des Vereinigungsministeriums passende Unterlagen gibt.
Gibt es bereits auf der Website des Vereinigungsministeriums.
Vergleich der IT-Begriffe zwischen Süd- und Nordkorea: https://nkinfo.unikorea.go.kr/nkp/term/skNkItTerm.do
Wenn man etwas wie den nordkoreanischen Linux-Distributor Red Star auseinandernehmen würde, könnte dabei vielleicht irgendein Material auftauchen. Soweit ich mich erinnere, war auch das Große Wörterbuch der koreanischen Sprache enthalten … Wenn ich einmal Zeit habe, werde ich auch das Nordkoreanische ergänzen!
Wenn man genauer hinsieht, merkt man, dass man nicht einmal scrapen muss, weil der gesamte Inhalt bereits als Datei im XLS-Format bereitgestellt wird.
Es wäre gut,
koinko-krundko-kpzu trennen und nordkoreanische Computerbegriffe hinzuzufügen.Ich dachte, wenn man es wie in Markdown in
<>einschließt, würde die URL-Grenze erkannt werden, aber offenbar nicht. 😅 Der Link zum Repository ist hier: https://github.com/dahlia/cjk-compsci-termsIch muss die Markdown-Unterstützung noch umsetzen, bin aber bisher nicht dazu gekommen ;_;
Ich habe es vorerst so angepasst, dass die URL anklickbar ist, indem ich nur davor und danach Leerzeichen eingefügt habe.
Aber das ist wirklich eine Show, die perfekt zum Tag des Hangeul passt. Ich werde sie mir mit Vergnügen ansehen!
Vielen Dank, dass Sie auch den Haupttext korrigiert haben!