25 Punkte von shuggie 14 일 전 | 9 Kommentare | Auf WhatsApp teilen

Wikipedia ist keine Werbetafel, auf der man etwas vorstellt und bewirbt. Aber dass in kurzer Zeit eine Flut von Bibliotheken erschienen ist, schien mir auch als ein Phänomen betrachtbar zu sein, das eine Epoche definieren könnte.

Deshalb habe ich beschlossen, dieses aktuelle Phänomen zu dokumentieren, die bislang erschienenen Open-Source-Tools für HWP/HWPX zusammenzustellen und in ein MediaWiki einzupflegen.


Liste der Open-Source-Tools zur Verarbeitung von HWP/HWPX

HWP (Hanword-Prozessor) und sein Nachfolgeformat HWPX sind Dokumentformate, die in südkoreanischen Behörden und im Bildungsbereich weit verbreitet sind. Da Hancom Office Hanword sich dort faktisch als Standard etabliert hat, war man lange Zeit darauf beschränkt, Hancom Office in einer Windows-Umgebung installiert zu haben, wenn man diese Formate programmgesteuert verarbeiten wollte.

Anfang der 2010er Jahre legte Kim Hodong im Alleingang mit der Entwicklung von ruby-hwp, libhwp, evince-hwp usw. die erste Grundlage für das Open-Source-Ökosystem rund um HWP. 2013 jedoch verlor er infolge des libhwp-Vorfalls die Motivation für Open-Source-Entwicklung, und zusammen mit einer Verschlechterung seines Gesundheitszustands stellte er alle Projekte ein und zog sich zurück.[1][2] Danach wurde Open Source in diesem Bereich für längere Zeit nur noch vereinzelt weitergeführt.

Um 2024 herum änderte sich die Lage. Mit der Verbreitung generativer KI stieg die Nachfrage sprunghaft an, HWP/HWPX-Dokumente in KI-Pipelines einzuspeisen oder mit Automatisierungstools zu verarbeiten. In der Folge erschienen in kurzer Zeit zahlreiche Open-Source-Tools, die ohne Hancom Office funktionieren; zugleich wurden die Formen vielfältiger – von Bibliotheken in Python, Rust und TypeScript über CLI-Tools und MCP-Server bis hin zu Web-Editoren.

Die folgende Tabelle fasst die derzeit öffentlich verfügbaren wichtigen Open-Source-Tools für HWP/HWPX zusammen.


(Die zusammengefasste Tabelle finden Sie über den MediaWiki-Link.)


An Kim Hodong

2013 schuf ein einzelner Entwickler mit ruby-hwp, libhwp, evince-hwp und weiteren Projekten nahezu die gesamte Grundlage dafür, Hangul-Dateien als Open Source zu verarbeiten. Durch den libhwp-Vorfall verlor er die Motivation für Open-Source-Entwicklung; zusammen mit einer Verschlechterung seines Gesundheitszustands schloss er die Projekte und zog sich zurück. Dass die in diesem Dokument aufgeführten Werkzeuge überhaupt existieren konnten, liegt daran, dass Hodong zuvor die Möglichkeiten erkannte und den Weg eröffnete. Dieses Dokument wurde geschaffen, um dieser pionierhaften Arbeit Respekt zu erweisen.

9 Kommentare

 
jwseo 2 일 전

Warum ist das Wiki-Dokument verschwunden?

 
tazuya 13 일 전

Wenn ich es mir so ansehe, scheint Herr Kim Ho-dong schon 2019 enormen Stress gehabt zu haben. Dem Text nach zu urteilen gab es viel zu viele dreiste und asoziale Leute. (Die gibt es wohl auch jetzt noch?)
https://hamonikr.org/Free_Board/63139

 
bootno2316 3 일 전

Ich finde, man sollte auch die andere Seite anhören.

Es ist ziemlich bekannt. 2011, 2013, 2016, 2019 – derselben Person passieren ähnliche Dinge. Diese Person erklärt immer wieder den Stopp des Projekts, sogar das Ende des Open Source, beschimpft Leute, die Bugreports zum Projekt eingereicht haben, und fängt dann nach einiger Zeit erneut an – das hat sich mehrfach wiederholt. Vielleicht sucht er eifrig nach sich selbst; in allen möglichen Foren und Wikis betreibt er Keyword-Suche, überall dort, wo es entsprechende Erwähnungen gibt. (Es könnte sein, dass er auch hier über diesen Kommentar hereinschaut.)

Sollte man ihm einfach glauben und Verständnis haben, nur weil er Entwickler ist?

 
tazuya 2 일 전

Vielen Dank für Ihren Kommentar. Davon gab es also solche Fälle. Offenbar ist das, was ich gesehen habe, nicht alles gewesen. Vielen Dank noch einmal, dass Sie Informationen aus einer anderen Perspektive geteilt haben.

 
darjeeling 13 일 전

Da der bestehende Code noch vorhanden ist, kann man selbst prüfen, um welche Implementierung es sich handelt.
https://gitlab.com/sebuls/libhwp

 
qyahzn2004 13 일 전

rip

 
husky81 13 일 전

BckHWP. Excel-VBA-Automatisierung
https://m.blog.naver.com/husky81/222045248589

 
click 14 일 전

Wow, als ich das 2020 gesehen habe, gab es noch nicht viele Bibliotheken, die mit HWP umgehen konnten, aber in letzter Zeit ist ihre Zahl explosionsartig gestiegen.

 
djfxod 14 일 전

Nicht libhwp war unbedingt der ausschlaggebende Grund, sondern eher diese Mülltruppe das größere Problem. Es gibt kein Subjekt; wenn du dich davon angesprochen fühlst und wütend wirst, dann ist das dein Problem.