Neuigkeiten zum legalize-kr-Update – Verwaltungsregeln/Satzungen hinzugefügt, CLI/MCP/Skill, Ökosystem-Seite und mehr
(github.com/legalize-kr)Nach der Vorstellung im letzten Show GN möchte ich hier eine Zusammenfassung der Updates des legalize-kr-Projekts aus dem vergangenen Monat (31 Tagen) teilen. Dank des Interesses und der Unterstützung vieler Menschen konnten wir hier und da einiges verbessern. Vielen Dank!
Was ist legalize-kr?
legalize-kr ist ein Projekt, das die Gesetze und Präzedenzfälle Südkoreas, die über die National Law Information Shared Use des Ministeriums für Gesetzgebung bereitgestellt werden, als Markdown + Git-Historie archiviert. Alle Gesetze wurden als Markdown-Dokumente und alle Änderungshistorien als Git-Commits archiviert; auch Präzedenzfälle wurden als Markdown-Dokumente und mit Git-Historie auf Basis des Urteilsdatums archiviert.
Warum wurde es erstellt?
Am 30. März entdeckte ich auf GitHub Trending das Projekt legalize.dev, das Gesetze aus Spanien und dem ангloamerikanischen Raum mit Markdown und Git-Commits verwaltet. Ich dachte natürlich, es müsse auch etwas für koreanische Gesetze geben, aber bei der Suche fand ich nichts. Also habe ich eines erstellt, weil es nützlich schien.
Update 1. Repositories für Verwaltungsregeln / kommunale Satzungen hinzugefügt
Bisher wurden nur Gesetze und Präzedenzfälle behandelt, aber nun wurden auch die von derselben National Law Information Shared Use bereitgestellten Verwaltungsregeln und kommunalen Satzungen als separate Repositories hinzugefügt. Damit lassen sich nun die wichtigsten öffentlich zugänglichen juristischen Dokumente Südkoreas an einem Ort mit Markdown + Git-Historie nachverfolgen:
- Gesetzes-Repository: github.com/legalize-kr/legalize-kr
- Präzedenzfall-Repository: github.com/legalize-kr/precedent-kr
- Verwaltungsregel-Repository: github.com/legalize-kr/admrule-kr
- Satzungs-Repository: github.com/legalize-kr/ordinance-kr
Verwaltungsregeln umfassen etwa Anweisungen, Rundschreiben und Bekanntmachungen einzelner Ministerien; kommunale Satzungen sind Verordnungen und Regeln lokaler Selbstverwaltungen. Die Menge ist größer als bei Gesetzen, und Änderungen erfolgen häufiger, daher dürfte der Nutzen einer Nachverfolgung per Git-Historie recht hoch sein. Bei Verwaltungsregeln ist es allerdings ziemlich schwierig, Namensänderungen von Ministerien oder Aufgabenverteilungen nachzuvollziehen. Wir haben daran mehrfach Verbesserungen vorgenommen, aber es scheint noch ein weiter Weg zu sein. Viel Interesse und Mitarbeit sind sehr willkommen T_T
Update 2. CLI-Tool, MCP und Agent Skill hinzugefügt
Am bequemsten ist es natürlich, das gesamte Repository per git clone zu nutzen. Da es aber belastend sein kann, jedes Mal ein mehrere Dutzend GB großes Repository herunterzuladen, habe ich ein CLI-Tool auf Basis der GitHub REST API erstellt. Außerdem wird auf derselben Codebasis auch ein MCP-Server bereitgestellt, und es wurden Agent Skills hinzugefügt, die sich direkt in Claude Code / Codex und ähnlichen Umgebungen verwenden lassen:
- CLI / MCP-Repository: github.com/legalize-kr/cli-tools
- Agent-Skills-Repository: github.com/legalize-kr/agent-skills
Auch ohne das gesamte Repository herunterzuladen, kann man nach bestimmten Gesetzen/Präzedenzfällen suchen, einzelne Artikel abfragen oder Änderungshistorien nachverfolgen. Über MCP können LLMs/Agenten dies auch direkt aufrufen. Das AGENT SKILL enthält außerdem eine Anleitung dazu, wann CLI / MCP / git clone / direkter GitHub-Zugriff jeweils sinnvoll ist. Allerdings erlaubt die GitHub REST API ohne separate Authentifizierung nur bis zu 60 Anfragen pro Stunde; falls nötig, sollte daher ein GitHub-Token verwendet werden (damit sind bis zu 5.000 Anfragen pro Stunde möglich).
Update 3. Seite für Anwendungsfälle / Ökosystem hinzugefügt
Da nach und nach Projekte entstehen, die die von legalize-kr bereitgestellten Datensätze nutzen, habe ich begonnen, sie am unteren Bereich der Startseite und im Menü „Nutzung“ auf der Website zu sammeln. Neben direkt darauf aufbauenden Projekten werden auch andere Projekte oder Tools mit ähnlicher Zielsetzung vorgestellt (darunter Beommang und Korean Law MCP, die zuvor bei GN vorgestellt wurden).
Falls ihr einen oder mehrere Datensätze von legalize-kr verwendet oder an einem Projekt in einem ähnlichen Bereich arbeitet, gebt bitte per PR, Issue oder in den Kommentaren zu diesem Beitrag Bescheid. Dann nehme ich es gerne mit auf.
Update 4. Weitere Verbesserungen für eine bessere Datennutzung
Unter Bezug auf Issues in verschiedenen Repositories arbeite ich derzeit an der Überarbeitung von Parsing-Regeln und der Bereinigung von Metadaten. Die wichtigsten Änderungen sind:
- Ergänzung zusätzlicher Parsing-Regeln für Einheiten wie „Absatz“ und „Unterabschnitt“ zusätzlich zu den bestehenden „Teil/Kapitel/Abschnitt/Unterabschnitt“ (legalize-kr/legalize-kr#32)
- Behebung des Problems, dass das Muster
<제M조의 N>verloren ging (legalize-kr/legalize-kr#31 und legalize-kr/legalize-pipeline#2) - Ergänzung fehlender Gesetze – z. B. Handelsgesetz und Durchführungsverordnung zum Handelsgesetz (legalize-kr/legalize-kr#9)
- Behebung eines Problems, bei dem aufgrund verbliebener Dateien alter Durchführungsregeln
git logeine Änderung als „hinzugefügt“ statt als „geändert“ erkannte (legalize-kr/legalize-kr#24) - Umbenennung von Präzedenzfall-Dateien und Verzeichnisstruktur nach Verkündungsdatum (legalize-kr/precedent-kr#4)
- Behebung eines Problems mit beschädigten koreanischen Adressformaten in Quell-URLs von Präzedenzfällen (law.go.kr 404) (legalize-kr/precedent-kr#3)
- Ergänzung fehlender Git-Commits für 17 Verkündungsdaten im Dangi-Kalender (legalize-kr/precedent-kr#1)
- Hinzufügen von Links zu Anhängen, die zu den einzelnen Gesetzen / Präzedenzfällen / Verwaltungsregeln / Satzungen gehören, als Liste im Markdown-Frontmatter
Weitere Details finden sich in den geschlossenen Issues der wichtigsten Repositories:
- Geschlossene Issues von legalize-kr: https://github.com/legalize-kr/legalize-kr/…
- Geschlossene Issues von precedent-kr: https://github.com/legalize-kr/precedent-kr/…
- Geschlossene Issues von legalize-pipeline: https://github.com/legalize-kr/legalize-pipeline/…
Zum Schluss
Am Anfang war es eher ein „Ich baue es einfach mal, irgendjemand wird es schon verwenden“. Seit dem letzten Show GN wächst der Umfang aber ganz natürlich, weil zusammen mit vielen ⭐ auch Issues eingegangen sind. Ich pflege und verwalte das Projekt weiterhin kontinuierlich, daher freue ich mich über viel Interesse, Unterstützung und Weiterempfehlungen. Vielen Dank!
2 Kommentare
Wir entwickeln in unserem Ministerium etwas mit RAG. Ich würde das gern klonen und nur die für uns relevanten Gesetze und ähnlichen Vorschriften extrahieren und verwenden.
Wäre das möglich?
Ja, ich weiß zwar nicht, wie die Pipeline derzeit genau aufgebaut ist, aber grundsätzlich scheint es sinnvoll zu sein, die entsprechenden Verarbeitungsschritte hinzuzufügen, bevor die Dokumente für die aktuelle RAG-Konfiguration in die Vector DB eingespeist werden.
Entscheidend dürfte allerdings sein, wie Sie die „relevanten Gesetze und Verordnungen“ extrahieren; möglicherweise könnte man auf Basis von Gesetzesnamen oder wichtigen Schlüsselwörtern filtern. ^^;
Vielen Dank!