Ich habe eine RAG-Demo gebaut, mit der sich 7 Arten von Rechtsquellen an einem Ort durchsuchen lassen — MiniLex
(minilex.wellsa.ai)Beim Suchen in Rechtsvorschriften ist es frustrierend, dass man Dinge wie „Artikel 14 des Gesetzes zur Bestrafung sexualisierter Gewalt“ kennen muss, um überhaupt fündig zu werden. Deshalb habe ich eine RAG-Demo gebaut, die relevante Rechtsnormen zurückgibt, wenn Bürgerinnen und Bürger ihre Frage einfach in Alltagssprache stellen.
Die Daten werden über die öffentliche OpenAPI des Ministry of Government Legislation bezogen, als Markdown aufbereitet und täglich per cron aktualisiert.
• Gesetze (law-kr): 5.589
• Verwaltungsvorschriften (regulate-kr): 10.765
• Gerichtsurteile (precedent-kr): 171.014
• Auslegungsfälle zu Gesetzen (interpretation-kr): 8.728
• Entscheidungen des Verfassungsgerichts (constitution-kr): 38.092
• Kommunale Satzungen und Verordnungen (localrule-kr): 159.910
• Verträge (treaty-kr): 6.907
Insgesamt 397K+ Markdown-Dokumente.
1,36M+ Normen im produktiven DB indexiert.
• Demo: https://minilex.wellsa.ai
• Daten/Code (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai
Ich habe bei etwa 5 Bürgerszenarien (Deepfake / ausstehende Lohnzahlung / ungerechtfertigte Kündigung / Datenschutzverletzung / Stalking) bestätigt, dass zusammen mit den Quellenartikeln passende Ergebnisse zurückgegeben werden, aber von Generalisierung sind wir noch weit entfernt.
Die Abhängigkeit von Keyword- und Synonymerweiterung ist noch hoch, daher ist die Verallgemeinerung des Rankings die nächste Aufgabe.
Der Stack ist recht gewöhnlich: Next.js + FastAPI + Celery + PostgreSQL + pgvector, als Embedding verwende ich nomic-embed-text-v2-moe (768d).
In einem eigenen Safety-Sample-Benchmark kamen etwa R@5 0.86 / MRR 0.753 heraus.
Es ist kein Ersatz für Rechtsberatung, sondern dient als Hilfe bei der Recherche nach einschlägigen Quellenartikeln.
Bitte besprechen Sie tatsächliche Entscheidungen mit qualifizierten Fachleuten.
Feedback / PRs sind willkommen.
Noch keine Kommentare.