5 Punkte von wellsa 14 시간 전 | Noch keine Kommentare. | Auf WhatsApp teilen

Beim Suchen in Rechtsvorschriften ist es frustrierend, dass man Dinge wie „Artikel 14 des Gesetzes zur Bestrafung sexualisierter Gewalt“ kennen muss, um überhaupt fündig zu werden. Deshalb habe ich eine RAG-Demo gebaut, die relevante Rechtsnormen zurückgibt, wenn Bürgerinnen und Bürger ihre Frage einfach in Alltagssprache stellen.

Die Daten werden über die öffentliche OpenAPI des Ministry of Government Legislation bezogen, als Markdown aufbereitet und täglich per cron aktualisiert.

• Gesetze (law-kr): 5.589
• Verwaltungsvorschriften (regulate-kr): 10.765
• Gerichtsurteile (precedent-kr): 171.014
• Auslegungsfälle zu Gesetzen (interpretation-kr): 8.728
• Entscheidungen des Verfassungsgerichts (constitution-kr): 38.092
• Kommunale Satzungen und Verordnungen (localrule-kr): 159.910
• Verträge (treaty-kr): 6.907

Insgesamt 397K+ Markdown-Dokumente.
1,36M+ Normen im produktiven DB indexiert.

• Demo: https://minilex.wellsa.ai
• Daten/Code (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai

Ich habe bei etwa 5 Bürgerszenarien (Deepfake / ausstehende Lohnzahlung / ungerechtfertigte Kündigung / Datenschutzverletzung / Stalking) bestätigt, dass zusammen mit den Quellenartikeln passende Ergebnisse zurückgegeben werden, aber von Generalisierung sind wir noch weit entfernt.
Die Abhängigkeit von Keyword- und Synonymerweiterung ist noch hoch, daher ist die Verallgemeinerung des Rankings die nächste Aufgabe.

Der Stack ist recht gewöhnlich: Next.js + FastAPI + Celery + PostgreSQL + pgvector, als Embedding verwende ich nomic-embed-text-v2-moe (768d).
In einem eigenen Safety-Sample-Benchmark kamen etwa R@5 0.86 / MRR 0.753 heraus.

Es ist kein Ersatz für Rechtsberatung, sondern dient als Hilfe bei der Recherche nach einschlägigen Quellenartikeln.
Bitte besprechen Sie tatsächliche Entscheidungen mit qualifizierten Fachleuten.

Feedback / PRs sind willkommen.

Noch keine Kommentare.

Noch keine Kommentare.