Lemini — ein Rechtsberatungs-Chatbot mit zwei Betriebsmodi
(github.com/maantano)URL : https://lemini-brown.vercel.app/
Ich stelle Lemini vor, einen RAG-Chatbot, mit dem man koreanische Gesetze und Präzedenzfälle in natürlicher Sprache abfragen kann. Kürzlich wurde hier ein Beitrag zu einem ähnlichen Service veröffentlicht; wir lösen dasselbe
Problem mit zwei unterschiedlichen Modi und würden dazu gern technisches Feedback bekommen.
Warum zwei Modi?
Juristische Fragen teilen sich im Wesentlichen in zwei Typen.
- "Meine Situation ist so und so – was soll ich tun?" — Nutzer sind oft nicht in der Lage, den Sachverhalt ausreichend präzise zu schildern. Wenn man so etwas mit allgemeinem RAG verarbeitet, bekommt man nur allgemeine Aussagen zurück.
- "Prüf bitte diesen Vertrag / diese AGB" — Das Dokument liegt bereits vor, aber wenn man mit einem einzelnen Prompt einfach nur "prüf das" sagt, kommt nur eine Standard-Checkliste heraus.
Diese beiden Typen lassen sich nicht mit demselben RAG lösen. Deshalb wurde Lemini mit zwei getrennten Modi entworfen.
Modus 1 — Ouroboros (interaktive Sachverhaltskonvergenz)
Frage → [Sind die Sachverhaltsangaben ausreichend?] ──nein── Multiple-Choice-Nachfragen ─┐
│ ja │
▼ ←─ Antwort des Nutzers ┘
RAG (Gesetze + Präzedenzfälle + autonome Regelwerke)
▼
Strukturierte Analyse
· günstige / kritische Fakten
· Handlungsplan
· Fristwarnungen (Verjährung)
· relevante Präzedenzfälle
▼
Zitat-Validierungsschleife — entfernt Zitate, die in den Suchtreffern nicht vorkommen
Kerngedanke in einem Satz: Bevor geantwortet wird, fragt das Modell sich selbst: „Sind die Sachverhaltsangaben ausreichend?“
Falls nicht, folgen Multiple-Choice-Karten mit Nachfragen; falls ja, geht es weiter zu RAG → strukturierte Analyse. Nutzer müssen die Nachfragen nicht selbst entwerfen.
Modus 2 — Fachanalyse (6 Ketten für Dokumentenprüfung)
Dokumenteneingabe
▼
① Gesamtscan — Dokumenttyp, Zusammenfassung der Abschnitte
② Mapping auf externe institutionelle Frames — Deklaration der Regelungssysteme, auf die sich dieses Dokument stützt
③ RAG je Achse — Suche nach Gesetzen und Präzedenzfällen pro institutioneller Achse
② Mapping auf externe institutionelle Frames — Deklaration der Regelungssysteme, auf die sich dieses Dokument stützt
③ RAG je Achse — Suche nach Gesetzen und Präzedenzfällen pro institutioneller Achse
④ Prüfung auf Klausel-Ebene — observations / gaps / external
⑤ Parallele Ketten (3 gleichzeitig)
├ Kohärenz von Zweck und Mittel
├ Prüfung aus institutioneller Sicht
└ Risiko-Szenarien
⑥ Entscheidungsorientiertes verdict — nur bei entscheidungsorientierten Fragen
Kerngedanke in einem Satz: Statt mit einem einzigen Prompt einfach „prüf das“ zu sagen, „deklarieren wir zuerst den institutionellen Frame außerhalb des Dokuments und gehen erst dann hinein.“
Gerade dieser Schritt ② kommt mit einem einzelnen Prompt nicht gut heraus, deshalb haben wir die Kette aufgeteilt.
Gemeinsame Grundlage beider Modi
- Zitat-Validierungsschleife — vom LLM erzeugte Zitate werden mit Suchtreffern abgeglichen; nicht existierende Zitate werden aus der Antwort entfernt. Das soll plausibel wirkende erfundene Gesetzesstellen verhindern.
- Einheitlicher Pool aus drei Datentypen — Gesetze + Präzedenzfälle + autonome Regelwerke (Standard-AGB der Wettbewerbsbehörde, Verbandsregelwerke, Leitlinien von KISA und der Datenschutzkommission) werden in denselben Vektorraum geladen.
Im Code gibt es 0 Domain-Verzweigungen; unterschieden wird nur überdocument_type. - Eigene Erfassungspipeline — Gesetze werden über die DRF API einmal pro Woche automatisch aktualisiert, Präzedenzfälle über die gemeinsame Nutzungs-API des staatlichen Rechtsinformationssystems + On-Demand-Cache.
- Bei den Prompts stand Generalisierbarkeit an erster Stelle. Es werden keine Informationen zur Ableitung der Antwort vorgegeben; stattdessen sind sie so entworfen, dass passend zur Frage eine Antwort erzeugt wird.
Stack
FastAPI / Cloud Run · Next.js · Gemini (strukturiertes JSON + Multi-Chain) · SQLite + eigene Embedding-Matrix (drei Achsen: Vektor · lexical · exact)
Datenschutz
Keine Registrierung und kein Login, keine Speicherung von Gesprächen in der Server-DB (Browser-localStorage), stateless, IPs werden nur in-memory für Rate Limiting verwendet.
Grenzen
Es handelt sich nicht um Rechtsberatung, sondern um ein Tool zur Informationssuche und -analyse. Bei Sternchen- und Formulardaten sowie bei der Abdeckung von Präzedenzfällen gibt es Lücken. Die eigentliche Schlussfolgerungsfähigkeit des Modells hängt von externen LLMs ab; unser Differenzierungsmerkmal soll nicht „eine plausibel klingende Antwort“, sondern „eine strukturierte Antwort mit validierter Begründung“ sein.
Wozu wir gern Feedback hätten
- Modus 1 — Fälle, in denen die Nachfragen von Ouroboros unpassend oder überzogen sind
- Modus 2 — Perspektiven, die in der 6-Ketten-Dokumentenprüfung fehlen
- fehlerhafte Zitate, die die Zitat-Validierungsschleife nicht erkannt hat
- fehlende Blickwinkel im Vergleich zu anderen Services derselben Domain
Probiert es gern aus und gebt uns auch gern direktes, ungefiltertes Feedback.
2 Kommentare
Ergebnis der Dokumentenprüfung
Bestätigung fehlgeschlagen
Während der Dokumentenprüfung ist ein Fehler aufgetreten. Bei der Nutzung des Chatbots tritt ein Fehler auf, und wenn man nach dem Namen eines Gesetzes sucht, wird der erste Wert zwar mit 50 % angezeigt, aber bei den übrigen scheinen völlig unrealistische Scores wie 4565 % zu erscheinen.
Vielen Dank!! ;_; Ich werde es mir ansehen!!