Kernaussage: So schnell wie möglich aus dem LLM herauskommen und nicht lange darin bleiben
- Man sollte LLMs keine Entscheidungsfindung oder Business-Logik überlassen → Genauigkeit und Stabilität reichen nicht aus
- In den meisten Fällen sollte ein LLM lediglich als Schnittstelle zwischen Nutzer und Anwendungs-API dienen
- Die Kernlogik sollte in dedizierten Systemen oder Engines ausgeführt werden, und das LLM sollte nur Nutzeranfragen in API-Aufrufe umwandeln und die Ergebnisse wieder in natürliche Sprache zurückübersetzen
Warum?
-
Beispiel Schach-Bot: Ein Nutzer sendet über WhatsApp „Schlag mit meinem Läufer den Springer“ → Ein LLM könnte zwar den Zustand des Schachbretts verwalten und auch spielen, aber bei Zuverlässigkeit, Performance und Wartbarkeit gibt es viele Probleme
-
Performance: LLMs sind beim Schachspielen zwar erstaunlich gut, aber immer noch langsamer und weniger präzise als spezialisierte Schach-Engines (z. B. Stockfish)
-
Nicht debugbar oder feinjustierbar: Es ist schwer nachzuvollziehen, warum eine bestimmte Entscheidung getroffen wurde, daher ist es schwierig, das Verhalten gezielt anzupassen
-
Weitere Probleme:
- LLM-Ausgaben sind schwer zu testen
- Schwache Leistung bei Mathematik oder der Erzeugung von Zufallszahlen
- Versionsverwaltung und Auditierung sind schwierig
- Zustände in natürlicher Sprache zu verwalten ist fragil
- Probleme mit API-Kosten, Rate Limits usw.
- Sicherheitsgrenzen werden unscharf
Die richtige Rollentrennung anhand verschiedener Beispiele
- In einem Spiel: „Ich möchte Spieler X mit dem Vorpal-Schwert angreifen“ → Das LLM sollte dies nur in die Form
attack(player=X, weapon="vorpal_sword")umwandeln und an die Spiellogik weitergeben - Verhandlungsagent → Das LLM trifft keine Verhandlungsentscheidungen, sondern verpackt nur die Eingabe des Nutzers, übergibt sie an die Verhandlungs-Engine und liefert das Ergebnis zurück
- Erzeugung zufälliger Antworten → Sollte nicht vom LLM ausgewählt werden, sondern von einer externen Zufallsfunktion verarbeitet werden
Was LLMs gut können
- LLMs sind auf Transformation, Interpretation und Kommunikation spezialisiert
- Beispiele:
- „Ich haue den Ork mit dem Schwert“ → Umwandlung in
attack(target="orc", weapon="sword") { "error": "insufficient_funds" }→ natürliche Erklärung als „Nicht genug Gold“- Die Eingabe des Nutzers kann als Kampfkommando, Inventarprüfung oder Hilfsanfrage klassifiziert werden
- Menschliche Konzepte werden gut verstanden (z. B. blade = sword, smash = attack)
- „Ich haue den Ork mit dem Schwert“ → Umwandlung in
- Der Kern ist nicht komplexe Entscheidungsfindung oder Zustandsverwaltung → nur die Rolle einer Brücke, die die Absicht des Nutzers mit dem System verbindet
Zukunftsausblick und weiterhin gültige Prinzipien
- Die Technologie entwickelt sich schnell weiter, daher könnte bald möglich werden, was heute noch nicht geht
- Dennoch bleiben strukturelle Probleme, die LLMs nicht lösen können, voraussichtlich bestehen:
- Logik ohne LLM ist leichter zu verstehen sowie einfacher zu warten und zu versionieren
- Auch die Ausführungskosten sind niedriger
- Auch in Zukunft sollten sich LLMs auf die Rolle als Schnittstelle konzentrieren, während die Kernlogik dedizierten Systemen überlassen bleibt
1 Kommentare
Hacker-News-Meinung
Es gibt zwei Arten von Logik
Typ 1 betrifft Bereiche wie Sicherheit, Finanzen und Mathematik
Typ 2 wird mit hoher Wahrscheinlichkeit von KI ersetzt werden
Verschiedene Teile derselben Anwendung können für Typ 1 oder Typ 2 geeignet sein
Kürzlich wurde bei einem Hackathon ein Lernspiel entwickelt
Ein LLM sollte keine Logik implementieren
Es ist schwierig, die Fähigkeiten von LLMs zu verstehen
Wenn LLM-Antworten schnell und günstig sein sollen, sollte man kurze Prompts und kleine Modelle verwenden
Nur mit LLMs ist Testen schwierig
LLMs für Business-Logik zu verwenden ist riskant
Mit KI-generierten Bildern lassen sich Artikel zusammenfassen