1 Punkte von GN⁺ 2025-04-03 | 1 Kommentare | Auf WhatsApp teilen

Kernaussage: So schnell wie möglich aus dem LLM herauskommen und nicht lange darin bleiben

  • Man sollte LLMs keine Entscheidungsfindung oder Business-Logik überlassen → Genauigkeit und Stabilität reichen nicht aus
  • In den meisten Fällen sollte ein LLM lediglich als Schnittstelle zwischen Nutzer und Anwendungs-API dienen
  • Die Kernlogik sollte in dedizierten Systemen oder Engines ausgeführt werden, und das LLM sollte nur Nutzeranfragen in API-Aufrufe umwandeln und die Ergebnisse wieder in natürliche Sprache zurückübersetzen

Warum?

  • Beispiel Schach-Bot: Ein Nutzer sendet über WhatsApp „Schlag mit meinem Läufer den Springer“ → Ein LLM könnte zwar den Zustand des Schachbretts verwalten und auch spielen, aber bei Zuverlässigkeit, Performance und Wartbarkeit gibt es viele Probleme

  • Performance: LLMs sind beim Schachspielen zwar erstaunlich gut, aber immer noch langsamer und weniger präzise als spezialisierte Schach-Engines (z. B. Stockfish)

  • Nicht debugbar oder feinjustierbar: Es ist schwer nachzuvollziehen, warum eine bestimmte Entscheidung getroffen wurde, daher ist es schwierig, das Verhalten gezielt anzupassen

  • Weitere Probleme:

    • LLM-Ausgaben sind schwer zu testen
    • Schwache Leistung bei Mathematik oder der Erzeugung von Zufallszahlen
    • Versionsverwaltung und Auditierung sind schwierig
    • Zustände in natürlicher Sprache zu verwalten ist fragil
    • Probleme mit API-Kosten, Rate Limits usw.
    • Sicherheitsgrenzen werden unscharf

Die richtige Rollentrennung anhand verschiedener Beispiele

  • In einem Spiel: „Ich möchte Spieler X mit dem Vorpal-Schwert angreifen“ → Das LLM sollte dies nur in die Form attack(player=X, weapon="vorpal_sword") umwandeln und an die Spiellogik weitergeben
  • Verhandlungsagent → Das LLM trifft keine Verhandlungsentscheidungen, sondern verpackt nur die Eingabe des Nutzers, übergibt sie an die Verhandlungs-Engine und liefert das Ergebnis zurück
  • Erzeugung zufälliger Antworten → Sollte nicht vom LLM ausgewählt werden, sondern von einer externen Zufallsfunktion verarbeitet werden

Was LLMs gut können

  • LLMs sind auf Transformation, Interpretation und Kommunikation spezialisiert
  • Beispiele:
    • „Ich haue den Ork mit dem Schwert“ → Umwandlung in attack(target="orc", weapon="sword")
    • { "error": "insufficient_funds" } → natürliche Erklärung als „Nicht genug Gold“
    • Die Eingabe des Nutzers kann als Kampfkommando, Inventarprüfung oder Hilfsanfrage klassifiziert werden
    • Menschliche Konzepte werden gut verstanden (z. B. blade = sword, smash = attack)
  • Der Kern ist nicht komplexe Entscheidungsfindung oder Zustandsverwaltung → nur die Rolle einer Brücke, die die Absicht des Nutzers mit dem System verbindet

Zukunftsausblick und weiterhin gültige Prinzipien

  • Die Technologie entwickelt sich schnell weiter, daher könnte bald möglich werden, was heute noch nicht geht
  • Dennoch bleiben strukturelle Probleme, die LLMs nicht lösen können, voraussichtlich bestehen:
    • Logik ohne LLM ist leichter zu verstehen sowie einfacher zu warten und zu versionieren
    • Auch die Ausführungskosten sind niedriger
  • Auch in Zukunft sollten sich LLMs auf die Rolle als Schnittstelle konzentrieren, während die Kernlogik dedizierten Systemen überlassen bleibt

1 Kommentare

 
GN⁺ 2025-04-03
Hacker-News-Meinung
  • Es gibt zwei Arten von Logik

      1. Logik, die ihrem Wesen nach korrekt und streng sein muss
      1. Logik, die aufgrund der Eigenschaften von Computern so geworden ist
  • Typ 1 betrifft Bereiche wie Sicherheit, Finanzen und Mathematik

  • Typ 2 wird mit hoher Wahrscheinlichkeit von KI ersetzt werden

  • Verschiedene Teile derselben Anwendung können für Typ 1 oder Typ 2 geeignet sein

  • Kürzlich wurde bei einem Hackathon ein Lernspiel entwickelt

    • Ein LLM wurde genutzt, um das Spiel zu erzeugen und auszuführen, aber der Spielfluss war nicht gut
    • Am Ende wurden viel Python-Code und mehrere Prompts verwendet, um den Spielzustand zu verwalten
    • Am besten setzt man LLMs als kleine Komponenten in einem größeren System ein
  • Ein LLM sollte keine Logik implementieren

    • Logik, Optimierung und Constraint Programming sind eigene Techniken
    • Der Begründer der modernen Logik ist George Boole, und er war der Großvater von Geoffrey Everest Hinton
  • Es ist schwierig, die Fähigkeiten von LLMs zu verstehen

    • Leser wollen einfache Antworten
    • LLMs können Schwierigkeiten haben, einfache Zustandsmaschinen zu schreiben
    • Forschungsarbeiten gewinnen an Popularität, und selbst bis 2025 wird es wohl niemanden geben, der LLMs vollständig versteht
  • Wenn LLM-Antworten schnell und günstig sein sollen, sollte man kurze Prompts und kleine Modelle verwenden

    • Viele Informationen setzen die Verwendung großer Modelle voraus
    • Eine traditionelle UI könnte die bessere Wahl sein
  • Nur mit LLMs ist Testen schwierig

    • Der persönliche Stil beeinflusst die Interaktion
    • Die Wartungskosten können hoch sein
    • Es ist vernünftiger, das in API-Aufrufe umzuwandeln
  • LLMs für Business-Logik zu verwenden ist riskant

    • Sie eignen sich für Sprachverarbeitung
  • Mit KI-generierten Bildern lassen sich Artikel zusammenfassen