- Ein Leitfaden, der Strategien und Techniken für bessere Ergebnisse mit großen Sprachmodellen (auch GPT-Modelle genannt) vermittelt
- Die hier beschriebenen Methoden lassen sich teils kombinieren, um eine größere Wirkung zu erzielen; es wird empfohlen zu experimentieren, um die am besten geeignete Methode zu finden
- Anhand von Beispiel-Prompts kann man erkunden, was das Modell leisten kann
Sechs Strategien für bessere Ergebnisse
Klare Anweisungen schreiben
- Modelle können keine Gedanken lesen, daher muss man klar formulieren, was man möchte.
- Füge Details hinzu, um relevantere Antworten zu erhalten, bitte das Modell, eine bestimmte Person darzustellen, oder verwende Trennzeichen, um klar zwischen verschiedenen Teilen der Eingabe zu unterscheiden.
- Gib die Schritte an, die zur Erledigung der Aufgabe nötig sind, liefere Beispiele und bestimme die gewünschte Länge der Ausgabe.
Referenztexte bereitstellen
- Sprachmodelle können überzeugend klingende, aber erfundene Antworten erzeugen, insbesondere bei schwierigen Themen oder wenn Zitate und URLs angefragt werden.
- Weise das Modell an, für seine Antwort einen Referenztext zu verwenden, oder aus dem Referenztext zu zitieren.
Komplexe Aufgaben in einfache Teilaufgaben zerlegen
- So wie es in der Softwareentwicklung gute Praxis ist, komplexe Systeme in modulare Komponenten zu zerlegen, gilt das auch für Aufgaben, die an Sprachmodelle gestellt werden.
- Komplexe Aufgaben haben eine höhere Fehlerquote und lassen sich oft als Workflow aus einfacheren Aufgaben neu definieren.
- Verwende Intent-Klassifizierung, um die für eine Benutzeranfrage relevantesten Anweisungen zu identifizieren, und fasse bei dialogorientierten Anwendungen, die sehr lange Gespräche erfordern, frühere Unterhaltungen zusammen oder filtere sie.
- Fasse lange Dokumente abschnittsweise zusammen und erstelle rekursiv eine Gesamtsummary.
Dem Modell „Zeit zum Nachdenken“ geben
- Zuverlässigere Antworten lassen sich erzielen, wenn man statt einer überhasteten Antwort vor dem Formulieren der Antwort eine „Gedankenkette“ anfordert.
- Weise das Modell an, zunächst selbst eine Lösung zu erarbeiten, und verwende einen internen Monolog oder eine Reihe von Abfragen, um den Denkprozess des Modells zu verbergen.
- Frage das Modell, ob es in einem vorherigen Durchlauf etwas übersehen hat.
Externe Werkzeuge verwenden
- Gib dem Modell die Ausgaben anderer Werkzeuge, um seine Schwächen auszugleichen.
- Implementiere mit embedding-basierter Suche eine effiziente Wissenssuche, nutze Code-Ausführung für genauere Berechnungen oder rufe externe APIs auf.
- Erlaube dem Modell Zugriff auf bestimmte Funktionen.
Änderungen systematisch testen
- Leistungsverbesserungen sind leichter umzusetzen, wenn sie messbar sind.
- Um zu prüfen, ob sich Änderungen positiv auf die Gesamtleistung auswirken, muss eine umfassende Testsuite (oder „eval“) definiert werden.
- Bewerte die Modellausgaben, indem du sie mit einer Goldstandard-Antwort vergleichst.
Meinung von GN⁺
- Der wichtigste Punkt: Prompt Engineering ist eine zentrale Methode zur Optimierung der Leistung von Sprachmodellen, da es die Absicht der Nutzer präzise erfasst und konkrete Anweisungen liefert, um die gewünschten Ergebnisse zu erzielen.
- Warum das interessant ist: Diese Strategien machen den Einsatz von KI-Sprachmodellen effektiver und ermöglichen insbesondere bei neueren Modellen wie GPT-4 eine noch höhere Leistung.
- Bemerkenswert: Dieser Leitfaden bietet konkrete Beispiele und Strategien, die typischen Problemen begegnen, auf die Junior-Softwareentwickler bei der Nutzung von Sprachmodellen stoßen können, und zeigt so Wege auf, Modelle in der Praxis effektiver einzusetzen.
2 Kommentare
OpenAIs GPT-Best-Practices: Überblick. Sechs Strategien zum Schreiben von Prompts, um bessere Antworten zu erhalten
Hacker-News-Kommentare
Diskussion über den ChatGPT-Systemprompt
Erfahrungsbericht über die Bestellung eines Cheeseburgers auf Spanisch
Diskussion über Eigenschaften von LLMs (Large Language Models)
Zögern beim Lernen des Prompt-Schreibens
Vergleich von Prompt Engineering mit erweiterten Google-Suchanfragen
Vergleich zwischen Google-Suchprompts und LLM-Prompts
Misslingende menschliche Kommunikation und Grenzen von LLMs
Kritik am Begriff "Prompt Engineering"
Die Rolle von LLMs dabei, Menschen klare Kommunikation zu lehren
Die einfache Umsetzung von LLM-basierten Chat-Apps