Representation Engineering, Mistral-7B auf einem Acid Trip
-
Was ist ein Kontrollvektor?
- Ein Kontrollvektor ist ein Vektor (eine Liste von Vektoren pro Schicht), der auf die Modellaktivierungen während der Inferenz angewendet wird und das Verhalten des Modells ohne zusätzlichen Prompt steuert.
- Mit demselben Prompt und Modell erzeugt derselbe Kontrollvektor unterschiedliche Ergebnisse, je nachdem, ob er angewendet wird und wie stark.
-
Die Erstellung eines Kontrollvektors ist nicht schwierig
- Es wird ein Datensatz mit kontrastierenden Prompt-Paaren über PCA aufgebaut, das Modell wird ausgeführt, um die verborgenen Zustände jeder Schicht zu sammeln, und anschließend wird pro Schicht mithilfe von PCA mit einer einzelnen Komponente der Kontrollvektor berechnet.
- Dieser Vorgang braucht nur wenige Zeilen Code und etwa eine Minute.
-
Was man mit Kontrollvektoren machen kann
- Mit Kontrollvektoren kann ein KI-Modell in einen Zustand wie einen „Acid Trip“ oder in Modi wie "Faulheit", "Fleiß" und „Kreativität“ versetzt werden.
- Jeder Kontrollvektor lässt sich in wenigen Minuten trainieren und kann direkt über ein Experiment-Notebook auf GitHub ausprobiert werden.
-
Kontrollvektor gegen Prompt Engineering
- Kontrollvektor und Prompt Engineering sind unterschiedliche Ansätze, überlappen aber in manchen Bereichen.
- Kontrollvektoren können Ergebnisse erzeugen, die durch Prompt Engineering repliziert werden können, wobei die Intensität jedoch leichter einstellbar ist.
GN⁺-Meinung
- Bedeutung von Kontrollvektoren: Kontrollvektoren sind ein leistungsfähiges Werkzeug, um das Verhalten von KI-Modellen fein zu justieren, und eröffnen neue Möglichkeiten, die über die Grenzen des Prompt Engineerings hinausgehen.
- Effizienz und Zugänglichkeit: Durch Kontrollvektoren können Nutzer das Verhalten von Modellen leicht anpassen, ohne komplizierte Prompt-Konstruktionen zu verwenden, was die Nutzbarkeit von KI erheblich verbessern kann.
- Kreative Nutzung: Die Verwendung von Kontrollvektoren, um KI in einen Zustand wie einen „Acid Trip" zu versetzen, ermöglicht neue Dimensionen experimenteller Ansätze in der KI-Forschung.
1 Kommentare
Hacker News Kommentare