MIT-Forschende demonstrieren Technik zur Wissenssuche in großen Sprachmodellen
- Es wurde entdeckt, dass große Sprachmodelle beim Beantworten von Nutzer-Prompts einen einfachen Mechanismus verwenden, um gespeichertes Wissen abzurufen.
- Die Forschenden können diesen einfachen Mechanismus nutzen, um herauszufinden, was das Modell über verschiedene Themen weiß, und falsch gespeicherte Informationen zu korrigieren.
Die Komplexität großer Sprachmodelle
- Große Sprachmodelle werden in vielen Bereichen eingesetzt, etwa im Kundensupport, bei der Code-Generierung und in der Sprachübersetzung, doch ihre Funktionsweise ist noch nicht vollständig verstanden.
- Forschende von MIT und anderen Institutionen untersuchten den Mechanismus, mit dem diese riesigen Machine-Learning-Modelle gespeichertes Wissen abrufen.
Ein einfacher Mechanismus zum Wissensabruf
- Die Forschungsergebnisse zeigen, dass große Sprachmodelle häufig eine einfache lineare Funktion verwenden, um gespeicherte Fakten wiederzufinden und zu entschlüsseln.
- Das Modell verwendet für ähnliche Arten von Fakten dieselbe Entschlüsselungsfunktion.
- Eine lineare Funktion ist eine Gleichung, die eine geradlinige Beziehung zwischen zwei Variablen darstellt.
Erkunden, was das Modell weiß
- Durch die Identifizierung linearer Funktionen für verschiedene Fakten erkundeten die Forschenden, was das Modell über neue Themen weiß, und stellten fest, wo dieses Wissen im Modell gespeichert ist.
- Mithilfe der entwickelten Technik und der geschätzten einfachen Funktionen fanden sie heraus, dass das Modell selbst dann oft die richtigen Informationen gespeichert hat, wenn es falsche Antworten gibt.
Visualisierung des Wissens im Modell
- Die Forschenden nutzten die Funktionen, um zu bestimmen, was das Modell über verschiedene Themen tatsächlich für wahr hält.
- Sie begannen zum Beispiel mit dem Prompt „Bill Bradley was a“ und verwendeten Entschlüsselungsfunktionen für „plays sports“ und „attended university“, um zu prüfen, ob das Modell weiß, dass Bradley Basketballspieler war und die Princeton University besucht hat.
- Mit dieser Erkundungstechnik erstellten sie ein Raster namens „Attribut-Linse“, das visualisiert, wo Informationen zu bestimmten Beziehungen in den verschiedenen Schichten des Transformers gespeichert sind.
Meinung von GN⁺
- Diese Forschung verbessert das Verständnis dafür, wie große Sprachmodelle faktisches Wissen speichern und abrufen, einen deutlichen Schritt weiter.
- Die Ergebnisse deuten darauf hin, dass sich Wissen korrigieren und Fehler von AI-Chatbots verhindern lassen könnten, um die Tendenz der Modelle zur Ausgabe falscher Informationen zu verringern.
- Wenn diese Technik eingesetzt wird, könnte sie zur Verbesserung der Zuverlässigkeit von AI beitragen und die Nutzererfahrung verbessern.
- Da jedoch nicht alle Fakten linear codiert sind, ist weitere Forschung nötig, um zu klären, ob diese Technik auf alle Arten des Wissensabrufs angewendet werden kann.
- Als Open-Source-Projekte mit ähnlicher Funktionalität werden Googles BERT und die GPT-Serie von OpenAI genannt; auch sie tragen zum Verständnis der Funktionsweise großer Sprachmodelle bei.
- Bei der Einführung neuer Technologien muss das Gleichgewicht zwischen der Komplexität des Modells und seiner Interpretierbarkeit berücksichtigt werden; ein möglicher Vorteil dieser Technik wäre eine höhere Genauigkeit und Zuverlässigkeit des Modells.
1 Kommentare
Hacker-News-Kommentare
Diese erstaunliche Arbeit hebt einige der größten aktuellen Probleme im Bereich AI hervor
Die Struktur der Sprache macht Word2Vec möglich
Hilft zu verstehen, was es bedeutet, dass Fakten als lineare Funktionen gespeichert werden
Neugier auf die Arten von Funktionen, die zum Kodieren von Programmierwissen verwendet werden
Ähnlichkeit zu dem, was Beziehungsvektoren in Word2Vec tun
LLMs wirken wie ein guter Komprimierungsmechanismus
Erinnert an das Embedding-Beispiel "King - Man + Woman = Queen"
Es ist schwer zu verstehen, wie eine "CSV-Datei/Datenbank/ein Modell" mit 7 Milliarden "Parametern" ein wissensreiches interaktives LLM/GPT zu fast jedem Thema liefern kann
Gefällt, dass dieses Paper cool ist und Experimente durchgeführt hat, um diese Ideen zu validieren
Die Möglichkeit, den Schlussfolgerungsteil vom Informationsteil zu trennen