Einführung
- Dieser Beitrag untersucht, wie kleine Sprachmodelle das nächste Token vorhersagen.
- Statt sich auf den Self-Attention-Mechanismus von Transformer-Modellen zu konzentrieren, bietet er eine Erklärung dafür, wie die Ergebnisse der Aufmerksamkeitsberechnung in präzise Vorhersagen des nächsten Tokens umgewandelt werden.
- Der Autor untersucht die internen Zustände anhand eines funktionierenden kleinen Transformers und teilt wertvolle Ergebnisse aus einer sechsmonatigen intensiven Analyse.
Struktur des Transformer-Blocks
- Ein Transformer-Block besteht aus einer Multi-Head-Self-Attention-Schicht und einem Feedforward-Netzwerk.
- Die Ausgabe des Feedforward-Netzwerks ist der entscheidende Faktor dafür, wie der Block Eingaben in Ausgaben umwandelt.
Vorschlag: Wie Transformer funktionieren
- Jeder Transformer-Block lernt Gewichte, die einen gegebenen Prompt mit Klassen von Zeichenketten in den Trainingsdaten verknüpfen.
- Die Verteilung der Tokens, die auf diese Zeichenkettenklassen folgen, stimmt grob mit dem überein, was der Block als Vorhersage für das nächste Token ausgibt.
Umsetzung: Approximation der Transformer-Ausgabe mithilfe der Ausgabe des Feedforward-Netzwerks
- Der Autor stellt ein konkretes Verfahren vor, um die Ausgabe eines Transformers mithilfe der Ausgabe des Feedforward-Netzwerks zu approximieren.
- Das Verfahren beginnt damit, den Prompt durch das Modell laufen zu lassen und die Ausgaben des Feedforward-Netzwerks für jeden Block zu speichern.
- Anschließend werden in den Trainingsdaten Zeichenketten gesucht, die ähnliche Ausgaben des Feedforward-Netzwerks erzeugen, und es wird eine Häufigkeitsverteilung der Tokens aufgebaut, die auf diese Zeichenketten folgen.
- Diese Verteilungen werden gewichtet aufsummiert und normalisiert, um die finale Wahrscheinlichkeitsverteilung zu erhalten.
Meinung von GN⁺
- Diese Untersuchung vermittelt ein tiefes Verständnis der internen Funktionsweise von Transformer-Modellen. Besonders die Einblicke in die Prozesse nach der Self-Attention sind wichtig, um den Vorhersagemechanismus von Transformer-Modellen zu verstehen.
- Der Ansatz des Autors liefert eine klare Erklärung dafür, wie Transformer Muster in Trainingsdaten erkennen und auf dieser Grundlage das nächste Token vorhersagen.
- Der Beitrag kann für Menschen, die Transformer-Modelle erforschen oder entwickeln, eine nützliche Ressource sein und dazu beitragen, das Verständnis im Bereich der KI-gestützten Sprachverarbeitung zu vertiefen.
1 Kommentare
Hacker-News-Kommentare
Über neue Phänomene sollte man nicht überrascht sein. Wenn man die bereits etablierten Theorien nicht liest, kann man über natürlich auftretende Phänomene leicht verwirrt sein.
Positive Reaktion darauf, dass nach Googles Hinweis, ChatGPT gebe bei Wiederholung desselben Wortes seine Trainingsdaten wortwörtlich aus, jemand das tatsächlich umgesetzt hat.
Überraschung darüber, dass Attention- und FF-(Feed-Forward-)Netzwerke in dieselbe Richtung zeigen.
Beim Training eines kleinen Modells nach Andrej Karpathys NanoGPT-Tutorial schien dieses komplexe russische Grammatik bis zu einem gewissen Grad zu verstehen.
Frage, ob ein LLM ein Textgenerator auf Basis einer Markov-Kette ist.
Das untersuchte Modell ist in Wirklichkeit nur ein einfaches Spielzeugmodell und könnte auch mit einem noch einfacheren Modell approximiert werden.
Es ist schwer, genau zu verstehen, was der Autor behaupten will.
Die 3D-Visualisierung des LLM-Systems ist hilfreich und sollte für maximale Wirkung zusammen mit dem Text gelesen werden.
Ein merkwürdiger Beitrag darüber, was Transformer tatsächlich tun.