Wie schnell lernen große Sprachmodelle unerwartete Fähigkeiten?
- Neue Forschung zu den Fähigkeiten großer Sprachmodelle (Large Language Models, LLMs) legt nahe, dass sogenannte „plötzliche Sprungfähigkeiten“ sich in Wirklichkeit schrittweise und vorhersagbar entwickeln.
- Forschende beschrieben diese Fähigkeiten als „emergentes“ Verhalten und verglichen sie mit einem Phasenübergang in der Physik, etwa wenn Flüssigkeit zu Eis wird.
- Ein Forschungsteam der Stanford University argumentiert jedoch, dass das scheinbar plötzliche Auftreten dieser Fähigkeiten lediglich ein Ergebnis der Art ist, wie Forschende die Leistung von LLMs messen.
Messung der Leistung großer Sprachmodelle
- Große Sprachmodelle analysieren riesige Textdatensätze, um Verbindungen zwischen Wörtern zu finden, die häufig gemeinsam auftreten.
- Die Größe eines Modells wird an der Zahl seiner Parameter gemessen; je mehr Parameter, desto mehr Verbindungen kann ein LLM finden.
- GPT-2 hatte 1,5 Milliarden Parameter, GPT-3.5 350 Milliarden und GPT-4 verwendet 1,75 Billionen Parameter.
Die schrittweise Entwicklung unerwarteter Fähigkeiten
- Das Stanford-Team argumentiert, dass die Fähigkeiten von LLMs nicht plötzlich und unvorhersagbar auftreten, sondern sich schrittweise und vorhersagbar entwickeln.
- Beim Addieren dreistelliger Zahlen etwa scheiterten GPT-3 und LaMDA mit wenigen Parametern an korrekten Berechnungen, konnten aber mit steigender Parameterzahl scheinbar plötzlich addieren.
- Statt LLMs nur anhand der Genauigkeit zu bewerten, nutzte das Team ein Messverfahren mit Teilpunkten und stellte fest, dass LLMs schrittweise lernten, die richtige Reihenfolge der Ziffern vorherzusagen.
Ansichten anderer Wissenschaftler
- Andere Wissenschaftler weisen darauf hin, dass diese Studie das Konzept der „plötzlichen Sprünge“ nicht vollständig ausräumt.
- Es bleibt weiterhin unklar, welche Messgrößen geeignet sind oder wie sich vorhersagen lässt, wann sich die Leistung eines LLM sprunghaft verbessern wird.
- Einige Wissenschaftler argumentieren, dass frühere Berichte über „plötzliche Sprünge“ korrekt waren, und betonen, dass bei Fähigkeiten wie Arithmetik letztlich nur die richtige Antwort zählt.
Meinung von GN⁺
- Diese Studie könnte wichtige Auswirkungen auf die Diskussion über die Sicherheit und potenziellen Risiken von künstlicher Intelligenz haben. Wenn sich die Fähigkeiten von LLMs vorhersagbar entwickeln, könnte das ein wichtiger Indikator für die sichere Entwicklung und Steuerung von AI sein.
- Wenn die Forschungsergebnisse in die praktische AI-Entwicklung einfließen, müssen Entwickler die Bedeutung der Leistungsmessung stärker berücksichtigen und ausgefeiltere Evaluierungsmethoden entwerfen.
- Der Artikel kann helfen, die Veränderungen und Fortschritte an der Front der AI-Forschung zu verstehen, insbesondere indem er eine neue Perspektive auf die Bewertung der Leistung von AI-Modellen bietet.
- Aus kritischer Sicht ist anzuerkennen, dass die Ergebnisse nicht jede Leistungssteigerung von LLMs erklären und dass bei größeren und komplexeren Modellen weiterhin Phänomene „plötzlicher Sprünge“ auftreten könnten.
- In diesem Zusammenhang sind die GPT-Modelle von OpenAI bereits breit im Markt im Einsatz, und diese Forschung könnte die Entwicklung anderer GPT-ähnlicher LLMs inspirieren.
1 Kommentare
Hacker-News-Kommentare
Einige Probleme im Zusammenhang mit der Studie
Die Schwierigkeit von Zukunftsprognosen
Veränderungen der Ergebnisse durch geänderte Messkriterien
Titel der Arbeit: "Are Emergent Abilities of Large Language Models a Mirage?"
Beobachtungen zu sprunghaften Veränderungen von Fähigkeiten
Der Ansatz mit Teilpunkten und das Training von Modellen
Das allmähliche Entstehen von Fähigkeiten
Grenzen von Large Language Models (LLMs)
Verwirrung über Messkriterien