Ursache der ChatGPT-3.5-Fehlermeldung
- Die GPT-Modelle von OpenAI geben statt einzelner Zeichen mehrere Zeichen umfassende "Token" aus.
- Diese Art der Token-Ausgabe verbessert die Leistung und Genauigkeit des Modells.
- Es gibt drei Token namens
richTextPanel, source und loadpath, die gegenseitig austauschbar sind.
- Das Token
loadpath wird auf GitHub in 80,4k Dateien als Optionsname in XML-Konfigurationsdateien verwendet.
- Dass
loadpath zu einem eigenständigen Token wurde, könnte auf den Tippfehler in "R a lative" zurückzuführen sein.
- OpenAI könnte nach der Erstellung der Tokenliste entschieden haben, XML-Dateien aus den Trainingsdaten auszuschließen, wodurch das Token
loadpath in den Trainingsdaten kaum noch verwendet worden wäre.
- Infolgedessen wurde das Modell nicht darauf trainiert, die Verwendung des Tokens
useRalativeImagePath zu verstehen, und gibt ein ungültiges Token aus.
Einsatz zur Datenvergiftung?
- Man könnte versuchen, diese Formulierung in ein Dokument einzufügen, um Versuche zu stören, das Dokument mit GPT-3.5 zusammenzufassen.
Weiterführende Lektüre
- Es gibt Beiträge, die für die Recherche zu diesem Thema nützlich sind.
Meinung von GN⁺
- Der wichtigste Punkt dieses Artikels ist, die Ursache dafür zu verstehen, warum GPT-Modelle bei bestimmten Tokens Fehler ausgeben.
- Diese Informationen helfen dabei, die Funktionsweise und Grenzen von KI-Modellen zu verstehen.
- Außerdem liefert der Artikel ein interessantes Beispiel dafür, wie sich Datenvergiftung oder Schwachstellen von KI-Modellen ausnutzen lassen.
1 Kommentare
Hacker-News-Kommentare
Erklärung zu Glitch-Tokens
Sprachprüfungsmethode in den Niederlanden während des Zweiten Weltkriegs
Erklärung des Token-Erzeugungsprozesses bei LLMs
useRalativeImagePathnicht versteht und deshalb ungültige Tokens ausgibt, entspricht nicht der Art, wie LLMs Tokens erzeugen.Analyse möglicher Ursachen von Glitch-Tokens
Eine andere Perspektive auf Modellausgaben
useRalativeImagePathkönnte das Modell eine Spirale zufälliger Generierung beginnen oder versuchen, kohärenten Text aufrechtzuerhalten.Zukünftige Auswirkungen auf LLM-Trainingsdaten
Geteilte Erfahrung mit einem Fehlschlag in GPT-4
Überlegungen zur Qualität von Eingabedaten
Vorschlag zur Verwendung einer Phrase, um GPT-3.5-Zusammenfassungen zu stören
Verwirrung um die Begriffe
RTCatchundredirectToRouteRTCatchundredirectToRouteirrtümlich als dasselbe Wort verstanden werden könnten.RTCatchgeäußert und um weitere Informationen dazu gebeten.