- Eine Arbeit über eine neue Methode zur Verbesserung des Langzeitgedächtnisses großer Sprachmodelle (LLMs), die in offenen Dialogsystemen eingesetzt werden
- Ein zentrales Problem offener Dialogsysteme ist, dass sie in langen Gesprächen wichtige Informationen vergessen
- Bisherige Lösungsansätze trainieren spezielle Retriever oder Zusammenfasser, um Kerninformationen aus Gesprächsinhalten zu gewinnen, doch das ist zeitaufwendig und stark von der Qualität gelabelter Daten abhängig
- Die vorgeschlagene Methode versucht, dieses Problem zu entschärfen, indem sie mit LLMs rekursiv Zusammenfassungen oder Erinnerungen erzeugt
- Dabei lässt die Methode LLMs zunächst kleine Gesprächskontexte behalten und erzeugt dann rekursiv neue Erinnerungen unter Verwendung früherer Erinnerungen und späterer Kontexte
- Mit Hilfe der neuesten Erinnerung kann das LLM sehr konsistente Antworten erzeugen
- Die Methode wurde mit ChatGPT und text-davinci-003 evaluiert; Experimente auf weit verbreiteten öffentlichen Datensätzen zeigen, dass sie in Dialogen mit langem Kontext konsistentere Antworten erzeugen kann
- Diese Methode ist eine potenzielle Lösung, die es LLMs ermöglicht, extrem lange Kontexte zu modellieren
- Code und Skripte für diese Methode sollen künftig veröffentlicht werden
- Diese Forschung wurde von der Simons Foundation, Mitgliedsinstitutionen und allen Mitwirkenden unterstützt
1 Kommentare
Hacker-News-Kommentare