-
Ob LLMs wirklich „vergessen“
- Große Sprachmodelle (LLMs) werden mit riesigen Textdatensätzen trainiert und zeigen hervorragende Fähigkeiten zur Textgenerierung
- Aufgrund der sensiblen Eigenschaften der Trainingsdaten können sie jedoch unerwünschte Verhaltensweisen erlernen
- Maschinelles „Vergessen“ ist ein Ansatz zur Lösung dieses Problems und zielt darauf ab, bestimmtes Wissen zu entfernen, während die Nützlichkeit des Modells so weit wie möglich erhalten bleibt
-
Problemstellung und Forschungsinhalt
- Es gibt bislang wenig Forschung dazu, ob aktuelle „Vergessens“-Methoden Wissen tatsächlich vergessen lassen oder es nur verbergen
- Diese Studie zeigt, dass sich „vergessene“ Informationen durch Quantisierung wiederherstellen lassen
- Mit verschiedenen Quantisierungstechniken wurden Experimente auf mehreren Präzisionsniveaus durchgeführt
-
Experimentelle Ergebnisse
- Bei „Vergessens“-Methoden mit Nützlichkeitsbeschränkungen behielt das Modell in voller Präzision im Durchschnitt 21 % des beabsichtigt vergessenen Wissens
- Nach einer 4-Bit-Quantisierung stieg dieser Anteil auf 83 %
-
Vorgeschlagene Strategie
- Es wird eine theoretische Erklärung für dieses Phänomen geliefert
- Vorgeschlagen wird eine gegen Quantisierung robuste „Vergessens“-Strategie, um das komplexe Problem abzumildern
-
Bedeutung der Forschung
- Die Arbeit leistet einen wichtigen Beitrag zur Bewertung und Verbesserung der Wirksamkeit von „Vergessens“-Methoden für LLMs
- Sie hilft dabei, die Auswirkungen von Quantisierung auf das „Vergessen“ zu verstehen
1 Kommentare
Hacker-News-Kommentar