Hypothese des universellen Gewichtsteilraums

(arxiv.org)

2 Punkte von GN⁺ 2025-12-11 | Noch keine Kommentare. | Auf WhatsApp teilen

Verschiedene Deep-Learning-Modelle konvergieren trotz unterschiedlicher Daten und Initialwerte zu einem gemeinsamen niederdimensionalen Parameter-Teilraum, was durch umfangreiche Experimente bestätigt wurde
Die Spektralanalyse von über 1.100 Modellen (500 Mistral-7B LoRA, 500 Vision Transformer, 50 LLaMA-8B usw.) zeigte, dass sich der Großteil der Varianz auf nur wenige Hauptkomponentenrichtungen konzentriert
Solche universellen Teilräume (Universal Subspace) entstehen in Abhängigkeit von der Modellstruktur und treten unabhängig von Daten oder Initialisierung wiederholt auf
Diese Struktur hat großes Potenzial für Modellkomprimierung, parameter-effizientes Lernen, Modellzusammenführung und schnelle Inferenz
Die Studie bietet Hinweise zum neuen Verständnis der inhärenten Struktur und Generalisierungsfähigkeit von neuronalen Netzen und kann eine wichtige Grundlage für die Gestaltung effizienter Lernalgorithmen in der Zukunft werden

Entdeckung universeller Teilräume

Es wurde beobachtet, dass Deep-Learning-Netzwerke, die mit unterschiedlichen Datensätzen, Initialisierungen und Hyperparametern trainiert wurden, zu einem gemeinsamen niederdimensionalen Teilraum konvergieren
- Dieses Phänomen tritt als ähnliche Low-Rank-Struktur auf Architekturebene und Schichtebene auf
- Auch bei unterschiedlichen Trainingsdaten oder Verlustfunktionen zeigt sich derselbe strukturelle Trend
Ergebnisse der Spektralanalyse zeigen, dass die Gewichtsräume einzelner Aufgaben zwar unterschiedlich wirken, tatsächlich aber als Teil eines gemeinsamen niederdimensionalen Raums existieren
Diese Ergebnisse liefern eine Begründung dafür, warum überangepasste Modelle generalisieren, warum verschiedene Initialisierungen zu ähnlichen Darstellungen konvergieren und warum parameter-effizientes Fine-Tuning erfolgreich ist

Die Studie analysierte mehr als 1.100 Modelle, darunter 500 Mistral-7B-LoRA-Adapter, 500 Vision Transformer und 50 LLaMA3-8B-Modelle
- Jedes Modell wurde mit verschiedenen Datensätzen und Initialisierungsbedingungen trainiert
Die Hauptkomponentenanalyse (PCA) zeigte, dass eine kleine Zahl von Hauptkomponenten den Großteil der Varianz erklärt, was auf einen gemeinsamen nieder-rankigen Teilraum hindeutet
Bemerkenswert ist, dass selbst 500 zufällig initialisierte ViT-Modelle zu demselben niederdimensionalen Teilraum konvergieren, was als grundlegende Eigenschaft neuronaler Netze interpretiert wird

Die Studie modelliert Vorhersagefunktionen als Elemente in einem Hilbertraum und analysiert die Bedingungen für die Wiederherstellung gemeinsamer Teilräume zwischen mehreren Aufgaben
Für jeden prädiktiven Ansatz ( f_t^* ) wird ein gemeinsamer Operator der zweiten Momente S definiert und gezeigt, dass der angenäherte Operator ( \tilde{S} ), der von den gelernten Prädiktoren ( \hat{f_t} ) abgeleitet wird, gegen ( S ) konvergiert
Theorem 2.5 zeigt, dass der gelernte Teilraum gegen den tatsächlichen gemeinsamen Teilraum konvergiert und dass die Konvergenzgeschwindigkeit durch die Anzahl der Aufgaben ((T)) und die Schätzgenauigkeit jeder Aufgabe ((\eta)) bestimmt wird
Je größer die Eigenwertabstände ((\gamma_k)), desto stabiler ist die Wiederherstellung des Teilraums

Die Nutzung des gemeinsamen Teilraums ermöglicht folgende Anwendungen
- Teilraum-Koeffizienten statt ganzer Gewichte speichern für Modellkomprimierung
- Schnelle Anpassung an neue Aufgaben innerhalb des gelernten Teilraums
- Bereitstellung theoretischer Einsichten zu Verallgemeinerungsgrenzen und Optimierungslandschaften
- Reduzierung des Rechenaufwands bei Training und Inferenz und damit potenziell geringere CO₂-Emissionen
Diese Struktur kann auch die Effizienz von Modellwiederverwendung, Multi-Task-Lernen und Modellfusion steigern

Die Unterschiede zwischen universellen Teilräumen über Architekturen hinweg und deren geometrischer Optimierungsfähigkeit bleiben ungelöst
Wenn alle Netze in denselben Teilraum konvergieren, kann ein neuer Engpass durch mangelnde Vielfalt durch geteilte Voreingenommenheit und gemeinsame Fehlermuster entstehen
Zukünftige Forschung sollte Methoden entwickeln, die diese Konvergenz bewusst diversifizieren

Die Existenz eines universellen niederdimensionalen Teilraums im Parameterraum von Deep-Learning-Netzwerken wird empirisch bestätigt
Ein Lernverfahren für die Approximation gemeinsamer Teilräume aus unterschiedlichen Aufgabensätzen wird vorgeschlagen
Es wird nachgewiesen, dass sich mit dem gelernten Teilraum effizient auf neue Aufgaben mit wenigen Parametern angepasst werden kann
Die Nutzbarkeit für Modellkomprimierung, schnelles Lernen und Inferenz sowie effizientes Skalieren wird aufgezeigt