xLSTMTime: Long-term Time Series Forecasting With xLSTM
- In den letzten Jahren haben Transformer-basierte Modelle bei der multivariaten langfristigen Zeitreihenprognose (LTSF) bemerkenswerte Ergebnisse erzielt. Sie stehen jedoch vor Problemen wie hohem Rechenaufwand, Schwierigkeiten beim Erfassen zeitlicher Dynamiken und der Handhabung langfristiger Abhängigkeiten
- Mit dem Aufkommen von LTSF-Linear mit seiner einfachen linearen Struktur wurden sogar bessere Ergebnisse als mit Transformer-basierten Modellen erzielt, was zu einer Neubewertung des Nutzens von Transformern für die Zeitreihenprognose führte
- Als Reaktion darauf präsentiert diese Arbeit die Ergebnisse der Anwendung der jüngeren Architektur xLSTM (extended LSTM) auf LTSF. xLSTM besitzt mit exponentiellem Gating und einer modifizierten Speicherstruktur mit höherer Kapazität Potenzial für den Einsatz in LTSF
- xLSTMTime, die von uns verwendete LTSF-Architektur, übertrifft bestehende Ansätze. Der Vergleich der Leistung von xLSTMTime mit verschiedenen aktuellen Modellen auf mehreren realen Datensätzen belegt seine überlegene Prognosefähigkeit
- Unsere Ergebnisse deuten darauf hin, dass verfeinerte rekurrente Architekturen bei LTSF-Aufgaben eine wettbewerbsfähige Alternative zu Transformer-basierten Modellen bieten können und das Potenzial haben, die Landschaft der Zeitreihenprognose neu zu definieren
Zusammenfassung von GN⁺
- Diese Arbeit zeigt durch die Einführung von xLSTM starke Leistung bei der langfristigen Zeitreihenprognose und adressiert damit die Grenzen Transformer-basierter Modelle
- xLSTMTime belegt mit exponentiellem Gating und einer modifizierten Speicherstruktur seine überlegene Prognosefähigkeit gegenüber bestehenden Modellen
- Die Studie lenkt den Blick erneut auf das Potenzial rekurrenter Architekturen für die Zeitreihenprognose und präsentiert eine neue Alternative zu Transformer-basierten Modellen
- Projekte mit ähnlicher Funktionalität sind unter anderem Facebooks Prophet und Amazons DeepAR
1 Kommentare
Hacker-News-Kommentare