- Ein von Google Research entwickeltes Foundation Model für Zeitreihenprognosen
- Vorab trainiert mit 100 Milliarden realen Zeitreihen-Datenpunkten
- Zeigt starke Zero-Shot-Leistung in verschiedenen öffentlichen Benchmarks
- Auf Datensätze aus unterschiedlichen Domänen und mit verschiedenen Zeitgranularitäten anwendbar
- Zeitreihenprognosen werden breit in unterschiedlichen Bereichen genutzt, etwa im Einzelhandel, Finanzwesen, in der Fertigung, im Gesundheitswesen und in den Naturwissenschaften
- Zum Beispiel kann eine höhere Genauigkeit bei der Nachfrageprognose im Einzelhandel zur Senkung der Lagerkosten und zur Steigerung der Umsätze beitragen
- Der Aufstieg von Deep-Learning-Modellen
- Deep-Learning-Modelle, die in verschiedenen Settings eine starke Leistung bewiesen haben, werden breit für Zeitreihenprognosen eingesetzt
- Auch im M5-Wettbewerb erzielten Deep-Learning-Modelle gute Ergebnisse
- Fortschritte bei Large Language Models
- Large Language Models, die für NLP-Aufgaben wie Übersetzung, Retrieval-augmented Generation und Code-Vervollständigung genutzt werden, entwickeln sich rasant weiter
- Sie werden mit großen Mengen an Textdaten trainiert und sind in der Lage, Sprachmuster zu erkennen
- In Kombination mit Suche lassen sie sich als leistungsstarke Zero-Shot-Tools einsetzen, um Fragen zu aktuellen Ereignissen zu beantworten und Zusammenfassungen zu erstellen
- Grenzen von Deep-Learning-basierten Prognosemodellen
- Sie zeigen zwar bessere Leistungen als traditionelle Methoden, doch die Senkung von Trainings- und Inferenzkosten bleibt schwierig
- Bevor ein Modell an neuen Zeitreihendaten getestet werden kann, sind lange Trainings- und Validierungszyklen erforderlich
- TimesFM ist ein decoder-only Foundation Model für Zeitreihenprognosen
- Ein einzelnes Prognosemodell, das mit 100 Milliarden realen Zeitreihendatenpunkten vorab trainiert wurde
- Es besitzt 2 Millionen Parameter und ist damit deutlich kleiner als moderne Large Language Models
- Für Datensätze aus verschiedenen Domänen und mit unterschiedlichen Zeitgranularitäten zeigt es im Zero-Shot-Modus eine Leistung nahe an modernen überwachten Lernansätzen
- Liefert ohne zusätzliches Training sofort sinnvolle Prognosen für bislang unbekannte Zeitreihendaten
- Ermöglicht es Nutzern, sich auf die Verbesserung von Prognosen für reale Downstream-Aufgaben wie die Nachfrageplanung im Einzelhandel zu konzentrieren
- Paper: "A decoder-only foundation model for time-series forecasting", geplant zur Präsentation auf der ICML 2024
Meinung von GN⁺
- Es wirkt wie ein vielversprechendes neues Modell für Zeitreihenprognosen, benötigt aber offenbar noch Validierung für verschiedene reale Anwendungsfälle. Insbesondere ist es aus praktischer Sicht schade, dass probabilistische Prognosen noch nicht unterstützt werden
- Interessant ist, dass der als Eingabe gegebene Frequenzwert nicht die tatsächliche Frequenz der Zeitreihendaten widerspiegeln muss, sondern beliebig angepasst werden kann. Welcher Wert optimal ist, dürfte jedoch je nach Daten und Anwendungsfall experimentell ermittelt werden müssen
- Der erste veröffentlichte Checkpoint fokussiert sich auf univariate Daten, daher wäre auch eine Version für multivariate Prognosen wünschenswert. Zudem scheint ein Leistungsvergleich auf Benchmark-Datensätzen für multivariate Zeitreihenprognosen nötig
- Für die Einführung dieses Modells wird Fachpersonal nötig sein, das je nach Eigenschaften der Ziel-Zeitreihe (Länge, Verteilung, Saisonalität, Frequenz usw.) und dem erforderlichen Prognosehorizont das Modell auswählen und abstimmen kann. Die Bereitstellung einer End-to-End-Inferenz-API scheint die Nutzung zu erleichtern, dennoch sollten auch die Grenzen eines Blackbox-Modells berücksichtigt werden
- Ähnliche andere Bibliotheken für Zeitreihenprognosen sind etwa Meta's Kats, GluonTS, Darts und sktime. Es ist sinnvoll, die Eigenschaften sowie Vor- und Nachteile der einzelnen Bibliotheken zu vergleichen und anschließend das für die realen Daten am besten geeignete Modell auszuwählen
Noch keine Kommentare.