- WeatherNext 2 ist ein KI-basiertes Modell, das Genauigkeit und Effizienz globaler Wettervorhersagen deutlich verbessert
- Es erzeugt auf einer einzelnen TPU in weniger als einer Minute Hunderte von Wetterszenarien und bietet eine 8-fach schnellere Vorhersagegeschwindigkeit als bestehende Modelle
- Durch die neue Functional Generative Network (FGN)-Architektur bleiben die Vorhersagen physikalisch konsistent und unterstützen eine stündliche Auflösung
- Die Vorhersagedaten sind über Earth Engine und BigQuery verfügbar, und über das Early-Access-Programm von Vertex AI werden Funktionen für benutzerdefinierte Inferenz bereitgestellt
- Die Technologie wertet Wetterfunktionen in Googles Diensten wie Search, Gemini, Pixel Weather und der Google Maps Platform auf
Überblick über WeatherNext 2
- Google DeepMind und Google Research haben WeatherNext 2 gemeinsam entwickelt, ein KI-basiertes Wettervorhersagemodell, das im Vergleich zu bisherigen Ansätzen eine 8-fach höhere Geschwindigkeit und eine stündliche Auflösung bietet
- Aus einer einzelnen Eingabe erzeugt es Hunderte möglicher Wetterszenarien
- Die Vorhersage wird auf einer einzelnen TPU in weniger als einer Minute abgeschlossen, während bestehende physikbasierte Supercomputer-Modelle mehrere Stunden benötigen
- Das Modell zeigt bei 99,9 % der Variablen und Vorhersagehorizonte (0 bis 15 Tage) bessere Leistung als frühere Modelle, etwa bei Temperatur, Windgeschwindigkeit und Luftfeuchtigkeit
- WeatherNext 2 ermöglicht hochauflösende Vorhersagen für die gesamte Erde und wird auch zur Unterstützung von Entscheidungen in Wetterdiensten eingesetzt
Neuer Ansatz für KI-Modellierung
- WeatherNext 2 verwendet einen neuen KI-Modellierungsansatz namens Functional Generative Network (FGN)
- Dabei wird der Modellarchitektur direkt „Rauschen“ injiziert, damit die Vorhersageergebnisse physikalisch realistisch und miteinander verknüpft bleiben
- Dieser Ansatz ist sowohl für „marginale“ als auch „gemeinsame“ (joint) Vorhersagen nützlich
- Marginal bezieht sich auf einzelne Elemente, etwa die Temperatur an einem bestimmten Ort, Windgeschwindigkeit nach Höhe oder Luftfeuchtigkeit
- Joint bezieht sich auf großskalige Wettersysteme, in denen mehrere Elemente zusammenwirken, und ist entscheidend für die Analyse komplexer Phänomene wie Hitzewellengebiete oder die Prognose von Windstromerträgen
- Das Modell wird nur mit marginalen Daten trainiert, lernt jedoch selbstständig gemeinsame Muster und erstellt dadurch komplexe Vorhersagen
Datenzugang und Nutzung
- Die Vorhersagedaten von WeatherNext 2 werden in Google Earth Engine und BigQuery veröffentlicht
- Sie sind über den Earth Engine Data Catalog und den BigQuery Analytics Hub abrufbar
- In Google Cloud Vertex AI werden über ein Early-Access-Programm Funktionen für benutzerdefinierte Modellinferenz bereitgestellt
- Die Technologie ist in Search, Gemini, Pixel Weather und die Weather API der Google Maps Platform integriert und soll künftig auch in die Wetterinformationsfunktionen von Google Maps einfließen
Von der Forschung in die Praxis
- WeatherNext 2 ist ein Beispiel dafür, wie Forschungsergebnisse in reale Anwendungen überführt werden
- Google öffnet mit dieser Technologie Tools und Daten, damit Forschende, Entwickler und Unternehmen weltweit sie zur Lösung komplexer Probleme nutzen können
- Künftig soll die Modellleistung durch die Integration neuer Datenquellen und eine breitere Zugänglichkeit kontinuierlich verbessert werden
- Google verknüpft dies mit Earth Engine, AlphaEarth Foundations und Earth AI, um das geospatiale KI-Forschungsökosystem weiter zu stärken
Weiteres Material
- Das zu WeatherNext 2 gehörende Paper (arXiv: 2506.10772) wurde veröffentlicht
- Es gibt Entwicklerdokumentation, einen Earth Engine Data Catalog, BigQuery-Abfragebeispiele und eine Anmeldeseite für den Vertex-AI-Early-Access
- Als verwandte Modelle werden außerdem GenCast (Vorhersage extremer Wetterereignisse) und GraphCast (schnelle globale Wettervorhersage) vorgestellt
1 Kommentare
Hacker-News-Kommentare
Ich bin ziemlich tief in diesem Thema drin, und ein Punkt, den Außenstehende interessant finden könnten, ist, dass moderne Modelle wie neuralgcm oder WeatherNext 1 alle mit einer Zielfunktion namens CRPS trainiert werden.
Diese Methode wird im allgemeinen ML-Bereich fast nie verwendet; ich habe sie nur in der Wettervorhersage gesehen.
Kurz gesagt fügt man dem Input zufälliges Rauschen hinzu und trainiert das Modell so, dass es einen normalen Loss (L1 usw.) minimiert und gleichzeitig den Unterschied zwischen zwei Ergebnissen maximiert, die mit unterschiedlichen anfänglichen Rauschwerten erzeugt wurden.
Ich frage mich, ob so ein Ansatz irgendwann auch in klassischer GenAI eingesetzt wird.
Das erinnert mich an das Paper zu Variational Noise.
Falls das Rauschen dem Input hinzugefügt wird, klingt das eher nach SSL-Techniken wie DINO.
Das hatte nichts mit GenAI zu tun, aber dieser CRPS-Ansatz wäre dafür vielleicht hilfreich gewesen.
Mir ist aufgefallen, dass die lokale Wettervorhersage in der Google-Suche in letzter Zeit deutlich ungenauer geworden ist.
Seit einigen Wochen wurde immer wieder vorhergesagt, dass die Nachttemperaturen unter null fallen würden, tatsächlich ist das aber nicht passiert.
Meine Region ist zwar schwer vorherzusagen, aber andere Nicht-Google-Quellen waren deutlich genauer.
Ich frage mich, ob der Rollout des neuen Modells schon erfolgt ist und die Vorhersagen dadurch schlechter geworden sind oder ob umgekehrt bald eine Verbesserung zu erwarten ist.
Mich würde auch interessieren, ob es eine Website gibt, auf der sich die Vorhersageleistung verschiedener Modelle nach Region vergleichen lässt.
Dort kann man Vorhersagedaten nach Modell grafisch visualisieren, und mehrere wichtige Modelle sind enthalten.
WeatherNext ist allerdings noch nicht dabei.
In der Ankündigung wurden die Verbesserungen bei Geschwindigkeit und Anzahl der Szenarien betont, aber ich fand, dass Genauigkeitsverbesserungen zu kurz kamen.
Eine Formulierung wie „WeatherNext 2 ist 8-mal schneller und bietet stündliche Auflösung“ klingt toll, aber als Nutzer will ich am Ende nur eine genaue Vorhersage.
Kennzahlen wie der CRPS-Score sind für Fachleute gedacht und sollen das Under-Dispersion-Problem traditioneller Ensemble-Modelle lösen.
Solche Verbesserungen bilden letztlich die Grundlage dafür, dass die deterministische Vorhersage, die normale Nutzer sehen, genauer wird.
Relevante Technik dazu findet sich bei WeatherBench.
Das Kernkonzept der Wettervorhersage sind seit Jahrzehnten Ensemble-Szenarien, und „70 % Regenwahrscheinlichkeit“ bedeutet, dass es in 70 von 100 Szenarien regnet.
Eine einzige „genaue Vorhersage“ gibt es also nicht.
Viele Wetter-Apps stellen das visuell gut dar.
Solche Modelle laufen zwar auf riesigen HPC-Clustern, sind aber effizient, weil zentral gerechnet und anschließend nur die Ergebnisse verteilt werden.
Ich frage mich, wo die physikalische Grundlage liegt, die für hohe Leistung notwendig ist.
Googles Wettervorhersage-Engine ist bereits sehr stark, und die Hurrikan-Zugbahnvorhersagen in dieser Saison waren erstaunlich präzise.
Dagegen wird das Global Forecasting System (GFS) der US-Regierung immer schlechter.
Verwandter Artikel: Ars-Technica-Link
Ich habe das Paper gelesen, aber es steht nicht darin, wie oft das Modell neu trainiert werden muss.
Wenn die Architektur regionale Verteilungen lernt, müssten sich diese Muster mit der Zeit ändern, also wäre regelmäßiges Retraining nötig.
Wenn dafür jede Woche drei Tage Training nötig wären, könnte das praktisch ein Kostenproblem sein.
Mich erinnert das an eine Anekdote aus dem Zweiten Weltkrieg.
Kenneth Arrow stellte fest, dass Langfristvorhersagen kaum besser als zufälliges Raten waren, doch sein Vorgesetzter soll geantwortet haben: „Auch wenn wir wissen, dass sie nutzlos sind, brauchen wir sie für die Planung.“
Wenn man also einfach immer sagt „Es wird nicht regnen“, liegt man zu 90 % richtig.
Ironischerweise war die frühere Wettervorhersage dennoch ungenauer als das.
Heutige Modelle sind wirklich erstaunlich präzise, sodass selbst 10-Tage-Vorhersagen oft fast stimmen.
Die Genauigkeit der standardmäßigen Google-Wetter-App hat zuletzt nachgelassen.
Oft lagen die Werte um 2 bis 5 Grad daneben.
Ich habe die auf HN empfohlene App Weawow ausprobiert; der Name ist nicht besonders, aber die Genauigkeit ist hervorragend.
Bisher ist das die App, mit der ich am zufriedensten bin.
KI-basierte Wettervorhersage wirkt im Alltag immer noch weit entfernt.
Selbst im Vergleich zur Zeit, als die Generation meiner Eltern den Wetterbericht im Fernsehen sah, fühlt sich die Genauigkeit nicht dramatisch anders an.
An angekündigten sonnigen Tagen kommt weiterhin Starkregen vor, oder es bleibt den ganzen Tag sonnig, obwohl Regen vorhergesagt wurde.
Aus Verbrauchersicht scheint technischer Fortschritt nicht wirklich zu höherer gefühlter Zuverlässigkeit zu führen.
In Apple Weather bedeutet ein „Regentag“ zum Beispiel, dass irgendwann an diesem Tag eine hohe Regenwahrscheinlichkeit besteht.
Tatsächlich kann es sein, dass es nur um 5 Uhr morgens regnet und den Rest des Tages sonnig ist.
Nutzer müssen die Daten interpretieren können, und es wäre gut, wenn KI die Vorhersage auf persönliche Interessen zugeschnitten kontextualisieren würde.
Ich habe bei Weathergraph die Kurzfrist-Niederschlagsvorhersage von rainbow.ai hinzugefügt, und das war bisher die genaueste, die ich genutzt habe.
Auch die Radardaten selbst sind stark verrauscht, und ihre Bereinigung erfolgt bereits mit ML-Modellen.
Das Niveau einer 1-Tages-Vorhersage von vor 30 Jahren entspricht heute etwa der Genauigkeit einer 4-Tages-Vorhersage.
Wir verstehen das Wetter allerdings nicht besser; das ist vor allem das Ergebnis massiv gestiegener Rechenleistung.
Ich habe mich gefragt, wo man dieses Modell nutzen kann.
Ich suche nach hyperlokalen Vorhersagen wie früher bei Dark Sky.
Vorhersagedaten von WeatherNext 2 sind in Earth Engine und BigQuery verfügbar, und in Vertex AI gibt es auch ein Early-Access-Programm für benutzerdefinierte Inferenz.
Außerdem wird das Modell in Search, Gemini, Pixel Weather und der Google Maps Platform Weather API eingesetzt.
Dort kann man Unterschiede zwischen Modellvorhersagen vergleichen, und die Windvektor-Animationen sind visuell sehr interessant.
Es wird stündlich aktualisiert und bietet Vorhersagen mit 15-Minuten-Auflösung für 18 Stunden sowie mit 1-Stunden-Auflösung für 48 Stunden.
HRRR-Website
Seit der Übernahme durch IBM hat sich viel verändert, aber vielleicht existiert das Projekt noch.
Ich frage mich, ob das Modell, das in dieser Saison die genauesten Hurrikan-Prognosen geliefert hat, dasselbe ist wie das jetzt vorgestellte Modell.
Verwandter Artikel: Ars-Technica-Link