5 Punkte von GN⁺ 2025-11-19 | 1 Kommentare | Auf WhatsApp teilen
  • WeatherNext 2 ist ein KI-basiertes Modell, das Genauigkeit und Effizienz globaler Wettervorhersagen deutlich verbessert
  • Es erzeugt auf einer einzelnen TPU in weniger als einer Minute Hunderte von Wetterszenarien und bietet eine 8-fach schnellere Vorhersagegeschwindigkeit als bestehende Modelle
  • Durch die neue Functional Generative Network (FGN)-Architektur bleiben die Vorhersagen physikalisch konsistent und unterstützen eine stündliche Auflösung
  • Die Vorhersagedaten sind über Earth Engine und BigQuery verfügbar, und über das Early-Access-Programm von Vertex AI werden Funktionen für benutzerdefinierte Inferenz bereitgestellt
  • Die Technologie wertet Wetterfunktionen in Googles Diensten wie Search, Gemini, Pixel Weather und der Google Maps Platform auf

Überblick über WeatherNext 2

  • Google DeepMind und Google Research haben WeatherNext 2 gemeinsam entwickelt, ein KI-basiertes Wettervorhersagemodell, das im Vergleich zu bisherigen Ansätzen eine 8-fach höhere Geschwindigkeit und eine stündliche Auflösung bietet
    • Aus einer einzelnen Eingabe erzeugt es Hunderte möglicher Wetterszenarien
    • Die Vorhersage wird auf einer einzelnen TPU in weniger als einer Minute abgeschlossen, während bestehende physikbasierte Supercomputer-Modelle mehrere Stunden benötigen
  • Das Modell zeigt bei 99,9 % der Variablen und Vorhersagehorizonte (0 bis 15 Tage) bessere Leistung als frühere Modelle, etwa bei Temperatur, Windgeschwindigkeit und Luftfeuchtigkeit
  • WeatherNext 2 ermöglicht hochauflösende Vorhersagen für die gesamte Erde und wird auch zur Unterstützung von Entscheidungen in Wetterdiensten eingesetzt

Neuer Ansatz für KI-Modellierung

  • WeatherNext 2 verwendet einen neuen KI-Modellierungsansatz namens Functional Generative Network (FGN)
    • Dabei wird der Modellarchitektur direkt „Rauschen“ injiziert, damit die Vorhersageergebnisse physikalisch realistisch und miteinander verknüpft bleiben
  • Dieser Ansatz ist sowohl für „marginale“ als auch „gemeinsame“ (joint) Vorhersagen nützlich
    • Marginal bezieht sich auf einzelne Elemente, etwa die Temperatur an einem bestimmten Ort, Windgeschwindigkeit nach Höhe oder Luftfeuchtigkeit
    • Joint bezieht sich auf großskalige Wettersysteme, in denen mehrere Elemente zusammenwirken, und ist entscheidend für die Analyse komplexer Phänomene wie Hitzewellengebiete oder die Prognose von Windstromerträgen
  • Das Modell wird nur mit marginalen Daten trainiert, lernt jedoch selbstständig gemeinsame Muster und erstellt dadurch komplexe Vorhersagen

Datenzugang und Nutzung

  • Die Vorhersagedaten von WeatherNext 2 werden in Google Earth Engine und BigQuery veröffentlicht
    • Sie sind über den Earth Engine Data Catalog und den BigQuery Analytics Hub abrufbar
  • In Google Cloud Vertex AI werden über ein Early-Access-Programm Funktionen für benutzerdefinierte Modellinferenz bereitgestellt
  • Die Technologie ist in Search, Gemini, Pixel Weather und die Weather API der Google Maps Platform integriert und soll künftig auch in die Wetterinformationsfunktionen von Google Maps einfließen

Von der Forschung in die Praxis

  • WeatherNext 2 ist ein Beispiel dafür, wie Forschungsergebnisse in reale Anwendungen überführt werden
    • Google öffnet mit dieser Technologie Tools und Daten, damit Forschende, Entwickler und Unternehmen weltweit sie zur Lösung komplexer Probleme nutzen können
  • Künftig soll die Modellleistung durch die Integration neuer Datenquellen und eine breitere Zugänglichkeit kontinuierlich verbessert werden
  • Google verknüpft dies mit Earth Engine, AlphaEarth Foundations und Earth AI, um das geospatiale KI-Forschungsökosystem weiter zu stärken

Weiteres Material

  • Das zu WeatherNext 2 gehörende Paper (arXiv: 2506.10772) wurde veröffentlicht
  • Es gibt Entwicklerdokumentation, einen Earth Engine Data Catalog, BigQuery-Abfragebeispiele und eine Anmeldeseite für den Vertex-AI-Early-Access
  • Als verwandte Modelle werden außerdem GenCast (Vorhersage extremer Wetterereignisse) und GraphCast (schnelle globale Wettervorhersage) vorgestellt

1 Kommentare

 
GN⁺ 2025-11-19
Hacker-News-Kommentare
  • Ich bin ziemlich tief in diesem Thema drin, und ein Punkt, den Außenstehende interessant finden könnten, ist, dass moderne Modelle wie neuralgcm oder WeatherNext 1 alle mit einer Zielfunktion namens CRPS trainiert werden.
    Diese Methode wird im allgemeinen ML-Bereich fast nie verwendet; ich habe sie nur in der Wettervorhersage gesehen.
    Kurz gesagt fügt man dem Input zufälliges Rauschen hinzu und trainiert das Modell so, dass es einen normalen Loss (L1 usw.) minimiert und gleichzeitig den Unterschied zwischen zwei Ergebnissen maximiert, die mit unterschiedlichen anfänglichen Rauschwerten erzeugt wurden.
    Ich frage mich, ob so ein Ansatz irgendwann auch in klassischer GenAI eingesetzt wird.

    • Ich frage mich, ob das Rauschen nicht eher zu den Modellparametern als zum Input hinzugefügt wird.
      Das erinnert mich an das Paper zu Variational Noise.
      Falls das Rauschen dem Input hinzugefügt wird, klingt das eher nach SSL-Techniken wie DINO.
    • Ich wollte bei einer kürzlichen Optimierungsarbeit absichtlich zwei unterschiedliche Ausgaben erzeugen, konnte aber keine gute Heuristik finden.
      Das hatte nichts mit GenAI zu tun, aber dieser CRPS-Ansatz wäre dafür vielleicht hilfreich gewesen.
    • Dieser Ansatz erinnert mich an Variational Autoencoder.
    • Ich frage mich, was das Ziel dabei ist und warum man das statt eines L2-Loss verwendet.
    • Man sollte klarstellen, dass das Modell zwar auf historischen Daten trainiert wird, bei der tatsächlichen Vorhersage aber mit neuen Beobachtungen mehrfach als Ensemble ausgeführt wird.
  • Mir ist aufgefallen, dass die lokale Wettervorhersage in der Google-Suche in letzter Zeit deutlich ungenauer geworden ist.
    Seit einigen Wochen wurde immer wieder vorhergesagt, dass die Nachttemperaturen unter null fallen würden, tatsächlich ist das aber nicht passiert.
    Meine Region ist zwar schwer vorherzusagen, aber andere Nicht-Google-Quellen waren deutlich genauer.
    Ich frage mich, ob der Rollout des neuen Modells schon erfolgt ist und die Vorhersagen dadurch schlechter geworden sind oder ob umgekehrt bald eine Verbesserung zu erwarten ist.
    Mich würde auch interessieren, ob es eine Website gibt, auf der sich die Vorhersageleistung verschiedener Modelle nach Region vergleichen lässt.

    • Die kostenlose API von Open-Meteo ist nützlich.
      Dort kann man Vorhersagedaten nach Modell grafisch visualisieren, und mehrere wichtige Modelle sind enthalten.
      WeatherNext ist allerdings noch nicht dabei.
    • Ein Vergleich der Modellleistung nach Region wirkt wie eine völlig naheliegende Funktion, existiert in der Praxis aber fast nirgends. Ich frage mich, warum.
  • In der Ankündigung wurden die Verbesserungen bei Geschwindigkeit und Anzahl der Szenarien betont, aber ich fand, dass Genauigkeitsverbesserungen zu kurz kamen.
    Eine Formulierung wie „WeatherNext 2 ist 8-mal schneller und bietet stündliche Auflösung“ klingt toll, aber als Nutzer will ich am Ende nur eine genaue Vorhersage.

    • Wichtig ist, dass der Endnutzer dieses Produkts nicht die Allgemeinheit ist.
      Kennzahlen wie der CRPS-Score sind für Fachleute gedacht und sollen das Under-Dispersion-Problem traditioneller Ensemble-Modelle lösen.
      Solche Verbesserungen bilden letztlich die Grundlage dafür, dass die deterministische Vorhersage, die normale Nutzer sehen, genauer wird.
      Relevante Technik dazu findet sich bei WeatherBench.
    • Aus Sicht normaler Nutzer war die Erklärung unzureichend.
      Das Kernkonzept der Wettervorhersage sind seit Jahrzehnten Ensemble-Szenarien, und „70 % Regenwahrscheinlichkeit“ bedeutet, dass es in 70 von 100 Szenarien regnet.
      Eine einzige „genaue Vorhersage“ gibt es also nicht.
    • Als Nutzer möchte ich auch die Streuung der Unsicherheit sehen.
      Viele Wetter-Apps stellen das visuell gut dar.
    • Der wichtigste Benchmark ist die Genauigkeit, und man sollte mit bestehenden physikbasierten Modellen (GFS, ECMWF usw.) vergleichen.
      Solche Modelle laufen zwar auf riesigen HPC-Clustern, sind aber effizient, weil zentral gerechnet und anschließend nur die Ergebnisse verteilt werden.
    • Es ist ein auf historischen Daten trainiertes Modell, aber mir scheint ein physikbasierter Anteil zu fehlen.
      Ich frage mich, wo die physikalische Grundlage liegt, die für hohe Leistung notwendig ist.
  • Googles Wettervorhersage-Engine ist bereits sehr stark, und die Hurrikan-Zugbahnvorhersagen in dieser Saison waren erstaunlich präzise.
    Dagegen wird das Global Forecasting System (GFS) der US-Regierung immer schlechter.
    Verwandter Artikel: Ars-Technica-Link

    • Ich frage mich, was konkret damit gemeint ist, dass „GFS schlechter wird“.
  • Ich habe das Paper gelesen, aber es steht nicht darin, wie oft das Modell neu trainiert werden muss.
    Wenn die Architektur regionale Verteilungen lernt, müssten sich diese Muster mit der Zeit ändern, also wäre regelmäßiges Retraining nötig.
    Wenn dafür jede Woche drei Tage Training nötig wären, könnte das praktisch ein Kostenproblem sein.

  • Mich erinnert das an eine Anekdote aus dem Zweiten Weltkrieg.
    Kenneth Arrow stellte fest, dass Langfristvorhersagen kaum besser als zufälliges Raten waren, doch sein Vorgesetzter soll geantwortet haben: „Auch wenn wir wissen, dass sie nutzlos sind, brauchen wir sie für die Planung.“

    • Ich habe im Statistikunterricht gelernt, dass es tatsächlich viel mehr gutes als schlechtes Wetter gibt.
      Wenn man also einfach immer sagt „Es wird nicht regnen“, liegt man zu 90 % richtig.
      Ironischerweise war die frühere Wettervorhersage dennoch ungenauer als das.
      Heutige Modelle sind wirklich erstaunlich präzise, sodass selbst 10-Tage-Vorhersagen oft fast stimmen.
    • Es gibt auch die Deutung, dass antike Wahrsagerei nicht bloß Aberglaube war, sondern ein Entscheidungswerkzeug, das Menschen bei Unentschlossenheit durch Zufallsauswahl zum Handeln brachte.
    • Das erinnert an Eisenhowers Ausspruch: „Pläne sind nutzlos, aber Planen ist unverzichtbar.“
  • Die Genauigkeit der standardmäßigen Google-Wetter-App hat zuletzt nachgelassen.
    Oft lagen die Werte um 2 bis 5 Grad daneben.
    Ich habe die auf HN empfohlene App Weawow ausprobiert; der Name ist nicht besonders, aber die Genauigkeit ist hervorragend.
    Bisher ist das die App, mit der ich am zufriedensten bin.

  • KI-basierte Wettervorhersage wirkt im Alltag immer noch weit entfernt.
    Selbst im Vergleich zur Zeit, als die Generation meiner Eltern den Wetterbericht im Fernsehen sah, fühlt sich die Genauigkeit nicht dramatisch anders an.
    An angekündigten sonnigen Tagen kommt weiterhin Starkregen vor, oder es bleibt den ganzen Tag sonnig, obwohl Regen vorhergesagt wurde.
    Aus Verbrauchersicht scheint technischer Fortschritt nicht wirklich zu höherer gefühlter Zuverlässigkeit zu führen.

    • Die Daten existieren: Laut Our World in Data verbessert sich die Vorhersagegenauigkeit stetig.
    • Das Problem ist die Darstellungsform der Daten.
      In Apple Weather bedeutet ein „Regentag“ zum Beispiel, dass irgendwann an diesem Tag eine hohe Regenwahrscheinlichkeit besteht.
      Tatsächlich kann es sein, dass es nur um 5 Uhr morgens regnet und den Rest des Tages sonnig ist.
      Nutzer müssen die Daten interpretieren können, und es wäre gut, wenn KI die Vorhersage auf persönliche Interessen zugeschnitten kontextualisieren würde.
    • Vorhersagen werden zwar kontinuierlich besser, aber es ist eher eine schrittweise Evolution als eine plötzliche Revolution.
      Ich habe bei Weathergraph die Kurzfrist-Niederschlagsvorhersage von rainbow.ai hinzugefügt, und das war bisher die genaueste, die ich genutzt habe.
      Auch die Radardaten selbst sind stark verrauscht, und ihre Bereinigung erfolgt bereits mit ML-Modellen.
    • Tatsächlich hat sich die Genauigkeit stark verbessert.
      Das Niveau einer 1-Tages-Vorhersage von vor 30 Jahren entspricht heute etwa der Genauigkeit einer 4-Tages-Vorhersage.
      Wir verstehen das Wetter allerdings nicht besser; das ist vor allem das Ergebnis massiv gestiegener Rechenleistung.
    • Auch allgemeine Wettervorhersagen sind nach wie vor nicht perfekt.
  • Ich habe mich gefragt, wo man dieses Modell nutzen kann.
    Ich suche nach hyperlokalen Vorhersagen wie früher bei Dark Sky.

    • Die Forschungsergebnisse sind inzwischen in reale Dienste integriert worden.
      Vorhersagedaten von WeatherNext 2 sind in Earth Engine und BigQuery verfügbar, und in Vertex AI gibt es auch ein Early-Access-Programm für benutzerdefinierte Inferenz.
      Außerdem wird das Modell in Search, Gemini, Pixel Weather und der Google Maps Platform Weather API eingesetzt.
    • Persönlich mag ich die App Windy am liebsten.
      Dort kann man Unterschiede zwischen Modellvorhersagen vergleichen, und die Windvektor-Animationen sind visuell sehr interessant.
    • Auch das HRRR-Modell ist sehr gut.
      Es wird stündlich aktualisiert und bietet Vorhersagen mit 15-Minuten-Auflösung für 18 Stunden sowie mit 1-Stunden-Auflösung für 48 Stunden.
      HRRR-Website
    • Früher integrierte Weather Underground Daten privater Wetterstationen.
      Seit der Übernahme durch IBM hat sich viel verändert, aber vielleicht existiert das Projekt noch.
    • Der offizielle Weather-API-Link von Google ist ebenfalls einen Blick wert.
  • Ich frage mich, ob das Modell, das in dieser Saison die genauesten Hurrikan-Prognosen geliefert hat, dasselbe ist wie das jetzt vorgestellte Modell.
    Verwandter Artikel: Ars-Technica-Link