Google veröffentlicht erstmals den Energieverbrauch von AI-Prompts
(technologyreview.com)- Google hat erstmals konkrete Daten zum Energieverbrauch von AI veröffentlicht und offengelegt, wie viel Strom, Wasser und CO2-Emissionen die Verarbeitung von Prompts in der Gemini-App verursacht
- Ein durchschnittlicher Text-Prompt verbraucht 0,24 Wh Strom und liegt damit etwa auf dem Niveau von einer Sekunde Mikrowellennutzung; hinzu kommen 0,26 ml Wasser und 0,03 g Kohlendioxid
- Die Zahlen basieren auf einer umfassenden Analyse, die die gesamte Infrastruktur einschließt, darunter AI-Chips (58 %), CPU und Speicher (25 %), Backup-Geräte (10 %) und Rechenzentrumsbetrieb (8 %)
- Im Mai 2025 war die Energieeffizienz im Vergleich zu Mai 2024 um das 33-Fache verbessert; Google nennt dafür Software-Optimierungen und Modellverbesserungen als Gründe
- Die Ankündigung ist bedeutsam, weil sie für mehr Transparenz bei großen AI-Unternehmen steht; zentrale Informationen wie die Gesamtzahl der Queries bleiben jedoch weiterhin unveröffentlicht, wodurch die Notwendigkeit eines standardisierten Systems zur Bewertung des AI-Energieverbrauchs betont wird
Google legt den Energieverbrauch von Gemini-Prompts offen
- Google ist das erste große AI-Unternehmen, das offenlegt, wie viel Strom, CO2-Emissionen und Wasser die Verarbeitung von Text-Prompts mit dem Gemini-Modell verbraucht
- Ein durchschnittlicher Prompt verursacht 0,24 Wh Strom, 0,26 ml Wasser und 0,03 g CO2; das entspricht ungefähr einer Sekunde Mikrowellenbetrieb oder fünf Wassertropfen
- In einem Interview mit MIT Technology Review erläuterte das Unternehmen die detaillierten Daten und die Berechnungsmethode
Detaillierte Struktur des Energieverbrauchs
- Vom gesamten Stromverbrauch entfallen 58 % auf AI-Chips (TPUs), 25 % auf CPU und Speicher, 10 % auf Backup-Geräte und 8 % auf den Rechenzentrumsbetrieb (Kühlung und Stromumwandlung)
- Google erklärte, die Analyse sei umfassend angelegt und beziehe die komplette Hardware-Infrastruktur ein
- Da dabei interne Daten offengelegt wurden, die für Forschende sonst kaum zugänglich sind, wird dies als wichtiger Beitrag zur Industrieforschung bewertet
Unterschiede zwischen Prompts und Grenzen der Daten
- Die veröffentlichten Werte sind Medianwerte; einige Queries können deutlich mehr Energie verbrauchen
- Beispiel: das Zusammenfassen von Dutzenden Büchern oder komplexe Berechnungen mit einem Reasoning-Modell
- Der Bericht bezieht sich nur auf Text-Prompts; Bild- und Videogenerierung sind nicht enthalten
- Deshalb gibt es weiterhin Grenzen, wenn es darum geht, das tatsächliche Gesamtvolumen der Gemini-Nutzung zu erfassen
Effizienzsteigerungen und Schätzung der CO2-Emissionen
- Google erklärte, dass der Energieverbrauch pro Prompt im Mai 2025 gegenüber Mai 2024 um das 33-Fache gesunken sei
- Als Gründe werden Verbesserungen an der Modellarchitektur und Software-Optimierungen genannt
- Für die Emissionsschätzung wurde kein US-Durchschnitt des Stromnetzes verwendet, sondern ein marktbasierter Ansatz, der den von Google eingekauften Anteil sauberer Energie berücksichtigt; dadurch fällt der Wert im Vergleich zum allgemeinen Strommix auf etwa ein Drittel
Reaktionen aus Forschung und Branche
- Beteiligte am Projekt ML.Energy der University of Michigan bewerten die Veröffentlichung als die bislang umfassendste und wichtigste Analyse
- Forschende von Hugging Face betonen die Notwendigkeit eines standardisierten AI-Energielabels und weisen darauf hin, dass Unternehmen derzeit nur selektiv Daten veröffentlichen
- Der Bericht erweitert das Verständnis des tatsächlichen Ressourcenverbrauchs von AI-Nutzung, doch das Fehlen zentraler Daten wie der Gesamtzahl der Queries bleibt weiterhin eine große Einschränkung
1 Kommentare
Hacker-News-Kommentare
Ich konnte im Originalartikel keine Links zur zugehörigen Pressemitteilung und zum Bericht finden, daher füge ich sie selbst an.
Wenn ich Berichte über eine Überlastung der Strominfrastruktur sehe, wirkt das auf mich wie eine Art Dog-Whistle-Strategie, die die Nuance betont, dass Tech-Unternehmen umweltschädlich seien.
Wasserverbrauch und Stromverbrauch werden problematisiert, aber oft übertrieben alarmistisch hervorgehoben.
Ein typisches Beispiel ist die Kritik am Wasserverbrauch des Rechenzentrums in The Dalles.
Diese Gebäude stehen neben dem Columbia River, und in der Nähe befindet sich der Dalles-Damm, der im Schnitt 700 Megawatt erzeugt.
Flusswasser wird zur Kühlung genutzt, etwas erwärmt und dann wieder in den Fluss zurückgeleitet.
In gewisser Weise gibt man damit die Wärme zurück, die das Wasser beim bergab Fließen ohnehin aufgenommen hätte; völlig verschwendet ist sie also nicht.
Zugehöriger Artikel, Infos zum Dalles-Damm
Das offizielle technische PDF von Google ist hier zu finden.
Ich frage mich, warum sie den Energieverbrauch des Median-Prompts veröffentlicht haben statt des Durchschnittswerts.
Der Durchschnitt würde den tatsächlichen mittleren Verbrauch intuitiver zeigen.
Was EVs betrifft: Die Erwartung, dass Elektroautos bis 2030 den Mainstream dominieren würden, war nie realistisch.
Weder bei der Skalierung der Batterieproduktion noch bei der Infrastruktur war irgendetwas vorbereitet.
Bei Rechenzentren entsteht das Problem, dass an einem bestimmten kleinen Ort plötzlich sehr viel Strom benötigt wird.
Andere Posten wie Elektroautos oder Wärmepumpen werden schrittweise eingeführt, sodass geringe jährliche Kapazitätssteigerungen ausreichen.
Rechenzentren lassen sich nicht leicht verteilen, daher ist die Infrastrukturbelastung größer.
Ich war kürzlich überrascht zu hören, wie Leute der Gen Z davon sprachen, dass KI Wasser „zerstöre“.
Ich habe im Rechenzentrumsbereich gearbeitet und wusste, dass Wasser zur Kühlung verwendet wird, aber ich hatte nie den Eindruck, dass in großem Maßstab Wasser zerstört würde.
Das Bewusstsein rund um GenAI und Wasser scheint tiefer zu sein, als ich erwartet hatte.
Manche sprechen sogar in der Art: „Wegen KI werden wir künftig in einer Hölle der Dürre leben.“
Mich würde eher interessieren, wie hoch der Energieverbrauch eines einzelnen TikTok-Videos ist, aber solche Vergleiche scheinen am Thema vorbeizugehen.
Wenn ich frage, auf welchem Weg das Wasser denn tatsächlich verschwindet, ob als Wasserdampf, wundert mich, dass viele Leute offenbar einfach annehmen, verdunstetes Wasser sei „für immer verschwunden“.
Wassermoleküle werden nicht „zerstört“, aber sie verschwinden oft vollständig aus einem Ort, an dem sie nützlich hätten verwendet werden können.
Ein typisches Beispiel ist der Aralsee, der durch landwirtschaftliche Bewässerung verschwunden ist.
YouTube-Video
Wasserknappheit ist ein äußerst lokales Phänomen.
Wenn man zum Beispiel in Arizona ein Rechenzentrum betreibt, kann man tatsächlich echte Wasserprobleme bekommen, aber das lässt sich etwa durch Wiederverwendung von Abwasser abmildern.
Das Kraftwerk Palo Verde nutzt ebenfalls Abwasser in seinen Wärmetauschern.
Auch ich war überrascht, dass ich kürzlich nach dem Wasserverbrauch von KI gefragt wurde.
Nach kurzer Suche stellte sich heraus, dass Rechenzentren tatsächlich ziemlich viel Wasser verbrauchen: etwa 1 Liter pro 1 kWh Strom.
Ich habe gehört, dass Hyperscaler bessere Werte erzielen und auf Net Positive hinarbeiten, aber echte Belege dafür, dass dieser Wert selbst völlig erfunden sei, gibt es kaum.
„1 Liter/kWh“ ist schwer greifbar, aber bei einem großen Rechenzentrum wären das 278 L/s. Ein Duschkopf liegt bei 0,16 L/s, und die gesamte Mandelindustrie Kaliforniens liegt im Jahresmittel bei 200.000 L/s.
Das entspräche etwa einer Mandelplantage von 4 Quadratmeilen, aber so extrem fühlt es sich in der Praxis nicht an, und bei Hyperscalern dürften die Daten besser aussehen.
Rechenzentren verwenden Verdunstungskühlung.
Das Wasser wird nicht einfach erhitzt und zurückgeleitet, sondern vollständig über die Atmosphäre verdunstet.
(Die Wassermoleküle selbst bleiben zwar erhalten, aber Wasserdampf in der Atmosphäre ist eine Form, die sich nur schwer wiederverwenden lässt.)
Die Behauptung, KI zerstöre Wasser, kam ursprünglich aus einem NIMBY-Argument und wurde später von Gruppen innerhalb der Gen Z mit stark antikapitalistischer Tendenz als Argument gegen KI übernommen.
2011 sagte Google, eine Suchanfrage verbrauche 0,3 Wh, und Anfang dieses Jahres sagte Sam Altman ebenfalls, eine OpenAI-Anfrage liege im Schnitt bei 0,3 Wh.
Es überrascht mich, wie ähnlich die beiden Werte sind.
Ich hätte erwartet, dass eine LLM-Anfrage energieintensiver ist als eine einfache Google-Suche, aber das zeigt, wie gewaltig die Infrastruktur hinter Google Search selbst ist.
Bei einfachen Fragen wie der Bedeutung eines Worts würde zum Beispiel ein kleines LLM auf einem iPhone vielleicht schon mit 0,03 Wh auskommen und damit zehnmal weniger verbrauchen als eine Google-Suche.
(Annahme: A16-Chip läuft 20 Sekunden lang mit 5 Watt, also 0,03 Wh.)
Was mich hier interessiert: Sind Trainingskosten, insbesondere fehlgeschlagene Trainingsläufe, in solchen Schätzungen enthalten?
Googles offizieller Blogpost
Man sollte auch berücksichtigen, dass 14 Jahre Fortschritt bei der Energieeffizienz viel ausmachen.
Um 2008 herum bestand der Kernprozess der Suche darin, alle Dokumente mit grep zu durchsuchen.
Die Dokumente wurden verteilt im RAM gehalten und grep lief über 1000 Maschinen.
Inverted Indexes wurden für „Abfragen, bei denen die Wortreihenfolge wichtig ist“ nicht besonders genutzt, weil sie dafür ungeeignet sind.
Der Ranking-Prozess usw. ist noch komplexer.
0,3 Wh sind 1080 Joule. In 1 Liter Benzin stecken mehr als 30 Millionen Joule, also entspricht das tatsächlich 0,034 Millilitern Benzin.
Allerdings ist Strom deutlich effizienter als ein Verbrennungsmotor.
Wenn ich eine Anfrage an mein lokales LLM schicke, flackert gefühlt das Licht im Büro, und es scheint mehr Energie zu verbrauchen, als den Ofen eine Sekunde lang laufen zu lassen.
Ich frage mich, ob Google um 2008 bereits Deep-Learning-basierte Suche eingesetzt hat.
Mit der Einführung neuer Funktionen dürfte sich der Stromverbrauch pro Anfrage verändert haben.
Schade, dass im gesamten Bericht nicht erklärt wird, was für ein Prompt genau als „Median“ gilt.
Ich würde gern wissen, wie viele Tokens so ein Prompt hat, wie die Längenverteilung aussieht und ob das über die Jahre gleich bleibt.
Ohne solche Informationen ist die reine Nennung des Medianwerts praktisch wenig aussagekräftig.
Mit einem Durchschnittswert könnte man wenigstens durch Multiplikation mit der Zahl der Anfragen den Gesamtverbrauch abschätzen.
Sam Altman hat in einem aktuellen Blogpost auch den durchschnittlichen Stromverbrauch pro ChatGPT-Anfrage veröffentlicht.
Eine ChatGPT-Anfrage verbraucht im Schnitt 0,34 Wh, also etwa anderthalb Sekunden Ofenlaufzeit oder den Wasserverbrauch einer hocheffizienten Glühbirne über mehrere Minuten.
Der Wasserverbrauch liegt bei 0,000085 Gallonen pro Anfrage (ein Fünfzehntel eines Teelöffels).
Altman-Blog
Für mich ist der wirklich wichtige Punkt nicht die Inferenz, sondern Training, Fine-Tuning und das Einsammeln von Daten.
Die Logik „Prompts zerstören die Umwelt“ wirkt auf mich zu sensationsheischend.
Ich begrüße, dass inzwischen immer besser gegengeprüft wird.
Allerdings lässt sich der Einfluss neuer Rechenzentren auf Übertragungs- und Verteilnetze realistisch gesehen ebenfalls nicht ignorieren.
Wäre die Technologie grundsätzlich so energieeffizient, würden große Unternehmen jetzt wohl kaum in private Atomkraftprojekte investieren oder in Energiewettbewerbe eintreten.
Um vernünftige Zielmaßstäbe anzulegen, sollte man nicht nur den absoluten Wasser- und Energieverbrauch betrachten, sondern relativ dazu, ob die Wasser- und Energieressourcen der jeweiligen Region ausreichen.
Google meldet den gesamten Wasserverbrauch seiner Rechenzentren offiziell.
2024 lag er bei etwa 10 Milliarden Gallonen (rund 0,03 % des US-Gesamtverbrauchs, wobei nicht alle Rechenzentren in den USA stehen).
Die Zahl selbst wirkt nicht enorm, aber allein in Council Bluffs, IA, sind es über 1 Milliarde Gallonen, und man muss prüfen, ob das lokale Ökosystem das tragen kann und ob verantwortungsvoll damit umgegangen wird.
Google räumt ein, dass 28 % in „Gebieten mit mittlerem oder höherem Risiko von Wasserschwund oder Wasserknappheit“ verbraucht werden.
Google-Umweltbericht 2025
Schon beim bloßen Besuch einer Website werden unbeabsichtigt Prompts an Server gesendet.
Schade, dass solche Dienste im großen Maßstab umso exzessiver genutzt werden, je billiger sie angeboten werden.
Der Aussage, wenn der Energieverbrauch grundsätzlich niedrig wäre, gäbe es nicht diesen intensiven Wettbewerb um neue Rechenzentren und Energieinfrastruktur, stimme ich nicht zu.
Das US-Stromnetz hatte lange Zeit keine zusätzlichen Reserven.
Der Grund liegt in Effizienzsteigerungen beim Energieverbrauch und industrieller Stagnation.
Das größere Problem sind weniger die Rechenzentren selbst als die Infrastruktur zur Stromverteilung.
Erzeugung ist möglich, aber es gibt große Probleme dabei, sie dorthin zu verteilen, wo sie gebraucht wird.
Auch die Kontroverse um private Kraftwerke ist eher ein Verteilungs- als ein Erzeugungsthema.
Wenn ein Median-Prompt 0,24 Wh verbraucht, dann entspricht das in etwa der Energie von
Wenn ich richtig rechne, sind mit 1 kWh etwa 4000 Anfragen möglich.
Nimmt man für Industriestrom 0,04 $/kWh an, dann wären für 1 $ etwa 100.000 Anfragen möglich.
Wenn man den Bau von Rechenzentren usw. mit einrechnet, wirkt ein 20-$-Monatsabo gar nicht übertrieben teuer.
Habe ich richtig gerechnet?
Ja, das ist korrekt gerechnet.
Der grundlegende Fehler im KI-Pessimismus rund um Energie und Wasser ist, dass Strom, Wasser und Fläche allesamt Kosten verursachen, während KI-Dienste nicht gratis angeboten werden.
Wenn KI tatsächlich den gesamten Strom und das gesamte Wasser auffressen würde, würden Unternehmen sie nicht mit Verlust betreiben.
Aber müsste man die Trainingskosten nicht gesondert betrachten?
Wenn man Artikel von Drittseiten überspringen will, kann man direkt den Google-Blogpost und das offizielle Paper als PDF lesen.
Mich würde stärker die Gesamtmenge interessieren, etwa die gesamte Zahl der Gemini-Anfragen pro Tag.
Mit dem Median-Prompt-Wert allein lässt sich der gesamte Energiebedarf nicht abschätzen.
Ohne die Gesamtzahl der Anfragen hat der Medianwert selbst keine große Bedeutung.
Vielleicht ist der Durchschnitt höher und wird deshalb absichtlich nicht veröffentlicht.