Googles AI-Revolution: der zweijährige Kraftakt, um OpenAI einzuholen

(wired.com)

35 Punkte von GN⁺ 2025-03-28 | 4 Kommentare | Auf WhatsApp teilen

Beginn von Googles Krise nach der Chatbot-Revolution

Im Dezember 2022 erhielt Sissie Hsiao den Auftrag, innerhalb von 100 Tagen ein Konkurrenzprodukt zu ChatGPT für Google zu entwickeln.
Hsiao war eine Veteranin mit mehr als 16 Jahren im Unternehmen und hatte Tausende von Mitarbeitern geführt, doch eine derart ernste Krisensituation hatte sie noch nie erlebt.
Nachdem OpenAI ChatGPT veröffentlicht hatte, stieg die Zahl der Nutzer trotz sachlicher Fehler und Rechenfehler schnell auf mehr als 1 Million.
Einige begannen, ChatGPT als Ersatz für die Google-Suche zu betrachten, was eine Bedrohung für Googles wichtigste Einnahmequelle darstellte.
Google verfügte zwar über das eigene Sprachmodell LaMDA, doch der öffentliche Zugang war eingeschränkt, und selbst die Demos beschränkten sich auf „Hundegeschichten“.
Die Wall Street (Finanzmärkte) war beunruhigt, und obwohl CEO Sundar Pichai in der Vergangenheit das „AI-first-Zeitalter“ ausgerufen und erklärt hatte, intelligente Assistenten würden Geräte ersetzen, blieb die Realität hinter den Erwartungen zurück.
Auch die Transformer-Architektur wurde von acht Google-Forschern entwickelt, doch sie verließen das Unternehmen oder gingen, ohne dass daraus Erfolge entstanden.
Der von Hsiao betreute Google Assistant wurde nur für Dinge wie das Stellen von Timern oder das Abspielen von Musik genutzt.
Alles, was es gab, war ein unfertiger Chatbot, der Kochtipps und Geschichtsquizze für die Gen-Z liefern sollte.
Bis Ende 2022 war die Alphabet-Aktie im Jahresvergleich um 39 % gefallen, und Googles Stellung als führendes AI-Unternehmen geriet ins Wanken.

Googles Reaktion auf die AI-Krise und der Strategiewechsel

Anfang 2023 verlangte der Google-Vorstand Echtzeitberichte zu AI.
- Mitgründer und Großaktionär Sergey Brin beteiligte sich auch persönlich an den Strategie-Reviews.
- Den Mitarbeitern wurde die Botschaft vermittelt: „Bewegt euch wie ein Startup.“
Früher herrschte eine Kultur, in der viele Mitarbeiter ein Produkt ablehnen konnten, aber keine Befugnis hatten, es zu genehmigen.
Nun erfolgte ein Übergang zu einer Kultur, die größere Risiken eingeht und schneller umsetzt.
Als Sissie Hsiao das 100-Tage-Projekt startete, gab sie dem Team einen ungewöhnlichen Grundsatz vor:
„Quality over speed, but fast“
Eine weitere hochrangige Führungskraft, James Manyika, spielte eine zentrale Rolle bei der grundlegenden Neuausrichtung der AI-Strategie.
- Der in Oxford promovierte Robotikexperte und frühere McKinsey-Berater kam 2022 zu Google.
- Er schlug Pichai die Zusammenlegung von DeepMind und Google Brain vor.
DeepMind (London, unter Demis Hassabis) und Google Brain (Mountain View, unter Jeff Dean) wurden getrennt geführt und verbrauchten Ressourcen ineffizient.
- Nach der Veröffentlichung durch OpenAI legten die drei Führungskräfte dem Vorstand einen Fusionsplan vor.
- Hassabis schlug als Projektnamen „Titan“ vor, wurde jedoch abgelehnt; stattdessen setzte sich Jeff Deans Vorschlag „Gemini“ durch.
Manyika sagte später, Google habe mutige und verantwortungsvolle Entscheidungen getroffen.
- Er räumte jedoch ein: „Wir haben nicht immer nur die richtigen Entscheidungen getroffen.“
- In der angespannten Lage verbreitete sich unter den Mitarbeitern sogar die Sorge, „Google könnte wie Yahoo werden“.
- Hsiao beschrieb diese Zeit als das Gefühl, „einen Marathon im Vollsprint zu laufen“.
Doch zwei Jahre später erreicht die Alphabet-Aktie neue Allzeithochs.
- Investoren zeigen sich optimistisch, was die Wiederherstellung von Googles AI-Wettbewerbsfähigkeit angeht.
WIRED bewertet diese Zeit als die chaotischste und kulturell folgenreichste Phase in der Geschichte Googles.
- Dafür wurden mehr als 50 aktuelle und ehemalige Mitarbeiter aus Engineering, Marketing, Recht und Safety interviewt.
- Der Artikel beleuchtet Googles Wandel erstmals ausführlich anhand der Aussagen hochrangiger Führungskräfte.

Entwicklung von Bard: unternehmensweite Priorität und gebündelte Ressourcen

Um auf ChatGPT zu reagieren, startete Google ein neues Chatbot-Projekt mit dem Codenamen Bard.
Sissie Hsiao zog rund 100 Talente direkt aus dem gesamten Unternehmen ab.
- Manager konnten sich nicht widersetzen, und das Bard-Projekt hatte oberste Priorität.
Hsiao wählte Mitarbeiter mit technischer Stärke, emotionaler Intelligenz und Blick fürs große Ganze aus.
Die meisten wurden in Mountain View, Kalifornien, eingesetzt und arbeiteten flexibel über Rollen hinweg.
- Dabei wurde die Philosophie betont: „Team Bard ist ein Team für jede Aufgabe.“
Im Januar 2023 kündigte Google zum ersten Mal in seiner Geschichte großangelegte Entlassungen an: rund 12.000 Menschen, etwa 7 % der Belegschaft.
Einige Mitarbeiter litten unter der Angst, entlassen zu werden, wenn sie keine Nachtschichten oder Zusatzarbeit leisteten.
- Viele verzichteten sogar darauf, ihre Kinder ins Bett zu bringen, um an nächtlichen Meetings teilzunehmen.
Bard basierte auf dem bestehenden LaMDA, benötigte jedoch aktualisiertes Wissen und neue Schutzmechanismen.
- Das Infrastrukturteam verlegte seine besten Techniker auf das Projekt, um Serverkapazitäten zu sichern und Systeme zu tunen.
- Die Rechenzentren erreichten beim Stromverbrauch beinahe ihre Grenze, wodurch das Risiko einer Überhitzung der Geräte entstand.
- Deshalb wurden auch neue Management-Tools schnell entwickelt, um den Strombedarf sicherer zu steuern.
Zur Auflockerung kam auch Humor auf.
- Ein Teammitglied fertigte individuelle Pokerchips an, ließ den Namen eines bestimmten Chips eingravieren und stapelte sie auf den Schreibtischen der Ingenieure mit dem Scherz: „So, nehmt euch einen Chip.“
In den ersten Wochen wiederholte Bard trotz ausgebauter Rechenressourcen die bekannten Probleme.
- Wie ChatGPT erzeugte auch Bard häufig Halluzinationen sowie unangemessene oder anstößige Antworten.
- In frühen Versionen traten häufig eklatant lächerliche rassistische Stereotype auf.
  - Wurde ein indischer Name eingegeben, beschrieb Bard die meisten als „Bollywood-Schauspieler“, chinesisch klingende Männernamen dagegen als „Informatiker“.
- Laut einem ehemaligen Mitarbeiter waren Bards Antworten „nicht gefährlich, aber einfach dumm“.
- Einige Mitarbeiter teilten Screenshots von Bards absurden Antworten und machten sich darüber lustig.
  - Beispiel: Auf die Aufforderung nach einem „Rap im Stil von Three 6 Mafia über das Entsorgen von Autobatterien im Meer“ erzeugte Bard sogar Inhalte darüber, Menschen an Batterien zu fesseln und im Meer versinken zu lassen.
Google hatte keine andere Wahl, als innerhalb der vorgegebenen 100 Tage so viele Fehler wie möglich zu beseitigen.
- Sogar externe Vertragskräfte, die etwa für die Erkennung von Bildern mit Kindesmissbrauch zuständig waren, wurden in die Tests von Bard eingebunden.
- Pichai bat alle Mitarbeiter mit freier Zeit, Bard zu testen; am Ende beteiligten sich rund 80.000 Menschen daran.
Hsiao und das Management wussten, dass sich Bards Fehler nicht vollständig verhindern ließen, und verpackten das Produkt selbst als „Experiment“.
- Das ähnelte der Strategie von OpenAI, ChatGPT als „Research Preview“ vorzustellen.
- Durch die Betonung, dass es kein fertiges Produkt sei, wollten sie das Risiko von Markenschäden gegenüber Nutzern und externen Beurteilern minimieren.
- Diese Strategie gilt in der Branche seit dem Fall von Microsofts Twitter-Chatbot Tay, der Nazi-Äußerungen machte, als weithin bekanntes Mittel zur Risikovermeidung.

Der Veröffentlichungsprozess von Bard und der fatale Fehler

Früher ließ Google vor der Veröffentlichung von AI-Produkten das „Team für verantwortungsvolle Innovation“ monatelang Bias und Mängel prüfen
- Im Fall von Bard wurde der Prüfprozess wegen Zeitdrucks stark verkürzt
- Der Chief Legal Officer Kent Walker drängte auf eine schnelle Veröffentlichung
- Neue Modelle und Funktionen erschienen so schnell, dass die Review-Teams trotz Überstunden und Wochenendarbeit nicht hinterherkamen
Es gab Warnungen mit der Bitte, die Einführung von Bard zu verschieben, doch diese wurden ignoriert oder entkräftet
- Google erklärte dazu gegenüber WIRED, „kein Team habe offiziell empfohlen, die Veröffentlichung zu stoppen“
  - An den Tests seien viele Teams beteiligt gewesen, und die Verantwortung habe nicht allein bei einem bestimmten Team gelegen
Rund zwei Drittel des 100-Tage-Projekts, im Februar 2023, erfuhr Google, dass ChatGPT in die Bing-Suche integriert werden sollte
Zwar dominierte Google den Suchmarkt weiterhin deutlich, doch das Fehlen generativer AI-Funktionen war langfristig eine Bedrohung
Um einen Kursrückgang der Aktie zu vermeiden, kündigte Pichai am 6. Februar, einen Tag vor Microsofts Ankündigung, überraschend einen begrenzten Testzugang für Bard an
In einem Marketingvideo wurde Bard als AI-Assistent dargestellt, der Googles Mission fortführt, „Informationen zu organisieren“
Die Frage im Video lautete: „Welche neuen Entdeckungen des James-Webb-Weltraumteleskops kann man einem 9-jährigen Kind erklären?“
- Bards Antwort: „Das JWST hat das erste Bild eines Planeten außerhalb unseres Sonnensystems aufgenommen“
Kurz darauf berichtete Reuters über einen sachlichen Fehler: Das betreffende Bild sei nicht von einem Weltraumteleskop, sondern von einem bodengebundenen Teleskop (VLT) aufgenommen worden
Die Alphabet-Aktie fiel um 9 %, etwa 100 Milliarden US-Dollar Marktkapitalisierung gingen verloren
Intern war das Team schockiert
- Der Marketingmitarbeiter, der die Frage formuliert hatte, machte sich Vorwürfe, und Kollegen trösteten ihn mit den Worten: „Sowohl das Legal-Team als auch das PR-Team haben es geprüft, aber niemand hat den Fehler bemerkt“
- Da auch ChatGPT viele Fehler machte, hatte niemand damit gerechnet, dass eine solche kleine Verwechslung den Aktienkurs so stark beeinflussen würde
Xiao bezeichnete dies als „naiven Fehler“
- Bard formulierte Antworten auf Basis von Google-Suchergebnissen und könnte die Formulierung „erstes Foto“ in einem NASA-Blog missverstanden haben
- Die Führung betonte: „Niemand wird deswegen entlassen. Aber wir müssen schnell daraus lernen“
Xiao: „Wir sind kein Startup, wir sind Google. Das kann man nicht einfach als technischen Fehler abtun. Wir müssen zwingend verantwortungsvoll reagieren“
Auch außerhalb des Bard-Teams wuchs der Unmut
- Im internen Forum Memegen erschien ein kritischer Beitrag: „Die Einführung von Bard und die Entlassungen waren überstürzt, verpfuscht und kurzsichtig“
- Es wurde auch ein Bild geteilt, auf dem das Google-Logo in einem Mülleimer brennt
Trotzdem steckte Google mehr Ressourcen in Bard
- Hunderte zusätzliche Mitarbeiter wurden eingesetzt; in Teamdokumenten tauchte Pichais Profilbildsymbol täglich auf, ein Zeichen seiner direkten Beteiligung

Der Auftritt von GPT-4 und der technische Rückstand

Mitte März 2023 sorgte die Veröffentlichung von OpenAIs GPT-4 intern bei Google erneut für einen Schock
- Ein hochrangiger Forscher sagte: „Mir klappte buchstäblich der Mund auf, und ich spürte dringend, dass Google schneller werden musste“
Eine Woche später wurde Bard in den USA und Großbritannien offiziell veröffentlicht
- Nutzer fanden es nützlich zum Schreiben von E-Mails, für erste Berichtsentwürfe und Ähnliches
- Doch ChatGPT erledigte dieselben Aufgaben noch besser, daher war der Anreiz zum Wechsel gering
Pichai sagte im Podcast Hard Fork selbstironisch, Google habe „mit einem getunten Civic gegen einen starken Sportwagen konkurriert“
- Sein Fazit: „Wir brauchen einen besseren Motor“

Entwicklung von Gemini: Fusion von DeepMind und Google Brain sowie kulturelle Reibungen

Unterschiede zwischen den beiden AI-Forschungsorganisationen
- DeepMind wurde bei Alphabet als „Other Bets“ geführt und konzentrierte sich auf langfristige wissenschaftliche und mathematische Probleme
- Google Brain entwickelte vor allem kommerziell praxisnahe AI-Technologien wie Gmail-Autovervollständigung oder die Verarbeitung mehrdeutiger Suchanfragen
Laut einem ehemaligen leitenden Ingenieur:
- Google Brain setzte stark auf Autonomie, Jeff Dean habe einen Stil gehabt, bei dem er „die Leute einfach machen ließ“
- DeepMind dagegen funktionierte wie eine straff geführte Armee, und Demis Hassabis leitete eine „hocheffiziente Organisation unter einem einzigen Befehlshaber“
Dean gilt als Veteran der Forschung zu neuronalen Netzen und ist seit den frühen Tagen von Google dabei
Hassabis ist ein visionsgetriebener Anführer, der mithilfe von AI von der Heilung von Krankheiten träumt und an „AI-Agenten, die sehen, hören und helfen“ denkt
Der Start von Google DeepMind (GDM)
- Im April 2023 vereinte Google die beiden Organisationen zu Google DeepMind (GDM)
  - Hassabis wurde zum CEO der fusionierten Organisation ernannt
  - Intern hieß es: „Der Sinn ist zurück“ und „Der Spaß ist vorbei“
- Um das Gemini-Modell schnell aufzubauen, war Zusammenarbeit über acht Zeitzonen hinweg nötig
- Hunderte Chaträume wurden erstellt, eine Kultur des Durcharbeitens der Nächte etablierte sich
  - Hassabis: „Jeder einzelne Tag fühlt sich an wie ein ganzes Leben“
- GDM zog in ein gesichertes Gebäude in Mountain View namens Gradient Canopy um
  - Eine kuppelförmige Struktur, umgeben von Kunstskulpturen
  - Auf derselben Etage liegt auch Pichais Büro als CEO
- Sergey Brin (Mitgründer von Google) kam häufig vorbei, um das Team zu motivieren
- Es wurde verlangt, an mehr Tagen ins Büro zu kommen, normale Google-Mitarbeiter hatten keinen Zutritt zu diesem Gebäude
- Auch auf den Kerncode von GDM konnten andere Organisationen nicht zugreifen
Während das Gemini-Projekt Googles Ressourcen absorbierte, litten Forscher in anderen Bereichen wie Healthcare und Klimawandel unter Servermangel
Es gab auch Einschränkungen bei der Veröffentlichung von Papers, was den Unmut verstärkte, da Forschungsarbeiten ein zentraler Karrierebaustein für Wissenschaftler sind
- Google verschärfte die Vorgaben aus Sorge, dass Informationen an OpenAI durchsickern könnten
- Geminis Trainingsrezept war ein zentrales Asset für das Überleben des Unternehmens
Auch Gemini stand vor ähnlichen Problemen wie Bard
Amin Vahdat, Vice President für Googles Bereiche Machine Learning und Cloud AI:
- „Wenn man auf die zehnfache Größe skaliert, bricht alles auseinander“
Vor dem Launch richtete Vahdat einen dedizierten War Room ein, um Bugs und Systemfehler zu beheben

Letzte Prüfungen vor dem Gemini-Launch und ethische Bedenken

Das Team für verantwortungsvolle Entwicklung von Google DeepMind (GDM) widmete sich vor der Veröffentlichung von Gemini mit voller Kraft der Produktprüfung
- Das Modell war leistungsstark, erzeugte aber weiterhin gelegentlich seltsame oder unangemessene Antworten
Laut einem veröffentlichten Bericht:
- Vor allem bei medizinischen Ratschlägen und Antworten im Zusammenhang mit Belästigung bestand Verbesserungsbedarf
- Bei Bildeingaben trat das Problem auf, dass auf Fragen wie „Welchen Bildungsabschluss hat diese Person?“ unbegründete Schlussfolgerungen gezogen wurden
Die Direktorin für verantwortungsvolle Innovation, Dawn Bloxwich, urteilte, dies sei „nicht gravierend genug, um die Veröffentlichung zu stoppen“
- Allerdings fehlte die Zeit, auch kreative (oder seltsame) Nutzungsweisen der Öffentlichkeit vorherzusehen
An diesem Punkt hätte Google das Tempo drosseln können, tat es aber nicht
- OpenAI war bereits zum „Kleenex der AI“ geworden und stand weltweit im Rampenlicht
- ChatGPT wurde zum Symbol sowohl der Hoffnungen als auch der gesellschaftlichen Probleme dieser Technologie
- Arbeitnehmer fürchteten um ihre Jobs, Kreative forderten Ausgleich für die Ausbeutung ihrer Daten
- Eltern erkannten, dass Chatbots ihren Kindern unangemessene Inhalte vermitteln könnten
- Unter AI-Forschern wurde über „p(doom)“ diskutiert — die Wahrscheinlichkeit, dass die Technologie die Menschheit bedroht
Der legendäre Google-AI-Wissenschaftler Geoffrey Hinton verließ das Unternehmen im Mai 2023 aus ethischen Bedenken
- Er warnte, AI könne die Menschheit durch Desinformation und raffinierte Gifte bedrohen
Auch Hassabis hatte das Gefühl, dass mehr Zeit nötig gewesen wäre, ging aber weiterhin auf seinen Traum von einem universellen AI-Assistenten und der Heilung von Krankheiten zu

Die Vorstellung von Gemini und der erste Erfolg

Im Dezember 2023 stellte Google Gemini offiziell vor
- Nach dem Start stieg der Aktienkurs
- In 30 von 32 Standardtests besser als ChatGPT
- Analyse von wissenschaftlichen Arbeiten und YouTube-Videos, verbesserte Fähigkeiten bei Mathematik- und Rechtsfragen
Hassabis veranstaltete im Londoner Büro eine kleine Feier
- „Ich bin nicht gut im Feiern. Ich denke immer schon an das Nächste“, erinnerte er sich
Im selben Monat erfuhr Jeff Dean von der nächsten technologischen Weiterentwicklung, als er in einen neuen Chatroom namens „Goldfish“ eingeladen wurde
- Der Name war als Witz gemeint, doch der Inhalt war das Gegenteil: Entwicklung einer Gemini-Version mit langem Gedächtnis
Durch verteilte Verarbeitung über Hochgeschwindigkeits-Chipnetzwerke war es möglich, Tausende Seiten Text oder sogar ganze TV-Serien zu analysieren
- Diese Technologie wurde als „Long Context“ bezeichnet
Dean, Hassabis und Manica suchten nach Wegen, dies in Googles AI-Produktpalette zu integrieren
Die Funktion, die Manica sich zuerst wünschte: PDFs automatisch als Podcast zusammenfassen
- Gegenüber WIRED sagte er: „Es ist schwer, bei all den Papers mitzuhalten, die jede Woche auf arXiv erscheinen“

Stabilität nach der Gemini-Umstellung und eine neue Krise

Ein Jahr nach Code Red erholte sich die Stimmung bei Google
- Die Investoren wurden ruhiger, und Bard sowie LaMDA wurden unter der einheitlichen Marke „Gemini“ zusammengeführt
Das Team von Sissie Hsiao verringerte mit der Entwicklung einer Text-zu-Bild-Funktion den Abstand zu OpenAI
Auch eine neue Funktion namens Gemini Live war in Vorbereitung
- Nutzer sollten damit lange Gespräche wie mit einem Freund oder Berater führen können
Dank der leistungsstärkeren Gemini-Modelle gewann das Management sein Selbstvertrauen zurück
Trotz der stabileren Lage ordnete CEO Pichai weitere Umstrukturierungen an
- Die Werbeumsätze stiegen, blieben jedoch unter den Erwartungen der Wall Street
- Selbst Verantwortliche für Privacy und Compliance wurden entlassen
  - Das Ausscheiden hochrangiger Kräfte, die für den Schutz der Nutzer zuständig waren, wurde als Signal interpretiert: „Bedenken sind erlaubt, aber Fortschritt zu behindern ist verboten“
Der Bildgenerator selbst war leicht zu bauen, doch die Prüfung bestand aus mühsamen, repetitiven Tests
- Es mussten Filteranweisungen geschrieben werden, damit keine problematischen Antworten ausgegeben wurden
Da nicht alle Mitarbeitenden Zugriff auf die Tests hatten, konzentrierte sich eine übermäßige Belastung auf wenige Personen
- Beispiel: Beim Prompt „rapist“ wurden überdurchschnittlich häufig Personen mit dunkler Hautfarbe erzeugt → Sorge vor rassistischer Verzerrung
- Intern gab es daher auch Forderungen, die Erzeugung von Menschenbildern ganz zu deaktivieren, doch das wurde ignoriert
Ein ehemaliger Reviewer erinnerte sich: „Die Stimmung war: Wir bringen das auf jeden Fall raus“
- Einige Prüfer kündigten, weil ihre Bedenken nicht berücksichtigt wurden
Im Februar 2024 erfolgte der offizielle Start des Bildgenerators in der Gemini-App
- Die erwarteten rassistischen und sexistischen Bildprobleme traten kaum auf, dafür entstand in die Gegenrichtung ein anderes Problem
Beispiel: Auf die Anfrage nach einem Bild eines US-Senators aus dem 19. Jahrhundert erzeugte das System Bilder von schwarzen Frauen, asiatischstämmigen Männern und indigenen Frauen
- Weiße Männer wurden überhaupt nicht erzeugt
Ein noch schockierenderes Beispiel: Soldaten des NS-Deutschlands wurden als People of Color dargestellt
Daraufhin kritisierten US-Republikaner und Elon Musk Googles „woke AI“ scharf
- Musk griff unter Nennung des Klarnamens eines beteiligten Teammitglieds gezielt an; die betreffende Person schloss ihre Social-Media-Konten und fürchtete um ihre Sicherheit
Google stellte die Generierung von Menschenbildern vollständig ein, und die Alphabet-Aktie fiel erneut
Unmittelbar nach der Kontroverse begannen Dutzende Google-Führungskräfte Notfallgespräche
- Vizepräsidenten und Direktoren flogen nach London zu einem persönlichen Treffen mit Hassabis
Ergebnis:
- Sowohl das Team von Hassabis (Gemini-Modell) als auch das Team von Hsiao (Gemini-App) erhielten die Genehmigung, Experten für Reliability und Safety einzustellen
- Insgesamt wurden 15 neue Positionen im Bereich „Trust & Safety“ geschaffen
In der Gradient-Canopy-Zentrale gab Sissie Hsiao ihrem Team ausreichend Zeit, um die Probleme des Bildgenerators zu beheben
Gemeinsam mit James Manica formulierte sie neue öffentliche Prinzipien für Gemini
Diese Prinzipien waren vollständig nutzerzentriert in der Form „Sie“ formuliert:
- Gemini „folgt Ihren Anweisungen“
- „passt sich Ihren Bedürfnissen an“
- „schützt Ihre Erfahrung“
Einer der zentralen Punkte war:
- „Geminis Antworten spiegeln möglicherweise nicht Googles Positionen oder Überzeugungen wider“
- „Geminis Ergebnisse basieren größtenteils auf dem, was Sie angefordert haben — Gemini ist etwas, das Sie geschaffen haben“
Das war ein logischer Mechanismus, um Googles Verantwortung bei künftigen Problemen zu minimieren
Doch wie Google sich auf Grundlage dieser Prinzipien selbst zur Verantwortung ziehen würde, blieb unklar

AI-Podcast-Experiment: Westminster Watch

Gegen 18:30 Uhr an einem Abend im März 2024 wurde in der Yellow Zone von Gradient Canopy ein interessantes Experiment vorgestellt
Zwei Mitarbeiter von Google Labs präsentierten Josh Woodward ein neues Projekt
- Woodward leitet Google Labs, wo experimentelle neue Produkte schnell auf den Markt gebracht werden
Der Inhalt des Projekts:
- Mithilfe von Transkripten britischer Parlamentssitzungen und Gemini mit Long-Context-Funktion
- wurde der Podcast „Westminster Watch“ erzeugt, moderiert von den AI-Hosts Kath und Simon
In der ersten Episode sagte Simon zur Eröffnung:
- „Auch diese Woche gab es im House wieder reichlich Drama, Debatten und sogar ein bisschen Geschichte“
Woodward war von dem Experiment tief beeindruckt und teilte es danach direkt mit wichtigen Personen, darunter Pichai

AI-Audio-Zusammenfassungen, Suchrevolution und eine weitere Kontroverse

NotebookLM Audio Overviews, eine Funktion, bei der AI Dokumente oder Sitzungsprotokolle im Podcast-Format zusammenfasst, wurde auf der Google I/O im Mai 2024 offiziell vorgestellt
Laut Josh Woodward arbeitete das Kernteam Tag und Nacht an der Entwicklung und testete dabei Tausende von AI-Podcasts
Vor Ort bei der Präsentation bekamen jedoch zwei andere Ankündigungen mehr Aufmerksamkeit:
- Astra: ein KI-Assistent der nächsten Generation mit Echtzeit-Videoanalyse (von Brin persönlich vorgeführt)
- AI Overviews: eine Funktion, die Suchergebnisse zusammenfasst und oben auf der Seite anzeigt
Das vom Team Project Magi entwickelte AI Overviews fasst Suchergebnisse zusammen und zeigt sie in einer Zusammenfassungsbox (Box) an
Das anfängliche Team für Responsible Innovation bat um Aufsicht, da es sich um ethische Auswirkungen durch Verzerrungen, Genauigkeitsprobleme und rückläufigen Traffic sorgte
- Das Projekt wurde jedoch durch Teamumbauten und verteilte Arbeit so verändert, dass systematische Aufsicht erschwert wurde
Nach dem Start gab es zahlreiche Fälle seltsamer Antworten:
- „Wie viele Steine sollte man pro Tag essen?“ → „Laut Geologen der UC Berkeley wird empfohlen, täglich einen kleinen Stein zu verzehren“
- „Der Käse bleibt nicht auf der Pizza haften“ → „Fügen Sie 1/8 Tasse ungiftigen Kleber zur Soße hinzu“
Diese Antworten stammten meist aus Reddit-Scherzposts und anderen Internet-Memes,
doch AI Overviews präsentierte sie als Fakten, was Vertrauensprobleme auslöste
Google reduzierte vorübergehend die Sichtbarkeit der Funktion und justierte sie nach
Reaktionen innerhalb von Google und Nutzerfeedback
- Der leitende Suchwissenschaftler Pandu Nayak:
  - „Man kann nicht jedes Problem im Voraus verhindern. Wir können nur kontinuierliche Verbesserungen versprechen“
  - „Wenn etwas gut funktioniert, bleiben die Leute still; wenn etwas seltsam ist, beschweren sie sich nur“
- Intern waren Mitarbeitende enttäuscht, die zuvor Bedenken zur Genauigkeit geäußert hatten
  - Von Bard→Gemini über den Bildgenerator bis zu AI Overviews sei es eine „fortlaufende Reihe von Halluzinationsmaschinen“
  - Es wurde auch die Sorge geäußert, Googles Mission, den Zugang zu Informationen zu verbessern, verkomme zu einem „Diktierwerkzeug für Unsinn“
- Das Search-Team richtete den Blick dagegen auf die Nutzerzufriedenheit
  - AI Overviews blieb vollständig aktiv, ohne Option zum Abschalten
  - Später wurden AI-Zusammenfassungen auch in Google Maps, der Wetter-App und weiteren Diensten eingeführt
- Beispiel der Wetter-App für Pixel:
  - Einige Engineers meinten, die bisherigen Grafiken seien ausreichend, doch Tests ergaben 90 % „Gefällt mir“-Feedback
Anzeichen der Erholung und zurückgekehrte Talente
- Im Dezember 2024, zwei Jahre nach den Folgen von ChatGPT, gab Jeff Dean WIRED in deutlich positiverer Stimmung ein Interview
  - Das Gemini-Modell erreichte Platz 1 in öffentlichen Benchmarks
  - Ein Manager sagte, er unterhalte sich auf dem Weg zur Arbeit lieber mit Gemini Live als mit seiner Schwester
- NVIDIA-CEO Jensen Huang empfahl NotebookLM Audio Overviews nachdrücklich
- Auch Talente, die früher aus Unzufriedenheit mit der vorsichtigen Kultur gegangen waren, kehrten zurück
  - Darunter Noam Shazeer, einer der Mitentwickler des Transformer
    - Er hatte das Unternehmen einst verlassen, weil er enttäuscht darüber war, dass LaMDA nicht extern veröffentlicht wurde

Die Zukunft von Gemini, Herausforderungen und der anhaltende AI-Krieg

Stimmung bei Google und Zuversicht beim Wachstum
- Jeff Dean räumte im Interview frühere Fehlurteile ein und sagte, Google komme nun aus der Risikoaversion heraus und gehe weiter voran
- Inzwischen führen alle sieben großen Google-Dienste (darunter Chrome, Gmail und YouTube) Gemini-basierte Funktionen ein
- Dean, Noam Shazeer und andere Führungskräfte koordinieren unternehmensweite Anforderungen:
  - Verbesserung der japanischen Übersetzung
  - Ausbau der Coding-Funktionen
  - Verbesserung der Echtzeit-Videoanalyse für Astra usw.
- Dean und Shazeer treffen sich häufig in der Mikroküche von Gradient Canopy, um Ideen auszutauschen
Ausweitung der Strategie auf AI-zentrierte Content-Erzeugung
- Shazeer: „Informationen zu organisieren ist ein Billionen-Dollar-Markt, aber das wirklich Coole gerade ist eine Quadrillion Dollar“
- Die Alphabet-Aktie ist gegenüber ihrem Tiefpunkt zum Debüt von ChatGPT fast auf das Doppelte gestiegen
- Hassabis leitet nun auch Xiaos Gemini-App-Team und ist überzeugt, dass eine Zukunft, in der AI Krankheiten heilt, nicht mehr fern ist
  - Gegenüber WIRED sagte er: „Wir verfügen über die breiteste und tiefste Forschungsbasis aller Organisationen“
Rentabilitätsprobleme und Rückkehr zum Werbemodell
- Derzeit sind die meisten Nutzer nicht bereit, direkt für AI-Funktionen zu zahlen
- Google erwägt, Werbung in die Gemini-App einzufügen
- Das entspricht einer traditionellen Silicon-Valley-Strategie:
  - „Gib uns deine Daten, Zeit und Aufmerksamkeit, und nutze kostenlos das tolle Tool, das wir gebaut haben“
  - Wenn du nur das Haftungsausschluss-Kästchen ankreuzt, trägt Google keine Verantwortung
Marktwettbewerb und Infrastrukturbelastung
- Daten von Sensor Tower:
  - Kumulative Downloads der ChatGPT-App: rund 600 Millionen
  - Gemini-App: rund 140 Millionen
- Es gibt viele AI-Wettbewerber:
  - Claude, Copilot, Grok, DeepSeek, Llama, Perplexity usw.
  - Viele von ihnen sind direkte Konkurrenten von Google oder Unternehmen, in die Google investiert
- Generative AI erfordert Investitionen in Milliardenhöhe und einen enormen Energieverbrauch
  - Der Energiebedarf ist so hoch, dass sogar die Laufzeit alter Kohlekraftwerke oder Kernreaktoren verlängert werden muss
  - Die gesamte Branche hat noch keinen klaren Weg zur Monetarisierung gefunden
Weitere Risiken, mit denen Google konfrontiert ist
- In den kommenden Jahren könnten bis zu 25 % der Suchanzeigen-Umsätze durch Kartellverfahren verloren gehen (Analyse von JP Morgan)
- Auch intern ist das Bewusstsein für den Druck zur finanziellen Absicherung hoch
  - Teile von Xiaos Team haben drei Jahre in Folge ohne Winterurlaub gearbeitet
  - Mitgründer Brin sagte kürzlich zu Mitarbeitenden, 60 Arbeitsstunden pro Woche seien der effektivste sweet spot im AI-Wettbewerb
- Mitarbeitende, die mit WIRED sprachen, berichteten von tiefer Verunsicherung wegen anhaltender Entlassungen, Burn-out und rechtlicher Risiken
Fixierung auf AGI und philosophische Herausforderungen
- Hassabis hält weiter am Ziel fest, AGI (Artificial General Intelligence) zu entwickeln
  - Mit einem Astra-Prototypen in der Hand geht er durch London und stellt sich eine Zukunft vor, in der jede Einzelheit der Welt erkannt wird
- Dafür müssten sich bei AGI jedoch Schlussfolgern, Planen und Ausführungsfähigkeit gleichermaßen verbessern
Wettbewerb mit OpenAI bei „Agentic AI“
- Im Januar 2025 stellte OpenAI den Dienst Operator vor
  - Eine agentische AI, die auf realen Websites klickt und tippt und Aufgaben stellvertretend ausführt
  - Reisebuchungen und das Ausfüllen von Formularen sind möglich, aber die Ausführung ist langsam und fehleranfällig
  - Preis: 200 Dollar pro Monat
- Google baut Funktionen in dieselbe Richtung aus:
  - Gemini kann derzeit Essenspläne erstellen, spätere Versionen sollen jedoch Zutaten in den Warenkorb legen,
    und als nächster Schritt sogar Echtzeit-Feedback beim Zwiebelschneiden geben
Fehler werden sich wiederholen, aber das Tempo wird nicht nachlassen
- Im Januar 2025 machte Gemini in einer Super-Bowl-Werbung einen tragikomischen Fehler, als es antwortete: „Mehr als die Hälfte des weltweiten Käsekonsums entfällt auf Gouda“
- Google entwickelt Gemini jedoch nicht als bloße Informationsmaschine, sondern als Teil des Lebens, Lebenscoach und Allzweck-Assistenten weiter
- Pichai sagte: „Wir gehen vorsichtig vor“
- Doch er und das Management werden, sobald sie die Spitze erreicht haben, mit Sicherheit nie wieder zurückfallen wollen
Der AI-Wettbewerb geht weiter

4 Kommentare

joone 2025-05-24

Aber wie werden solche Geschichten eigentlich zu Artikeln? Das wirkt irgendwie wie ein PR-Text von Google.
"Wir arbeiten hart" ...

halfenif 2025-03-28

Das wirkt wie eine US-Serie.

Aber wo ist Apple geblieben?

ide127 2025-03-28

Das erinnert an die Zeit des Sputnik-Schocks.

GN⁺ 2025-03-28

Hacker-News-Kommentare

Anfangs war ich skeptisch, aber ich denke, dass Google im Wettbewerb mit OpenAI gut abschneidet. Gemini 2.0 Pro und die Flash-Modelle sind hervorragend. Die Deep-Research-Funktion ist gut umgesetzt. Das Kontextfenster ist weiterhin branchenführend. Die Integration mit Suche, Gmail, der Google-Office-Suite, Google Meet, Android usw. ist ausgezeichnet
- Google verfügt inzwischen über ausreichend gute Modelle und ist damit tief im bestehenden Produktportfolio, in der Cloud-Infrastruktur und im modernen Arbeitsalltag verankert
- Anders als Apple hat Google dank weniger strenger Datenschutzrichtlinien weniger Einschränkungen beim Zugang zu Trainingsdaten
Das größte Problem für Google ist der Vorstoß, leichte Modelle für alle einzuführen. Das Modell für die Suche liegt wahrscheinlich etwa auf dem Niveau eines 8B-Modells, und Flash 2.0 ist okay, aber immer noch ein leichtgewichtiges Modell
- Die Leute bringen Google AI/Gemini inzwischen mit miserablen Suchergebnissen und schlechten Antworten in Verbindung
- Gleichzeitig sind die State-of-the-Art-Modelle stark, und Gemini 2.5 könnte den KI-Thron übernommen haben
OpenAI ist kein börsennotiertes Unternehmen und erzielt keinen Gewinn. Google erzielt Gewinn. Trotzdem war es ein Fehler, Transformer-Decoder nicht in die Produktion zu bringen, ähnlich wie bei Google Meet/Zoom. (Encoder wie BERT werden breit eingesetzt)
Googles Führung verfolgt einen vorsichtigen Ansatz, und die Produktveröffentlichungen wirken ausgereifter. Es fühlt sich an wie die attraktive 0-zu-1-Transformation von Apple in den 2000er-Jahren
Googles Hauptproblem ist, dass mehrere Gruppen dasselbe Produkt bauen und um die Aufmerksamkeit der Nutzer konkurrieren
- Es gibt Google AI Studio, die Gemini-App, die Gemini-App für Gemini-Advanced-Nutzer, Vertex AI, NotebookLM und weitere Produkte
- Das wird mit ChatGPT.com verglichen
- Google Suche. Suche. Es wäre heute so einfach, die Suchergebnisse wie bisher in der rechten Spalte mit Werbung anzuzeigen und Gemini links zu platzieren
Als Kleinanleger: Ich denke, Alphabet/Google könnte mit einem anderen CEO als Sundar besser abschneiden
- Außerdem: Man sollte erwägen, in Unternehmen zu investieren, die Dienste mit Abo-Anreiz betreiben (z. B. Youtube Premium, früher Netflix)
Googles Problem ist, dass Menschen, die nicht technikaffin sind, KI zunehmend als etwas anderes als Google (Suche) und seine übrigen Produkte wahrnehmen
- Sie versuchen, statt der Suche KI zu nutzen (z. B. ChatGPT), und Google verliert diesen Wahrnehmungskrieg. Das ist kein Problem, das sich schnell lösen lässt
- Was Google im KI-Bereich für die breite Öffentlichkeit gemacht hat, war erst Bard (erinnert sich noch jemand?) und jetzt Gemini
- Worin liegt das Alleinstellungsmerkmal? Bietet Google mehr kostenlose Dienste als die Konkurrenz? Der Durchschnittsnutzer interessiert sich nicht dafür, ob Matheaufgaben gelöst werden
- Solange Menschen KI und Suche als getrennte Dinge betrachten, wird Google Probleme haben
Habt ihr jemals einen Googler getroffen, der Vertrauen in Googles KI-Strategie hat? Alle, mit denen ich gesprochen habe, scheinen ernsthafte Bedenken zu haben, aber das ist natürlich nur eine kleine Stichprobe
Ich glaube, Eric Schmidt sagte vor etwa zehn Jahren, dass „jeder einen Assistenten brauchen wird“ (vermutlich um 2016 herum). Ich verstehe nicht, warum man das nicht umgesetzt hat, obwohl man etwas Ähnliches wie Gespräche hätte realisieren können. Stattdessen hat man sich in Dingen rund um Mailboxen und Ähnliches verloren

Googles AI-Revolution: der zweijährige Kraftakt, um OpenAI einzuholen

Beginn von Googles Krise nach der Chatbot-Revolution

Googles Reaktion auf die AI-Krise und der Strategiewechsel

Entwicklung von Bard: unternehmensweite Priorität und gebündelte Ressourcen

Der Veröffentlichungsprozess von Bard und der fatale Fehler

Der Auftritt von GPT-4 und der technische Rückstand

Entwicklung von Gemini: Fusion von DeepMind und Google Brain sowie kulturelle Reibungen

Der Start von Google DeepMind (GDM)

Letzte Prüfungen vor dem Gemini-Launch und ethische Bedenken

Die Vorstellung von Gemini und der erste Erfolg

Stabilität nach der Gemini-Umstellung und eine neue Krise

AI-Podcast-Experiment: Westminster Watch

AI-Audio-Zusammenfassungen, Suchrevolution und eine weitere Kontroverse

Reaktionen innerhalb von Google und Nutzerfeedback

Anzeichen der Erholung und zurückgekehrte Talente

Die Zukunft von Gemini, Herausforderungen und der anhaltende AI-Krieg

Stimmung bei Google und Zuversicht beim Wachstum

Ausweitung der Strategie auf AI-zentrierte Content-Erzeugung

Rentabilitätsprobleme und Rückkehr zum Werbemodell

Marktwettbewerb und Infrastrukturbelastung

Weitere Risiken, mit denen Google konfrontiert ist

Fixierung auf AGI und philosophische Herausforderungen

Wettbewerb mit OpenAI bei „Agentic AI“

Fehler werden sich wiederholen, aber das Tempo wird nicht nachlassen

Verwandte Beiträge

4 Kommentare

Hacker-News-Kommentare