Google erklärt dem Web den Krieg
(tante.cc)- Google Search verlagert sich von der Weiterleitung von Nutzern per Link hin zu aufbereiteten Antworten und schafft damit eine neue, kontrollierbare Schicht über dem Web
- Bei AI Overviews kommt eine Analyse zu dem Ergebnis, dass in rund 10 % der Fälle falsche Antworten ausgegeben werden, und Search verabschiedet sich weitgehend davon, Links zu den Informationsquellen bereitzustellen
- Hinter der Verpackung als „AI“ und „agentic“ steckt im Kern ein Ansatz, Informationen zu dekontextualisieren, ihre Quellen zu entfernen und sie durch LLM-Antworten zu ersetzen
- Websites und kreative Werke werden weniger als gemeinsam geteilte kulturelle Güter behandelt, sondern eher als unbezahltes Rohmaterial für Googles synthetische Textpresse
- Die Gegenmaßnahmen sind De-googlifying, das Meiden von Chrome und die Nutzung alternativer Suchmaschinen; andernfalls könnte man nur noch Informationen sehen, die Google für relevant hält
Die neue Abstraktionsschicht, die Google Search über das Web legt
- Die Google-I/O-Keynote lässt sich als Angriff auf das lesen, was vom Web noch übrig ist, und Googles Darstellung zeigt eine Richtung, in der Search noch stärker auf aufbereitete Antworten statt auf das Bereitstellen von Links setzt
- Die aktuellen AI-Snippets von Search, die AI Overviews, liefern laut einer Analyse, nach der in rund 10 % der Fälle falsche Antworten ausgegeben werden, fehlerhafte Antworten, und Google gibt das bisherige Paradigma, Links zu den Informationsquellen bereitzustellen, weitgehend auf
- Hinter Etiketten wie „AI“ und „agentic“ steckt im Kern ein Verfahren, Informationen zu dekontextualisieren, Quellenlinks zu entfernen und anschließend LLM-generierte Antworten auszugeben
- Google schafft eine neue, kontrollierbare Abstraktionsschicht über dem Web, in der Websites und kreative Werke nicht mehr Ziele sind, die Nutzer direkt besuchen und teilen, sondern hinter der Google-Oberfläche verborgen werden
Kreative Werke werden nicht zu kulturellen Gütern, sondern zu Rohmaterial
- Websites, Texte und Kunst bleiben zwar weiterhin bis zu einem gewissen Grad wichtig, doch ihr Wert nähert sich eher dem von unbezahltem Rohmaterial für Googles synthetische Textpresse an
- Kreative arbeiten kostenlos, Google kontrolliert den Informationsfluss stärker und kann die Antworten, die Menschen erhalten, in die von Google gewünschte Richtung lenken
- Kreative Werke werden von wichtigen kulturellen Gütern, die man mit anderen teilen kann, zu Eingaben herabgestuft, die Google verarbeitet und neu zusammensetzt
Eine Veränderung gegen das partizipative Web
- Diese Veränderung wird nicht als Revolution hin zu einem partizipativen Web beschrieben, sondern als Gegenrevolution gegen das partizipative Web und gegen die Nutzer selbst
- Das Ziel besteht darin, sich das Web anzueignen und die Menschen in eine von Google kontrollierte und gesteuerte Abstraktionsschicht über dem Web zu lenken
- Beschrieben wird dies als Problem der Monopolisierung des Informationszugangs und als echtes Metaverse, das sich von offenen Standards und der Möglichkeit entfernt, dass jeder eine Ecke des Webs nach eigenen Bedürfnissen und Wünschen gestalten kann
- Weil Googles Einfluss auf Webstandards so groß ist, könnte diese Richtung sogar die Standardform der technischen Landschaft verändern, mit der das Web gebaut wird
Kontrollierbarkeit unter dem Namen „sicheres Web“
- Im nächsten Schritt könnten Google oder andere Unternehmen aus demselben Bereich neue abwertende Begriffe erfinden und verbreiten, die das bestehende Web als schmutzig, unkontrolliert, gefährlich und schlecht markieren
- Eine solche Benennung würde ähnlich wie „Dark Web“ funktionieren und Googles abstrahierte Oberfläche als sicheres Web etablieren
Gegenmaßnahmen: die Abhängigkeit von Google verringern
- Wenn einem das Web und die Fähigkeit der Menschen wichtig sind, mehr als bloße passive Konsumenten zu sein und am Web teilzunehmen, sollte man diese Veränderung ernst nehmen
- Das De-googlifying, also Google aus den eigenen mentalen Routinen zu entfernen, wird damit noch dringlicher
- Vorgeschlagen werden die Nutzung anderer Suchmaschinen und die Entscheidung, den Chrome-Browser nicht zu verwenden
- Andernfalls könnte man in einer verschlammten AOL-ähnlichen Umgebung aufwachen, in der der Zugang zu Informationen auf das beschränkt ist, was Googles synthetische Textpresse für relevant hält
1 Kommentare
Hacker-News-Kommentare
Es fühlt sich so an, als sei die KI inzwischen an dem Punkt angekommen, an dem gilt: Wenn man jetzt noch "Kunst, Code, Musik oder Schreiben" schaffen will, kann man das zur Selbstverwirklichung tun, aber damit kein Geld mehr verdienen.
Mit Inhalten Geld zu verdienen, ist nur noch für Großunternehmen möglich, und sobald man etwas Kreatives veröffentlicht, wird es am Ende nur wieder an Maschinen verfüttert und endlos vervielfältigt.
Es wirkt, als teile sich die Welt fast in zwei „Gesellschaften“: die Seite, die KI + Großunternehmen + sehr schnelle Innovation und Disruption liebt, und die Seite, die handwerkliche Arbeit + kleine Unternehmen + langsamere, aber nachhaltigere Innovation bevorzugt.
Persönlich würde ich lieber in der zweiten Gesellschaft leben, aber ich denke, beide können auf ihre Weise weiter existieren und sich entwickeln.
Natürlich werden unterschiedliche Gesellschaften am Ende miteinander interagieren und sich gegenseitig beeinflussen.
Einen ähnlichen Effekt habe ich im Hotelbereich gesehen. Hotels, booking.com und Google wollen alle Geld verdienen, aber Kunden suchen normalerweise bei Google nach „Hotel irgendwo“, und Google verkauft auf diesen Suchbegriff Werbung, sodass der Höchstbietende den größten Teil des Gewinns abschöpft.
Man sollte übermäßige Gewinne von Tech-Unternehmen, die aus der Arbeit anderer entstehen, besteuern und mit diesem Geld lebende Künstler unterstützen.
Das ist vage vergleichbar mit der früheren Abgabe auf Leerkassetten als Ausgleich für Piraterie. Nur sollte das Geld direkt an die tatsächlichen Künstler gehen und nicht an Labels oder Verlage.
Für so einen „Kunden“ wäre das kaum anders, als ein Mona-Lisa-Poster gerahmt aufzuhängen.
Vielleicht sind Künstler also weniger bedroht, sondern KI könnte Originalwerke sogar noch wertvoller und erfreulicher machen.
Um das zu verhindern, habe ich vor ein oder zwei Monaten den Großteil meiner Amazon-Redshift-Forschungswebsite hinter eine Basic-Auth mit Benutzername und Passwort gesetzt.
Alles ist weiterhin kostenlos, aber um Benutzername und Passwort zu bekommen, muss man mir eine E-Mail schreiben.
Ich habe Zeit investiert, um Inhalte zu erstellen. Wenn Firmen wie OpenAI das kopieren und über LLMs verkaufen und dadurch niemand mehr auf meine Website kommt, habe ich keinen Grund mehr, diese Inhalte zu erstellen. Dann gibt es weder etwas für OpenAI zum Abgreifen noch etwas für andere zum Lesen, und alle verlieren.
Das ist parasitär und wirkt oberflächlich betrachtet so, als würde man den Wirt töten. Es fühlt sich praktisch wie eine Abschaffung des Konzepts von Privateigentum an.
KI-Unternehmen können ohne meine Zustimmung etwas nehmen, das ich geschaffen habe, und es gewinnbringend verkaufen, und dieser Gewinn scheint zu einem erheblichen Teil aus dem Ertrag meiner Arbeit zu stammen, der sonst bei mir gelandet wäre.
Ich habe nach Möglichkeiten gesucht, KI-Unternehmen mitzuteilen, dass sie meine Inhalte entfernen sollen, aber die angebotenen Wege sind bloße Alibi-Mechanismen und wälzen die Last auf mich ab. Außerdem kann ich nicht einmal wissen, ob die Inhalte tatsächlich entfernt wurden. Es läuft auf so etwas hinaus wie: „Wenn Sie per Prompt nachweisen, dass Ihr Inhalt erscheint, versuchen wir Maßnahmen zu ergreifen, damit er nicht mehr erscheint.“
Als Folge der Benutzername/Passwort-Schranke hat Google die Platzierung meiner Website stark abgesenkt, und ich vermute, dass sie über die Suche nun fast nicht mehr gefunden wird.
Ich frage mich auch, ob der Wunsch, KI-Unternehmen die Entfernung der Inhalte mitzuteilen, selbst Dienste einschließt, die Quellenangaben und Links zum Original liefern. Perplexity macht das zum Beispiel ziemlich gut.
Wenn du den Zugriff auf Inhalte ohne Login blockierst, blockierst du auch die Indexierung durch Suchmaschinen, daher ist es selbstverständlich, dass Google dich schlechter rankt.
Mir ist das Endziel etwas unklar. Wenn man Inhalte kostenlos ins Web stellt, weiß ich nicht, was man gewinnt, wenn man KI-Indexierung verhindert. Erst recht nicht, wenn man damit neben KI auch echte Nutzer und klassische Suche aussperrt.
Ich verstehe die Frustration darüber, dass KI-Tools deine Inhalte verarbeiten und sie Nutzern wiedergeben, ohne auf deine Seite zu verlinken. Aber Menschen haben so etwas schon immer getan, ganz unabhängig von KI. Sie lesen Texte, lernen Fakten oder verstehen neue Ideen und verarbeiten diese Informationen dann in ihrer eigenen Arbeit, ohne die Quelle zwingend zu nennen oder überhaupt in Erinnerung zu behalten.
KI beschleunigt diesen Prozess und macht ihn sichtbarer, deshalb verstehe ich die Frustration. Aber vielleicht war schon die Erwartung nicht besonders realistisch, dass alles, was stromabwärts aus meiner Arbeit entsteht, immer mir zugerechnet wird.
Wie du sagst, wissen sie auch, dass sie gute Daten brauchen, also werden sie vielleicht tatsächlich irgendein Gleichgewicht suchen.
Sonst könnten KI-Labore am Ende anfangen, neue wertvolle Inhalte für ihre LLMs intern selbst zu produzieren. Das klingt verrückt, aber Netflix produziert ja auch eigene Inhalte.
KI-Labore werden vermutlich so groß werden, dass sie mehr tun als nur LLM-Inferenz anzubieten. Sie könnten so mächtig werden wie viele heutige Nationalstaaten oder sogar noch mächtiger.
Es ist schwer, hier das Endspiel zu verstehen. Websites haben Google ihre Inhalte crawlen lassen, im Tausch gegen Traffic.
Wenn Google das komplett kappt, sehe ich nicht, welchen Anreiz Websites dann noch haben, den Google-Crawler nicht zu blockieren.
Dass man eine existenzielle Bedrohung in anderen KI-Produkten sieht, die direkt Antworten liefern, verstehe ich, aber Google müsste doch auch die symbiotische Beziehung zum Web verstehen.
Warum auf irgendeiner zufälligen Website einkaufen, wenn Gemini das für dich erledigen kann? Warum Informationen bei Wikipedia suchen … du weißt, was gemeint ist.
Die nächsten Jahre dürften entscheidend für das Web sein. Facebook hat eine ähnliche Strategie versucht, als Apps an Macht gewannen, und ist letztlich gescheitert. Hoffentlich scheitert Google auch.
Wenn Websites nicht mehr veröffentlicht oder nicht mehr gecrawlt werden, womit sollen die Maschinen sich dann weiter ernähren?
In ihren Köpfen ändert sich also nichts, außer dass der Leser kein Mensch, sondern ein Bot ist. Aus Sicht des Schreibens ist das schrecklich.
Wir haben es Google schon vor langer Zeit überlassen, Traffic auf Websites zu schicken.
Hauptsächlich deshalb, weil Google darin so gut war, dass die Alternativen viel weniger nützlich wurden.
Jetzt, da Google sich sozusagen darauf konzentriert, „in sich geschlossen“ zu werden, müssen wir bessere Wege finden, Traffic auf Websites zu lenken. Idealerweise auf eine Weise, die nicht unter der Kontrolle eines einzelnen Unternehmens steht.
Vermisst noch jemand StumbleUpon?
Ich verstehe zwar, dass die Natur des Problems das wahrscheinlich macht, aber früher gab es jede Menge absurd ungeeigneten dezentralen Unsinn.
Gut kuratierte Link-Sammlungsseiten sind viel nützlicher, um neue Websites zu entdecken.
Als Betreiber einer Website habe ich selbst deutlich steigende Zugriffszahlen gesehen, aber wenn KI-Zusammenfassungen falsch sind und meine Seite als Quelle dranhängt, trifft mich das wirklich.
Ich fürchte, dass dieser Drang, KI überall hineinzudrücken, am Ende das Kompetenzniveau der Welt senken wird, und ich sehe keinen Weg, das aufzuhalten.
Ich habe heute einen Entwickler gefragt, wie unser Produkt in einer bestimmten Situation programmiert ist, und er hat mir nur die Zusammenfassung seines internen KI-Assistenten weitergeleitet, den er seit Kurzem nutzt.
Früher bekam ich von ihm wirklich gute, durchdachte Antworten, jetzt ist es nur noch KI-Antwort kopieren/einfügen.
Offenbar sind sie allerdings dagegen, wenn sie selbst gescraped werden: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...
Es wäre trauriger, wenn das Web nicht ohnehin schon so verrottet wäre.
Im Durchschnitt landet man auf irgendwelchen Seiten, die einem nur Werbung um die Ohren hauen und einen zum Abonnieren drängen wollen.
Ich verstehe nicht, warum so etwas nicht als Popup gilt.
Die Anreizstruktur von Suchmaschinen bevorzugt aktuelle statt gute Inhalte, weshalb alle Websites ständig Dinge ausspucken, die sich wie generierter Müll anfühlen.
Inzwischen klicke ich Suchergebnisse mit einem Zeitstempel aus den letzten zwei Jahren oft gar nicht mehr an, weil ich sie für Müll halte.
Die Antwort könnte vielleicht Kagi sein. Dort bin ich Kunde und nicht das Produkt.
Ehrlich gesagt sind nicht alle Websites so, gute Seiten gibt es noch. Aber Suchmaschinen führen einen nie dorthin. Sie zeigen einem den ganzen Tag nur Dreck.
Auch wenn es sonst vielleicht jemand anderes getan hätte: Tatsächlich war es Google, und sie haben den Brunnen vergiftet, aus dem wir alle trinken.
Etwa in der Mitte des Artikels nahmen drei riesige Banneranzeigen oben, rechts und unten mehr Platz ein als der eigentliche Text, und unten rechts schwebte eine automatisch abspielende Videoanzeige, die den Großteil einer der Banneranzeigen überdeckte.
Die „dynamische“ Anzeige mitten im Text vergrößerte und verkleinerte sich ruckartig, sodass man tatsächlich nichts mehr lesen konnte.
Das ist schon eine der vergleichsweise besseren Erfahrungen, die man heute beim Lesen von blogähnlichen Dingen macht. Es ist fast auf dem Niveau dubioser Pornoseiten angekommen.
Traurig und erbärmlich.
Solche Erklärungen ergeben für mich oft wenig Sinn, weil sie nicht zu meinem Problemmodell passen.
Ich bin jemand, der bloggt, also in heutiger Sprache ein „Content-Produzent“, und gleichzeitig auch Nutzer.
Als Nutzer möchte ich, dass der User-Agent meines Browsers Webseiten in meinem Auftrag darstellt, und ich möchte, dass ein Such-Agent Informationen aus verschiedenen Quellen extrahiert, sinnvoll zusammenfasst und korrekt auf die Quellen verweist.
Man kann einwenden, dass mir die Vermittlung über Plattformen egal sein kann, weil meine Inhalte ein Hobby sind. Das stimmt teilweise. Wenn ich davon leben müsste, könnte ich zu dem Schluss kommen, dass etwas, das meinen Lebensunterhalt zerstört, ein „Krieg“ gegen das Web ist.
Aber aus neutraler Beobachterperspektive wäre das, selbst wenn es ein Krieg ist, ein Krieg gegen meine Art der Teilnahme am Web durch inhaltsgetriebene Erstellung mit dem Ziel von Einnahmen, Ansehen und Belohnung.
Als Nutzer interessieren mich die einzelnen Websites und Produzenten eigentlich nicht besonders. Die Informationen darin sind nützlich, aber die Heterogenität der Seiten ist meist eher ein Hindernis beim Zugang zu Informationen.
Wenn Such- und Zusammenfassungs-Agenten das, was diese Websites sagen, korrekt synthetisieren und dadurch mein Modell der Realität präziser machen, bin ich viel zufriedener.
Deshalb kann ich mich davon überzeugen lassen, dass Googles Veränderungen die Wahrscheinlichkeit verringern, dass korrekte Inhalte entstehen, und dass ich dadurch häufiger in die Irre geführt werde. Aber das ist ein Werkzeug, und mein Weltmodell wird in der Realität regelmäßig überprüft werden.
Wenn Such- und Synthesemaschinen keine nützlichen Ergebnisse liefern, werde ich das merken, und ich muss dann den Umgang mit diesem Wissen so anpassen, dass keine katastrophalen Folgen entstehen. Aber eigentlich gilt das schon heute.
Ich kann auch jetzt nicht wissen, ob Google-Suchergebnisse nicht manipulierte, platzierte Ergebnisse sind, die meine Meinung beeinflussen sollen, oder ob Google nicht mit dem Internet Archive zusammengespannt hat, um einen fabrizierten Konsens echt erscheinen zu lassen.
Als Nutzer muss ich ohnehin schon viele Entscheidungen treffen, und sich mühsam durch Suchergebnisse zu lesen und selbst zu synthetisieren, ist weit weniger nützlich, als Agenten dafür einzusetzen.
Wenn es also einen Krieg gegen das Web gibt, nehme ich gerne daran teil. Auf der Seite gegen das Web.
Eine Inhaltsangabe hilft bei der Entscheidung, welchen Film man sehen will, ist aber kein Ersatz dafür, den Film tatsächlich zu sehen.
Bei Suchanfragen wie „50 usd in eur“ oder „current weather in Paris“ ist es in Ordnung, wenn KI direkt antwortet. Bei allem Komplexeren bevorzuge ich deutlich echte Links zu den Quellen.
Der optimistische Teil daran ist, dass dies wie eine Zuspitzung derselben Richtung wirkt, in die sich „das Web“ schon lange bewegt: Nutzer daran zu hindern, ehrlich und effizient an richtige Informationen zu kommen und dabei ihr Aufmerksamkeitsbudget und ihre Handlungsfreiheit zu bewahren.
Bisher geschah das, indem man für monetäre Anreize mehr Rauschen erzeugte, und jetzt, indem man für monetäre Anreize Rauschen wegschneidet.
Der Grund für einen gewissen Optimismus ist, dass es bisher keinen einzelnen Gegner gab und es deshalb schwer war, gegen ein halbwegs verteiltes System zu kämpfen. Jetzt aber verschlimmert Google die Lage aktiv und macht sich selbst zusammen mit einigen wenigen anderen Unternehmen zu klaren Zielen.
Hoffentlich bringt das mehr Menschen an ihre Belastungsgrenze, sodass sie entweder zu einem „alten Web“ zurückwollen, wie es vor Google und den Werbenetzwerken war, oder neue Wege finden, freier miteinander und mit Inhalten in Kontakt zu kommen.
Das wird kein kleiner oder einfacher Kampf. Zu großen Teilen ist es ein Kampf gegen den aktuellen Zustand des Kapitalismus selbst und dafür, unsere Aufmerksamkeit, unser kritisches Denken und unsere Entscheidungsfreiheit zurückzugewinnen.
Sie sollten die Website-Besitzer, deren Daten sie verwenden, bezahlen.
Inzwischen bin ich mir nicht einmal sicher, ob das schlecht ist.
Das Web ist so voller SEO-Müll, dass ein Usenet-artiger Reinigungsprozess vielleicht nötig ist, wenn Google sich zurückzieht.
Die KI-Funktionen sagen mir meistens direkt, was ich wissen will, und wenn ich etwas verifizieren möchte, gibt es meist auch Quellenlinks. Auch die traditionelle Linksuche funktioniert.
Leute, die sagen, sie sei unbrauchbar, können meistens keine konkreten Beispiele nennen, bei denen sie tatsächlich nichts gefunden haben.
Ich habe auch ein paar Schwachstellen gesehen. Alte und obskure Informationen scheinen bei den meisten Suchmaschinen problematisch zu sein, und für pirateriebezogene Inhalte kann man Yandex verwenden.