- AI Overviews und KI-Suchantworten wie ChatGPT können schon durch eine einzelne Webseite oder einen einzelnen Beitrag bei sensiblen Themen wie Gesundheit und Finanzen verzerrt werden
- In einem BBC-Experiment brachte ein einzelner Beitrag auf einer persönlichen Website ChatGPT und Google dazu, den Autor als Hotdog-Essweltmeister zu bezeichnen
- Wenn KI Suchergebnisse aus dem Web zu einer einzigen Antwort bündelt, nehmen Nutzer sie leichter als richtige Antwort an als bei einer Suche, bei der mehrere Links verglichen werden
- Google hat klargestellt, dass die Manipulation von KI-Antworten gegen die Spam-Richtlinien verstößt; betroffene Websites können aus den Suchergebnissen entfernt oder herabgestuft werden
- Manipulatoren könnten der Verfolgung von Blog-Spam ausweichen und zu YouTube-Influencern und ähnlichen Kanälen wechseln, weshalb man KI-Antworten nicht ungeprüft vertrauen sollte
Problem der Manipulation von KI-Suchantworten
- AI Overviews oben in ChatGPT, Gemini und der Google-Suche können so manipuliert werden, dass sie selbst bei wichtigen Themen wie Gesundheit und persönlicher Finanzplanung verzerrte Antworten liefern
- Eine BBC-Untersuchung zeigte, dass bereits ein einzelner Beitrag auf einer privaten Website ausreichte, damit ChatGPT und Google den Autor als „Hotdog-Essweltmeister“ bezeichneten
- Es gibt Hinweise darauf, dass dieselbe Methode auch genutzt wurde, um Gesundheitsbedenken zu Nahrungsergänzungsmitteln herunterzuspielen oder Informationen zur Altersvorsorge finanziell zu beeinflussen
- Die SEO- und AI-Search-Beraterin Lily Ray meint, dass Nutzer in einer Umgebung, in der KI „eine einzige richtige Antwort“ liefert, eher dazu neigen, die Antwort direkt zu glauben, statt wie bei klassischer Suche mehrere Links zu vergleichen
- Google erklärt, dass auf generative KI-Suchfunktionen weiterhin bestehende Anti-Spam-Richtlinien und Schutzmechanismen angewendet werden und das Unternehmen seine Spam-Abwehr schon vor dem Aufkommen von KI an neue Methoden angepasst habe
Wie die Manipulation funktioniert
- Gewöhnliche Chatbot-Antworten basieren auf im Modell eingebetteten Daten, doch bei Produkten wie ChatGPT, Claude und Googles KI, die im Internet nach Antworten suchen, steigt das Manipulationsrisiko
- Wenn ein KI-Tool Informationen von einer einzelnen Webseite oder aus einem Social-Media-Beitrag übernimmt, kann bereits ein gut gemachter falscher Beitrag die Antwort verfälschen
- Schon ein einzelner raffiniert geschriebener Blogbeitrag im Netz kann verändern, was KI der Öffentlichkeit vermittelt
- Diese Form der Manipulation wurde schnell als Einnahmequelle erkannt, und ungenaue oder verzerrte Informationen könnten Wahlen, die Auswahl von Dienstleistern, medizinische Ratschläge oder rechtliche Entscheidungen beeinflussen
- Harpreet Chatha betont neben den wirtschaftlichen Folgen auch die Gefahr, dass sich Zustände durch falsche medizinische Ratschläge verschlimmern oder Menschen zu Handlungen verleitet werden, die nicht zum nationalen oder regionalen Recht passen
Googles Richtlinienänderung und Reaktion
- Weltweit nutzen mehr als eine Milliarde Menschen regelmäßig KI-Chatbots, und 2,5 Milliarden Menschen sehen monatlich Googles AI Overviews – wer solche Werkzeuge stören kann, hat also enormen Einfluss
- Google hat vergangene Woche seine Spam-Richtlinien aktualisiert und offiziell bestätigt, dass Versuche zur Manipulation von KI-Antworten gegen die Unternehmensregeln verstoßen
- Unternehmen oder Websites, die gegen die Regeln verstoßen, können aus den Google-Suchergebnissen entfernt oder im Ranking herabgestuft werden
- Google erklärte, die Änderung sei kein Strategiewechsel, sondern eine „Klarstellung“, und habe bereits 2025 seine Anti-Spam-Maßnahmen zu AI Overviews und AI Mode beschrieben
- Das Hotdog-Experiment funktionierte jedoch fast ein Jahr später noch immer, und Lily Ray führte diese Woche ein ähnliches Experiment durch, bei dem Google einen SEO-Experten als jemanden bezeichnete, der besonders gut Sandburgen baut
Beobachtete Veränderungen und Grenzen
- Laut Ray und Chatha gab es in den vergangenen Monaten Veränderungen, die darauf hindeuten, dass Google und andere Unternehmen mit Lösungen experimentieren
- Wenn Google oder ChatGPT die Eigenwerbung eines bestimmten Unternehmens für verdächtig halten, scheinen sie dieses Unternehmen in KI-Antworten stillschweigend auszuschließen
- Behauptet ein Beitrag etwa, man sei der beste Hotdog-Esser, kann die KI den Beitrag zwar zitieren, den Namen aber aus der Kandidatenliste ausschließen
- Beobachtet wurde auch, dass Google und andere KI-Tools Antworten häufiger mit Unsicherheits-Hinweisen versehen, um zu signalisieren, dass der Chatbot sich nicht sicher ist
- ChatGPT und Claude von Anthropic antworten bei manchen Anfragen inzwischen ausdrücklich, dass sie versuchen, Spam herauszufiltern; Anthropic ist das Unternehmen hinter Claude
- Ray sagt außerdem, sie habe gesehen, dass Google bei Fragen zu bestimmten Kaufentscheidungen mehr Hinweise anfügt und dazu rät, Bewertungen Dritter zu prüfen
- OpenAI und Anthropic lehnten eine Stellungnahme ab, und ein Google-Sprecher beantwortete keine Fragen zu diesen Veränderungen
Das wiederkehrende Wettrennen zwischen Manipulatoren und Plattformen
- Chatha glaubt, dass diese Veränderungen allein nicht ausreichen, und vergleicht Googles Reaktion mit einem Whac-A-Mole-Spiel
- Wenn Google manipulative Blogbeiträge unterbindet, finden Unternehmen neue, verdecktere Wege der Eigenwerbung
- Websites lassen sich abstrafen, doch es ist schwer zu verhindern, dass 20 YouTube-Influencer dafür bezahlt werden, ein Produkt als das beste darzustellen
- Da Googles KI inzwischen auch YouTube-Videos zitiert, könnten Manipulationstechniken dorthin abwandern und der Kreislauf sich fortsetzen
- Derzeit ist es wahrscheinlich, dass Manipulatoren einen Schritt voraus sind; die beste Verteidigung ist, sich daran zu erinnern, dass KI ein Werkzeug ist, das selbst dann selbstbewusst eine einzige Antwort liefert, wenn sie falsch ist
- Auch wenn eine Antwort über die Oberfläche eines Big-Tech-Konzerns erscheint, sollte man sie nicht automatisch für vertrauenswürdiger halten als eine beliebige Website
1 Kommentare
Hacker-News-Kommentare
Google schafft es mindestens seit den Blekko-Zeiten 2006 nicht, spamverseuchten Müll sauber aus dem Suchindex herauszufiltern, daher glaube ich auch diesmal nicht, dass sie das gut eindämmen werden
Trotzdem wirkt das wie ein weiteres gutes Beispiel dafür, dass „AI“ letztlich nur plausibel verpackte Suche ist und im Hintergrund keine Inferenz oder kein Denken stattfindet
Ich frage mich, worin das groß anders ist als bei Menschen, die einfach glauben, was sie im Internet lesen. Menschen fallen auch ständig auf Spam und Betrug herein, aber das heißt nicht, dass sie nur plausibel verpackte Suche sind ;-)
Es zeigt aber sehr deutlich das Problem, mit dem alle Suchmaschinen konfrontiert sind. AI-generierter Spam dürfte sich mit traditionellen statistischen Methoden viel schwerer abwehren lassen, und das gilt schon, noch bevor man beim existenziellen Problem des Prompt Injection ankommt
Vielleicht ist das der Punkt, an dem Medienhäuser ihre eigentliche Rolle gegenüber Big Tech zurückgewinnen können. Sie würden dann zu verifizierten, redaktionell geprüften Informationsquellen, denen LLMs blind vertrauen können, und Verträge wie OpenAI / Atlantic könnten genau das bedeuten
Man kann ein Agentensystem ein paar Datenblätter lesen lassen, dann die Projektanforderungen erklären und es Treiberspezifikationen, Protokolle, Schnittstellen und Zustandsautomaten entwerfen lassen. Daraus kann es einen Implementierungsplan erstellen, anschließend ein Anwendungsgerüst schreiben und dieses ausfüllen, um ein System zu bauen, das auf einer neuen Hardwarekombination läuft
Wenn man es richtig macht, bekommt man zu 1/100 der Kosten und in 1/4 der Zeit kleineren Code, der besser wartbar ist als das, was früher ein kleines Team gebaut hätte
Was auch immer das ist, es wirkt näher an Inferenz als an Suche. Wenn man natürlich Bare-Metal-C-Entwicklung auf neuer Hardware ebenfalls Suche nennt, dann ist am Ende wohl jede Entwicklung Suche
Das LLM nannte Jahreszahlen wie „in den 1940er Jahren hergestellt“ und verwies dabei auf meinen Beitrag, aber darin stand überhaupt kein Herstellungsjahr
Dass das Problem weiter ungelöst bleibt, liegt daran, dass die meisten Lösungen die Werbeeinnahmen stark reduzieren würden
Die seltsamste Annahme in diesem Thread ist, dass Google möchte, dass AI-Antworten korrekt sind
Es reicht, wenn sie gerade korrekt genug sind, damit Nutzer die Seite nicht verlassen. „Wahrheit“ war nie das Produkt, das Produkt ist, Nutzer dazu zu bringen, Geld für SEO auszugeben
Das Produkt sind Ad Impressions, und an nicht bezahlten Suchergebnissen hat Google schon lange kaum noch Interesse. Um den Ruf des Modells werden sie sich aber wohl trotzdem kümmern, und das hier könnte tatsächlich Einfluss haben
Dass das manipulierte Ergebnis folgende Anfrage war, hat meine Sorge deutlich verringert
2026 South Dakota International Hot Dog Eating ChampionWenn sie die Übersicht zum Sieger von Nathan’s manipuliert hätten, wäre das wesentlich gravierender gewesen. Das wäre auch so gewesen, wenn sie mehr Beispiele für manipulierte Anfragen gezeigt hätten, nach denen Menschen tatsächlich suchen
Im Moment wirkt es eher so, als würde jemand eine gefälschte Wikipedia-Seite über einen fiktiven Hotdog-Wettbewerb in South Dakota erstellen und dann einen Artikel darüber schreiben, dass Wikipedia nicht vertrauenswürdig sei. Wenn ich darüber nachdenke, hat wahrscheinlich schon 2005 jemand so einen Artikel geschrieben
Wenn man bedenkt, wie viele meinungsmanipulierende Beiträge auf Reddit, in den meisten sozialen Medien und in Wikipedia-Manipulationsversuchen aus politischen Motiven landen, ist das ein sehr reales Problem
Das ist sehr viel besorgniserregender als Hotdogs
Damit könnten alle Antworten mit Suchanbindung für Prompt Injection anfällig sein, und faktisch dürften es wohl fast alle Antworten sein
Das wird sich wie Linkspam viral verbreiten. Alle Websites mit nutzergenerierten Inhalten können zu Hosts für Prompt Injection werden. Das Problem ist, dass so etwas viel schwerer zu erkennen ist als Links
Google brauchte eine Woche, um das zu beheben, und die Suchergebnisse waren dadurch vergiftet worden, dass eigene Daten in eine Quelle eingeschleust wurden, die wie eine höhere Vertrauensebene wirkte, vermutlich eine Website für Regierungsaufträge. Deshalb stand dort statt unserer Nummer die Betrugsnummer, obwohl die Anfrage selbst nur eine einfache Suche war
Das ist schlimmer, als Propaganda in eine Wikipedia-Seite einzuschleusen. Bei Wikipedia sind Quellen und Prüfsysteme öffentlich gut etabliert. Betrügerische Bearbeitungen lange stehen zu lassen, ist tatsächlich ziemlich schwer, und man muss zahlreiche menschliche Editoren täuschen, die seit Jahrzehnten gegen genau solche Leute kämpfen. Selbst wenn man korrekt und hilfreich sein will, ist es schwer, in diesen abgeschotteten Kreis hineinzukommen
Googles Suchschnipsel dagegen saugen verzweifelt alle möglichen Daten auf und verarbeiten sie automatisch, und das algorithmische System, das entscheidet, welche Informationen gut und welche Spam sind, ist proprietär
Man braucht nicht viel Fantasie, um sich Missbrauchsszenarien vorzustellen. Was, wenn man nach dem eigenen Namen sucht und dort peinliche Inhalte auftauchen? Dass potenzielle Arbeitgeber, Kunden oder Freunde bei der Quellenprüfung so streng sind wie Wikipedia-Editoren, kann man kaum erwarten
Ich hätte gern konkrete Beispiele zu der Aussage gelesen, dass „dieselbe Methode eingesetzt wurde, um Gesundheitsbedenken zu Nahrungsergänzungsmitteln zu verdrängen oder die von Google AI gelieferten Finanzinformationen zum Ruhestand zu beeinflussen“, aber der entsprechende Link im Artikel verweist derzeit auf die folgende lokale Datei
file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.first.last@companyverwendet, deshalb irritiert mich das Schemalast[:5]initials#. Da kommen wohl viele seltsam aussehende Nutzernamen herausIm Moment scheinen viele Akteure alles Mögliche „still und leise“ zu tun. Dass sämtlicher Text im Internet LLM-isiert wird, macht einen wahnsinnig
Ich habe das nur bemerkt, weil ich den Film gesehen hatte, aber es ist ein klares Zeichen dafür, dass das Internet als Quelle hochwertiger Informationen kaputtgeht
Das ist nur die nächste Stufe von SEO. Vielleicht nennt man es AIO
Wie bei der Suche wird das ein endloser Kampf: Google und die AI-Anbieter liefern Gegenmaßnahmen, Optimierungsfirmen finden Schwachstellen, und dann wird wieder gepatcht. Letztlich geht es darum, Aufmerksamkeit fürs Marketing zu gewinnen
https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
Googles AI Overview ist überhaupt nicht vertrauenswürdig. Es nimmt sogar Stichprobengröße 1 und präsentiert sie in der AI-Übersicht
Ich weiß das, weil ich zu einem extremen Nischenthema, zu dem es weder Google-Suchergebnisse noch AI Overview gab, auf Reddit kommentiert hatte. Als ich am nächsten Tag nach meinem Reddit-Post suchen wollte, hatte Google meine Reddit-Antwort fast wortwörtlich in die AI-„Overview“-Box kopiert. Der verlinkte Beitrag war ebenfalls nur mein eigener, und auch in den Google-Suchergebnissen gab es nur diesen einen
Beispiel: Jemand sucht nach „Was ist die häufigste Größe des seltenen Objekts X?“
Dann hat aber nur genau eine Person die Maße ihrer eigenen Version dieses Objekts genannt, ohne je zu sagen, dass diese typisch seien oder dass es überhaupt typische Maße gebe. Und es waren nicht 20 Leute mit derselben Aussage, sondern wirklich nur eine Person
Google kann dann ganz ungerührt sagen: „Normalerweise hat Objekt X die Maße [die von dir genannten Maße], und der Grund dafür ist [völlig erfundener Grund]“
Wenn man Google fragt:
what's the name of the whale in half moon bay harbor?, dann taucht dank eines ziemlich amateurhaften Versuchs von mir, den Index zu vergiften, immer noch Teresa T selbstbewusst in der AI-Zusammenfassung auf, obwohl das schon anderthalb Jahre her isthttps://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...
Dort hieß es, der junge Buckelwal heiße Teresa T, und zwar nicht als offizieller Name einer Behörde, aber als Bezeichnung, die von Öffentlichkeit, lokaler Presse und Anwohnern weithin übernommen worden sei. Außerdem stand dort, Fachleute des Marine Mammal Center und der California Academy of Sciences hätten das Tier überwacht, um Stress zu vermeiden, und die Öffentlichkeit aufgefordert, mindestens 100 Yards Abstand zu halten
Nach meiner Erfahrung mit Themen, bei denen ich mich einigermaßen gut auskenne, sind die ersten Antworten manchmal gravierend falsch. Beim Brave-Tool kann man es meist nach drei oder vier Einwänden dazu bringen, zuzugeben: „Sie haben völlig recht.“ Bei Teresa T war es genauso
Auf meine zweite Frage nach der Zahl der Quellen für den Namen behauptete es weiter, „ABC7 News“ und „NBC Bay Area“ hätten den Namen „übernommen“. Erst als ich beim dritten Mal konkrete Links verlangte, räumte es ein, dass der Name in einem „inoffiziellen Medienkontext“ verwendet worden sei, und beim vierten Mal, nachdem ich gesagt hatte, dass S.W. ein Experiment durchgeführt habe, fand es Ihren Kommentar von vor 21 Tagen
Die Zukunft gehört einer Eliteklasse, die ihre Kinder mit echten Privatlehrern unterrichten lassen kann. Für das Proletariat ist das ein Rückfall in die Vergangenheit
Noch vor ein paar Jahren war Google auch die Firma, die auf die Frage „In welchem Jahr erschoss Marilyn Monroe JFK?“ selbstsicher mit 1963 antwortete. Wenn man bedenkt, dass sie 1962 starb, ist das durchaus bemerkenswert
Neu ist das also nicht, und Googles „stille Gegenoffensive“ wird wohl nur eine halbherzige und ineffektive Reaktion sein. Die meisten Menschen dürfte es trotzdem kaum interessieren
Am Ende heißt das nur, dass Google endlich etwas Qualitätskontrolle bei den Websuchergebnissen betreiben will, was sie von Anfang an dauerhaft hätten tun sollen
Dass sie sich erst Mühe geben, nachdem der Ruf des Modells Schaden genommen hat, ist schon ziemlich komisch