- In Google AI Overview wurden unzutreffende Informationen angezeigt, wonach „Dave Barry“ gestorben sei
- Tatsächlich lebt Dave Barry noch, doch die AI übernahm die falsche Information wiederholt
- Obwohl der Nutzer mehrfach Feedback einreichte, führte weder der Chat mit der AI noch der Prozess zur Fehlerkorrektur zu einer zufriedenstellenden Lösung
- Die AI verwechselt Informationen über reale Personen, vermischt sie mit anderen Personen oder erzeugt wiederholt Fehler
- Dieser Fall zeigt, dass AI bei faktenbasierten Aufgaben weiterhin Grenzen hat
Einleitung
- Dave Barry erfuhr von seinem Tod über 'Google'
- Als er bei Google nach seinem Namen ("Dave Barry") suchte, erschien eine Zusammenfassungsfunktion namens Google AI Overview
- Diese Funktion fasst Suchergebnisse mithilfe von künstlicher Intelligenz zusammen und ist in letzter Zeit bei vielen Nutzern auf großes Interesse gestoßen
Bestätigung der falschen Todesmeldung
- In Google AI Overview gab es neben den grundlegenden Angaben zu Dave Barry auch eine Liste von Fragen unter „People also ask“
- Unter diesen Fragen befand sich auch die Behauptung, Dave Barry sei gestorben, was tatsächlich nicht stimmt
- Dave Barry ist sich aufgrund eigener Feststellungen und der Diagnose mehrerer Mediziner sicher, dass er lebt
Wie Google AI mit Feedback umging
- Dave Barry reichte Feedback zu den falschen Informationen in Google AI Overview ein
- Da Google ein automatisiertes System verwendet, erwartete er keine besonders schnelle Reaktion
- Nach dem Einreichen des Feedbacks wurde der fragliche Teil zwar geändert, doch stattdessen verschwand die korrekte Erklärung und wurde durch noch ungenauere Informationen ersetzt, nämlich Angaben zu einem anderen Dave Barry
Probleme bei der Kommunikation mit der AI
- Dave Barry gab weiteres Feedback, um erneut darauf hinzuweisen, dass die AI seinen Zustand falsch verstanden hatte
- Dabei kam mit dem AI-Chatbot keine richtige Kommunikation zustande, und die AI verstand die Bedeutung nicht korrekt
- Trotz wiederholter Erklärungen erkannte die AI das Problem nicht, und das Gespräch verlief, als würde man mit einer Maschine kommunizieren
Wiederholte Fehler und vorläufige Lösung
- Nach weiterem Feedback wurde der Overview-Inhalt erneut geändert, sodass die Todesmeldung verschwand
- Dennoch blieben an anderen Stellen Fehler bestehen, etwa bei Informationen zur Buchveröffentlichung und zum Verlauf seiner Kolumnistentätigkeit
- Auch danach wechselte die Overview wieder zurück zu einer Todesmeldung, sodass die Genauigkeit der Informationen instabil blieb und sich wiederholt änderte
- Bei der letzten Überprüfung wurde Dave Barry schließlich wieder als lebendig dargestellt, zusammen mit dem Hinweis, dass eine „Verwechslung“ vorliege
Fazit und Lehre
- Diese Erfahrung zeigt, dass AI zwar ein sehr mächtiges Werkzeug ist, für Aufgaben, die eine genaue Überprüfung von Fakten erfordern, aber schwer vertrauenswürdig bleibt
- Derzeit eignet sich AI eher für Aufgaben mit geringerem Zuverlässigkeitsanspruch (z. B. Empfehlungsschreiben oder Policy-Entwürfe) und ist für Bereiche mit hohen Präzisionsanforderungen (z. B. Flugzeugbetrieb) ungeeignet
- Insgesamt deutet der Fall auf die Grenzen von AI hin und darauf, dass bei ihrer Nutzung Vorsicht geboten ist
Umfrage
- Den Lesern wird die Frage gestellt: „Glauben Sie, dass AI in Zukunft für die Menschheit nützlich sein wird?“
- Abschließend endet der Text mit einem leichten Scherz
1 Kommentare
Hacker-News-Kommentare
Ein beliebter Laden in meiner Gegend wird auf Google Maps ungefähr so zusammengefasst:
Lebhafte Bar, in der man Getränke und Po’-Boy-Sandwiches bekommen kann, außerdem mit Jukebox, Billardtisch und elektronischem Dart. Tatsächlich gibt es dort aber keine Po’ Boys, keine Jukebox (die Playlist ist allerdings großartig), keinen Billardtisch und kein elektronisches Dart. Bei den Getränken gibt es im Grunde nur Bier und ein paar Dosenprodukte, keine Cocktails oder Mixgetränke.
Vor einem Monat hat jemand enttäuscht eine 1-Stern-Kritik hinterlassen, weil er zum Billard- oder Dartspielen hingegangen war und dann nichts davon vorfand.
Offensichtlich hat der Inhaber das gemeldet, ich habe es gemeldet, und ich nehme an, andere Besucher ebenfalls.
Trotzdem ist ein Monat vergangen und die falschen Informationen stehen immer noch dort.
Die einfachste Lösung wäre, tatsächlich Po’ Boys zu verkaufen und eine Jukebox, einen Billardtisch und elektronisches Dart anzuschaffen.
Ich fände es wirklich toll, wenn Google weltweit eine Option hätte, mit der man „Ich möchte auf keinen Fall Inhalte sehen, bei denen offensichtlich ist, dass sie von AI erstellt wurden“ ankreuzen und deaktivieren könnte.
Wahrscheinlich ist das zu viel verlangt.
Wegen solcher ungenauen Informationen treffen Menschen tatsächlich Entscheidungen (zum Beispiel den Laden zu besuchen) und hinterlassen sogar falsche Bewertungen.
Ich frage mich, ob man in so einem Fall auf Schadensersatz klagen könnte.
Oder ob es besser wäre, die Informationen einfach von Google entfernen zu lassen.
In letzter Zeit passiert es ständig, dass Leute einem in Autoforen oder Facebook-Gruppen helfen wollen und dann einen „Screenshot von Google“ zeigen, der ganz offensichtlich eine AI-Zusammenfassung ist.
Zum Beispiel wird detailliert erklärt, dass es Funktion X gebe, obwohl diese Funktion in Wirklichkeit nie existiert hat.
Das passiert dauernd.
Besonders in Online-Communities rund ums Auto ist das ein sehr großes Problem.
Ich glaube, das ist nicht nur ein Problem von AI-Zusammenfassungen, sondern ein strukturelles Problem von Google.
Google zeigt oft ungenaue Informationen an, und normalerweise gibt es fast keinen Weg, das zu korrigieren.
Feedback-Formulare und Ähnliches werden größtenteils ignoriert.
Ich musste bei Google Maps jahrelang darum kämpfen, falsche Informationen zu korrigieren, und die meisten Leute glauben, Google Maps sei die reine Wahrheit.
Ich kann nicht einmal sicher sagen, ob geänderte Informationen tatsächlich wegen meines Feedbacks geändert wurden.
Google verteilt Informationen wie aus einem Feuerwehrschlauch.
Google ist so groß, dass man sich um solche Unstimmigkeiten kaum kümmert, oder eher: weil solche Dinge das Geschäftsmodell nicht beeinflussen, kümmert man sich nicht darum.
Ich denke, das ist wirklich ein Problem der AI-Zusammenfassungen.
Am Anfang wurden einfach die für die Suchanfrage relevantesten Suchergebnisse ganz oben angezeigt, und der Nutzer klickte darauf und prüfte selbst, ob der Inhalt passt.
Jetzt steht die AI-Zusammenfassung immer ganz oben, und das LLM ist zwar sehr schnell, aber dumm genug, dass man es billig für jede einzelne Webseite laufen lassen kann.
Das ist eindeutig eine Produktentscheidung, und eine schwerwiegend falsche.
Wenn man zum Beispiel nach „Suicide Squad“ sucht, bekommt man so etwas:
Hier wurde die ungenaue Information gezeigt, weil die AI-Zusammenfassung Informationen über zwei verschiedene Personen vermischt hat.
Bei der klassischen Suche hätten die Webseiten jeweils nur Informationen über eine Person behandelt.
Deshalb ist das eher ein Problem, das speziell durch AI-Zusammenfassungen entsteht.
Google hat besonders auf Ebene einzelner Nutzer wenig Anreiz, Genauigkeit zu priorisieren.
Wegen der schieren Menge an Inhalten kann man „Skalierung“ auch leicht als Ausrede benutzen, um es zu ignorieren.
Es gibt durchaus eine Lösung für falsche Informationen.
Man muss sie nur auf die Startseite von Hacker News (HN) bringen.
Früher war mein größter Ärger mit Google noch, dass bei der Java-Dokumentation (Suche nach Klassennamen) die Doku der Version 1.4 vor der von Version 6 auftauchte.
Ich frage mich, ob sich bei diesem Fall „AI schrieb, Dave Barry sei 2016 gestorben“ die Zusammenfassung künftig ändern wird, wenn weitere seiner Texte indexiert werden.
Vielleicht bekommt man dann eine AI-Zusammenfassung wie: „Dave Barry starb 2016, bestreitet das aber bis heute.“
Die AI-Zusammenfassung, die ich gerade selbst bekommen habe, lautete so:
Ich könnte mir sogar vorstellen, dass die AI so etwas schreibt wie: „Es galt als bekannt, dass Dave Barry 2016 starb, doch als festgestellt wurde, dass er lebt, entstand eine Kontroverse.“
Ich denke, solche Fehler sind wegen des Problems der Eindeutigkeit von Personennamen bis zu einem gewissen Grad unvermeidlich.
Eine einfache Gegenmaßnahme wäre vielleicht, bei einer Namenseingabe immer zuerst zu fragen: „Welche anderen Personen mit demselben Namen gibt es?“
Das löst das Problem des Vermischens mehrerer Personen nicht vollständig, aber ich glaube, die meisten Probleme entstehen, weil derselbe Name wie bei einer berühmten Person auftaucht.
Google scheint in gewissem Maß einen Knowledge Graph zu verwenden, und ich frage mich, wie stark das LLM tatsächlich auf diesen Graphen zurückgreift.
Vermutlich greift es sowohl auf den Graphen als auch auf normale Google-Suchergebnisse zu, und das LLM (wahrscheinlich ein einfaches Modell wie Gemini Flash Lite) schafft es nicht, bekannte Personen aus dem Knowledge Graph sauber von Informationen aus Suchergebnissen zu trennen und vermischt beides.
Das gilt besonders dann, wenn es Namensgleiche gibt, die in verschiedenen Bereichen unterschiedlich bekannt sind.
Ich habe beim Bau einer persönlichen Knowledge-Graph-App selbst gemerkt, dass die Verwendung von Entity-IDs allein auf Basis von Namen (Vorname, Nachname) irgendwann Probleme verursachen kann.
In meinem Fall dient das der persönlichen Informationsorganisation, daher wird es wohl einigermaßen funktionieren, aber schon bei der E-Mail-Analyse gibt es das Problem, dass meine verschiedenen Spitznamen nicht zuverlässig als dieselbe Person erkannt werden.
Diese Art von „Verwirrung“ entsteht letztlich daraus, dass die Maschine nicht versteht, dass menschliche Namen nicht eindeutig sind.
Als Teil einer gesellschaftlichen Bewegung werde ich alle meine Kinder Google nennen (auch die, die bereits einen Namen haben).
Dave Barry ist wirklich großartig.
Das ist ein klassisches Problem, das es bei Google schon lange vor AI häufig gab.
Ich bin pessimistisch, dass sich das ändern wird, aber ich gebe die Hoffnung trotzdem nicht auf.
Und Trilobitenfossilien sind wirklich niedlich.
Ich habe sogar ein echtes Fossil auf meinem Schreibtisch, und ein Freund hat ihm eine Brille aufgesetzt.
Der Grund ist, dass ich in seinen Augen schon ein „Dino-Opa“ bin, aber Trilobiten sind noch älter.
https://www.trilobites.info/
Kürzlich habe ich einen Fall gesehen, in dem die Band Dutch Interior von Meta AI mit völlig haltlosen Verleumdungen überzogen wurde.
Die AI erfand, die Band sei mit White Supremacists und rechtsextremen Extremisten verbunden.
https://youtube.com/shorts/eT96FbU_a9E?si=johS04spdVBYqyg3
https://www.politico.eu/article/dutch-scandal-serves-as-a-warning-for-europe-over-risks-of-using-algorithms/
2019 erstellte die niederländische Steuerbehörde mit selbstlernender AI Risikoprofile, um Betrug bei Kinderbetreuungszuschüssen aufzudecken. Das führte zur Zerrüttung unzähliger Familien, zu Pflegeunterbringungen, Insolvenzen und sogar zu Suiziden.
2021 verhängte die niederländische Datenschutzbehörde gegen die Steuerbehörde sogar ein Bußgeld von 2,75 Millionen Euro.
Ein wirklich „starker“ Zug: der Staat verhängt gegen sich selbst ein Bußgeld.
Diese absurde Situation ist irgendwie brillant.
Sie erinnert an das Phänomen, dass der Text „Ich bin der SF-Autor Greg Egan, und im Internet gibt es keine Fotos von mir“ sinnlos im Netz herumverbreitet wird.
https://www.gregegan.net/images/GregEgan.htm
Ich denke, manche Zusammenfassungen zu Dave Barry waren nicht wirklich falsch, weil es tatsächlich einen anderen Dave Barry gibt, der wirklich gestorben ist.
Ich frage mich, warum gerade dieser Dave Barry für sich beanspruchen sollte, repräsentativ die Frage „Was ist mit ihm passiert?“ beantwortet zu bekommen.
Tatsächlich ist ihm gar nichts passiert, aber seinem Namensvetter schon (er ist gestorben).
Wenn diese Information zwischen Informationen oder Links zu dem Bostoner Dave Batty auftaucht, ist der Kontext klar gesetzt.
Deshalb ist die Information in diesem Zusammenhang falsch.
Schon Formulierungen wie „Dave Barry, Humorautor und Pulitzer-Preisträger, starb am 20. November letzten Jahres …“ oder „Dave Barry (Bostonian) … starb am 20. November …“ machen eindeutig klar, um wen es geht.
Auch wenn der Kontext außerhalb des Satzes liegt (embedding context), spielt in solchen Formulierungen die Identität des Subjekts eine zentrale Rolle.
Wenn man tatsächlich bei Google nach dem Namen sucht, verweist die Zusammenfassung ganz oben auf Dave Barry, den Autor.
Nur zur Einordnung: Bei meiner Suche stand dort, Dave Barry lebe, aber als Quelle diente der Wikipedia-Artikel über Dave Berry, den Musiker.
Auch diese Variante (mit Todesinformationen über einen Namensvetter) könnte im Wechsel mit anderen AI-Zusammenfassungen angezeigt werden.
Am besten wäre eine klare Disambiguierung nach Personen wie bei Wikipedia.
Vielleicht lebt auch der andere Dave Barry in Wirklichkeit noch.
Im Abschnitt „Was ist mit Dave Barry passiert?“ standen Informationen über den Aktivisten Dave Barry in einem Unterabschnitt über den Komiker Dave Barry.
Für normale Leser wirkt das selbstverständlich wie ein Teil des Kontexts über den Komiker.
Deshalb hat dieser Dave Barry (der Humorautor) jedes Recht zu sagen, dass die Frage auf ihn bezogen war.
Das wäre so, als würde mitten auf der Wikipedia-Seite zu Dave Barry (Komiker) ohne jeden Kontext die Todesnachricht eines anderen Dave Barry auftauchen.