Die Verschlechterung von Google
(baldurbjarnason.com)- Web-Media-Traffic von Google und Facebook ist nicht mehr verlässlich planbar, wodurch selbst sparsam betriebene unabhängige Medien in ihrer Existenzgrundlage erschüttert werden
- Google führte zur Verbesserung der Suchqualität Machine-Learning-basiertes Ranking ein, steht aber in der Kritik, weil LLM-generierter Spam durchkommt, während Blogs und kleine Websites aus den Ergebnissen verdrängt werden
- Eine Person, die am Google Web Creator Summit 2024 teilnahm, berichtete, im Vorjahr 250.000 US-Dollar Umsatz erzielt zu haben, nach einem Traffic-Rückgang um 97 % nun aber auf eine Tafel angewiesen zu sein
- Teilnehmende des Summits berichteten, Google habe gesagt, „der Content sei nicht das Problem gewesen“; Danny habe mit dem Engineering-Team Beispiele debuggt, aber keinen Grund gefunden, warum sie nicht ausgespielt werden
- Da das Suchranking-System selbst innerhalb von Google zu einer schwer verständlichen Blackbox wird, führt dies zur Kritik, dass bei einer monopolartigen Stellung sinkender Produktnutzen sich nicht unmittelbar in den Geschäftsergebnissen niederschlägt
Traffic-Einbruch unabhängiger Webmedien
- „The End Of Independent Publishing And Giant Freakin Robot“ kündigt die Schließung von Giant Freakin Robot an und erklärt, dass in den vergangenen zwei Jahren Hunderte unabhängige Publisher geschlossen hätten und Tausende weitere denselben Weg gehen würden
- Nach Gesprächen mit unabhängigen Publishern aus verschiedenen Themenbereichen sei die Lage so, dass es keinem gut gehe und die meisten mit einer baldigen Geschäftsaufgabe rechneten
- Man habe das Problem direkt an Google herangetragen, doch die zurückkommende Botschaft sei gewesen, dass es Google nicht kümmere; es fiel sogar die Formulierung „unsere Branche ist am Ende“
- Webmedien-Unternehmen können heute Referral-Traffic von Google oder Facebook nicht mehr zuverlässig erwarten, und nur sehr wenige können mit dem verbleibenden Traffic überleben
Wie das Suchranking zur Blackbox wurde
- Das Problem beschränkt sich nicht auf das Scheitern einzelner Websites, sondern hängt mit der Entwicklung zusammen, dass Google zur Korrektur seiner Suchergebnisse Machine Learning für das Ranking von Websites einsetzte
- Laut What we can learn from the Google creators summit for HCU impacted sites war das helpful content system ein Machine-Learning-System, das anhand guter und schlechter Beispiele lernte und vorhersagte, welcher Seite bislang ungesehene Beispiele näherkommen
- In den vergangenen zwölf Monaten wurde Google Search jedoch dafür kritisiert, viel LLM-generierten Spam durchzulassen und Blogs sowie kleine Websites aus den meisten Ergebnissen verschwinden zu lassen
- Einige Websites wurden durch das Machine-Learning-Modell faktisch ausgeschlossen, und der genaue Grund ist weiterhin niemandem bekannt
- In I Drank the Kool-Aid at the 2024 Google Web Creator Summit berichtet ein Teilnehmer, dass sein Traffic nach 250.000 US-Dollar Umsatz im Vorjahr um 97 % eingebrochen sei und er sich derzeit Essen bei einer Tafel hole
- Das Problem tritt noch deutlicher hervor, weil diese Personen zum Summit eingeladen wurden, da sie Content erstellten, den Google in den Suchergebnissen sehen möchte
- In einer Twitter-Unterhaltung wurde geteilt, dass Google mehrfach gesagt habe, „der Content sei nicht das Problem gewesen“, und dass Danny mit Beispielen der Teilnehmenden zum Engineering-Team gegangen sei und debuggt habe, aber nicht herausfinden konnte, warum sie nicht angezeigt werden
- Der Such-Algorithmus scheint zu einer Blackbox geworden zu sein, die selbst Google-Engineers nur schwer durchschauen
Eine Struktur, in der Produktverschlechterung nicht auf Geschäftsergebnisse durchschlägt
- Auch der Umstand, dass Googles ML-Expertinnen und -Experten davor gewarnt hätten, LLMs könnten das Produkt verwirrend und schwer kontrollierbar machen und sollten daher vermieden werden, hängt mit diesem Problem zusammen
- Wenn durch Massenentlassungen Menschen gehen, die die internen Systeme tief verstanden haben, können die verbleibenden Systeme noch leichter zur Blackbox werden
- Der grundlegende Grund für die fortgesetzte Verschlechterung ist, dass sie Googles Geschäftsergebnisse nicht direkt beeinflusst; ein Monopolunternehmen kann auch bei sinkendem Produktnutzen weiterhin den im Umfeld entstehenden Wert abschöpfen
- Mit Blick auf die politische Lage in den USA führt dies zur Prognose, dass Monopole und Oligopole in der Tech-Industrie stärker werden und die tatsächliche Produktivität, Leistung und Wirkung von Produkten immer weniger wichtig sein werden
1 Kommentare
Meinungen auf Hacker News
Im Kern begann es meiner Ansicht nach in dem Moment, als die Leute aus der Anzeigenabteilung den Machtkampf mit den Leuten aus der Suchmaschinenabteilung gewannen. Früher waren Anzeigen ein Mittel, um die Entwicklung großartiger Technologie zu finanzieren, und nebenbei wurde man damit unglaublich reich.
Heute sind sie nur noch ein Mittel, um dem System den letzten Tropfen Wert auszusaugen und die Zahlen für immer nach oben zu treiben; in der oberen Google-Führung scheint es keinerlei Vision oder Strategie mehr zu geben.
Google Docs war 2006 ebenfalls erstaunlich, aber fast 20 Jahre später gab es nur ein paar Usability-Verbesserungen; vieles andere wurde eingestellt, war von Anfang an nicht besonders innovativ oder wirkte wie ein kraftloses Hinterherlaufen hinter der Arbeit anderer.
Anzeigen können die gesponserten Ergebnisse oben füllen, beeinflussen aber nicht die organischen Suchergebnisse. Wenn „die Anzeigenseite hat gewonnen“ bedeutet, dass es mehr gesponserte Slots gibt, dann bedeutet das eben nur, dass es mehr Slots gibt; es erklärt nicht die Qualität der organischen Ergebnisse.
Falls nicht, könnte diese großartige Technologie nur ein Köder sein, um Zielpersonen für Werbung anzulocken, also lediglich ein Bestandteil der Technologie für Werbedienste. Ich frage mich auch, warum man dann überhaupt Werbeleute einstellt, statt diese Technologie zu verkaufen oder zu lizenzieren.
Wie Morgan sagte, fand ich beeindruckend, dass Danny mit einem Team von Ingenieuren in einem Raum saß, Beispiele nannte und fragte: „Warum tauchen diese Leute nicht auf?“, und dass sie zwar den Debugging-Prozess durchgingen, die Ursache aber nicht fanden.
Gleichzeitig hat jemand in Schweden mit einer einzelnen Desktop-ähnlichen Maschine im Wohnzimmer eine Suchmaschine gebaut, die gut genug ist, dass man häufig zu ihr wechseln würde, wenn Google versagt. Heute nutze ich Kagi; es hat Prioritäten und Blocklisten, aber die Ergebnisse sind grundsätzlich so gut, dass ich diese Funktionen nicht nutze.
Kagi baut zwar einen eigenen Index auf, war aber lange Zeit eher eine Hülle, die Google+Bing-Ergebnisse weiterverkaufte, und war trotzdem deutlich besser. Das ist interessant.
Es gibt zwei Möglichkeiten: Entweder hat Kagi ein sehr cleveres System, das die obersten Dutzend Ergebnisse liest und neu sortiert, oder – plausibler – der API-Zugriff umgeht auf der Eingabeseite von Google die „Query-Expansion-und-Verdummungsmaschine“ und auf der Ausgabeseite die Personalisierungsstufe und interagiert direkt mit dem noch funktionierenden Kern der Google-Suche.
Mit „Verdummungsmaschine“ ist eine Pipeline gemeint, die etwa
obscure-js-libin das ähnlich benanntewell-knowm-js-lib-with-kind-of-similar-nameumwandelt oder bei einer Suche nach Angularsmat-tableentscheidet, man wolle eigentlich einen Tisch mit einer Matte darauf, der nichts mit Angular zu tun hat.exactly-this-thing.pysagen: „Sie habensorta-related.jsfalsch geschrieben. Hier ist es.“ Da kommt einem unwillkürlich die Reaktion: „Habe ich gestottert?“Ich bin mir nicht sicher, welches Problem der Autor genau meint. Geht es darum, dass manche Websites ihr Geschäftsmodell auf Suchergebnissen aufgebaut haben, darum, dass Google seinen Suchalgorithmus geändert hat und einem dessen Prioritäten nicht gefallen, oder um etwas anderes?
Zu erwarten, dass Google niemals Experimente am Algorithmus durchführt, ist etwas irrational, und im Kern ist es eher ein Nullsummenspiel. Wer heute Gewinner ist, kann morgen Verlierer sein.
Wenn man sich Sorgen um Umsatzbeteiligung, Traffic-Zufluss oder Anzeigenplatzierung macht, ist es sehr unklug, ein Geschäft aufzubauen, dessen Erfolg vollständig von den Launen eines anderen Unternehmens abhängt.
Suche wird nach und nach durch große Sprachmodelle ersetzt, und weil sie über Jahre durch Suchmaschinenoptimierung gamifiziert wurde, wird sie als Methode zur Entdeckung von Inhalten meiner Ansicht nach immer schlechter.
Für Content Discovery passt eher ein Modell, bei dem Communities mit ähnlichen Interessen wie Hacker News kollektiv Dinge finden oder Inhalte kuratiert werden. Wenn Kuratoren oder Communities sich von den eigenen Interessen entfernen, muss man sich etwas Neues suchen; seltsamerweise ist das aber sogar innerhalb desselben Rahmens möglich.
Früher bekamen Websites Traffic über Webrings, Verzeichnisse und viele kleine Suchmaschinen; heute sind es fast nur noch Google oder dessen Properties und, mit kleinerem Anteil, Meta. Kuratoren- und Community-basierte Discovery-Modelle sind Opfer von Google, nicht die Lösung.
Anders gesagt: Google hat 1000 harmlos wirkende Experimente ausgerollt, die die Klickrate um 0,2 % erhöhen, und das Ergebnis ist ein System geworden, das am liebsten nur noch Reddit- und Quora-Links ausspuckt.
Ich habe diese Diskussion mehrmals in Googles nicht öffentlichem Blind-Bereich gesehen, meist zusammen mit Gesprächen darüber, dass der vor 2020 zuständige Suchchef wegen solcher Ergebnisse besorgt war und einen vorsichtigeren Ansatz verfolgte.
Ich bin ehemaliger Google-Mitarbeiter, bin im Oktober 2023 gegangen und habe nicht im Suchteam gearbeitet, aber außerhalb von Google scheint diese Theorie nicht gut verstanden zu werden. Ausnahmen sind nur etwa zwei bekannte Blogposts, deren Namen ich nicht mehr weiß, die aber den Kern getroffen haben.
Ich frage mich, ob es eine Liste von Suchanfragen gibt, bei denen Google schlechte Ergebnisse liefert. Ich habe mir ein paar Minuten lang meinen Suchverlauf angesehen; das meiste waren einfache Anfragen wie Personennamen, und Google hat das gut erledigt. Bei Personensuchen fühlt sich Google manchmal besser an als LinkedIn.
Ich habe auch ein paar komplexere Anfragen mit Kagi verglichen. Bei „How much bitcoin does microstrategy own“ lieferte Google hier den richtigen Snippet zurück, während Kagi nur Artikel darüber verlinkte, wie viel in den letzten Tagen gekauft wurde.
Bei „how to pronounce stratchery“ zeigte Google den richtigen Snippet von der Stratechery-Website, während Kagis erstes Ergebnis ein Spam-Eintrag mit falscher Aussprache war und das zweite Ergebnis ein Tweet mit der richtigen Aussprache.
Mir fiel auch Dan Luus Artikel (https://danluu.com/seo-spam/) ein, aber als ich meinen Suchverlauf durchging, waren die von ihm verwendeten Suchanfragen überhaupt nicht repräsentativ für meine Alltagssuchen.
[0]https://www.forbes.com/sites/digital-assets/2024/11/29/micro...
[1]https://stratechery.com/category/about/#:~:text=UPDATE%3A%20...
[2]https://www.howtopronounce.com/stratechery
Produktbewertungen sind voller Suchmaschinenoptimierungs-Müll, also „Top 10“-Listen aus Blogspam, und bei Reisethemen füllt Werbung eine ganze Seite, bevor organische Ergebnisse überhaupt erscheinen. Es ist so lästig, dass man es gar nicht erst versucht, und am Ende bleiben nur die Anfragen übrig, die noch funktionieren.
Ich frage mich, ob es konkrete Beispiele gibt, die mit Google schwer zu finden sind, mit etwas anderem aber leicht.
Die aktuellen weltweiten Nutzungsstatistiken lauten: Google 89,33 %, Bing 4,15 %, YANDEX 2,8 %, Yahoo! 1,33 %, Baidu 0,83 %, DuckDuckGo 0,69 %. Stand Oktober 2024: https://gs.statcounter.com/search-engine-market-share
Wenn Google so schlecht ist, frage ich mich, warum Leute, mich eingeschlossen, nicht auf andere Suchmaschinen klicken. Dass Giant Freakin Robot keine Klicks bekommt, ist schade, aber das ist ein anderes Problem als die Frage, ob Google aus Nutzersicht schlecht ist.
Ich habe sie alle angeklickt, und sie funktionieren alle. Baidu kommt auf Chinesisch, und als ich nach The Sound of Music suchte, bekam ich laut Google Translate chinesische Ergebnisse wie „Nonnen und sieben ungezogene Kinder“, was ziemlich lustig war.
Google hat sich klar davon wegbewegt, Kundenwert und den Wert für Content-Ersteller zu priorisieren, hin zu internen, undurchsichtigen Key Performance Indicators. Für Creator gilt das noch viel mehr als für Werbekunden.
Nachdem ich vor ein paar Jahren zu DuckDuckGo und letztes Jahr zu Kagi gewechselt bin, spüre ich jedes Mal deutlich, wie sehr sie die Orientierung verloren haben, wenn ich gelegentlich zu Google zurückkehre.
Es wird wohl noch zehn Jahre dauern, bis sie ihre Dominanz verlieren, aber die Anzeichen sind eindeutig. Nur Trägheit und Marktposition sind der Grund, warum sie noch an der Spitze stehen. Gleichzeitig nutzt die jüngere Generation die Websuche kaum noch, und technisch versierte Leute springen immer schneller ab.
Aus Startup-Sicht ist das vielversprechend. Google ist heute nicht mehr der 800-Pfund-Gorilla, der einem das Mittagessen wegschnappt, sondern eher ein wandelnder toter Riese, der darauf wartet, dass man seine konzeptionellen Bauteile aberntet.
Dieses Jahr bin ich bei Kagi nur eine Handvoll Mal per
!gzu Google gegangen, und jedes Mal habe ich es sofort bereut.Als ich vor ein paar Jahren DuckDuckGo nutzte, war
!greflexartig, und vermutlich fühlten sich die Google-Ergebnisse in der Hälfte der Fälle besser an. Bei DuckDuckGo zu bleiben fühlte sich idealistisch an, die Qualität aber zweitklassig; bei Kagi ist das nicht so. Die 10 Dollar pro Monat machen sich durch Produktivitätsgewinn locker bezahlt.Da Kagi den Google-Suchindex ebenfalls als eine Quelle nutzt, ist es nicht so, dass Google die Ergebnisse oder die User Experience technisch nicht verbessern könnte. Organisatorisch scheint es nur unmöglich zu sein.
Es gab die Warnung, dass eine der häufigen Folgen großer Entlassungswellen darin besteht, interne Systeme zu Black Boxes zu machen. Weil alle Leute gehen, die die Systeme tief verstanden haben.
Dass man sachkundige Leute direkt verliert, passiert wirklich, ist aber nicht der Hauptgrund, warum diese Systeme zu Black Boxes werden.
Auf jede entlassene sachkundige Person kommen etwa zwanzig, die bleiben und sich an die Realität anpassen, dass ihre Zukunft im Unternehmen viel unsicherer geworden ist. Diese Anpassung sieht bei jedem anders aus, aber buchstäblich niemand sagt: „Wow, ich sollte die Dokumentation verbessern und Wissen teilen, damit ich leichter entlassen werden kann!“
Einen Monat später meldete sich die Firma und bot mir Vertragsarbeit an, was ich ablehnte. Danach kontaktierten mich ein Jahr lang Mitarbeiter direkt und baten um Hilfe; alles, wobei ich ihnen half, war bereits dokumentiert.
Ich glaube nicht, dass Unternehmen eine echte Lösung für ordentliche Wissensübergabe haben. Deshalb finde ich es interessant zu sehen, wenn Leute ad hoc entlassen werden, denn man verliert dabei weit mehr als nur einen Mitarbeiter.
Wissenssilos garantieren keine Jobsicherheit. Im Gegenteil: Sie schränken die Fähigkeit zur Beförderung, zur bereichsübergreifenden Zusammenarbeit, zur Anpassung, zur Übernahme anderer Aufgaben und zur Delegation ein, senken Zusammenarbeit und Projekterfolgsquote und verringern damit auch die sichtbare Leistung innerhalb der Organisation. Es gibt noch viele weitere Gründe, warum das nicht nur für die Organisation, sondern auch für den einzelnen Engineer im Silo schlecht ist, und dazu existieren mehrere Studien.
Yandex, also das russische Google, ist im Grunde eher Google von 2006. In dem Sinne, dass es mir zeigt, was ich sehen will, und nicht das, was Googles Anwälte und die Leute in SF mit ihren Beförderungsunterlagen gern zeigen möchten.
Inhalte mit Russland-Bezug im Inland können zwar zensiert sein, aber das liegt weit außerhalb meines Nutzungsbereichs.
Ich weiß nicht, was neue Suchmaschinen außer Skalierung und Servern noch blockiert. Wenn das, was wir wollen, nur die gewöhnliche alte Suche ist, die es 2006 gab, wirkt das reproduzierbar.
Es gibt auch andere Engines wie DuckDuckGo, aber ich habe gemerkt, dass sie in der Praxis eher Bing ähneln. Dann frage ich mich aber auch, warum Bing nicht dominiert, wenn Google so schlecht ist. Es ist nicht großartig, aber auch nicht so schlecht.
Wenn ich weiterlese, scheint Kagi genau das zu machen.
Ein nüchterner Artikel darüber, wie Google von innen heraus zerstört wurde.
https://www.wheresyoured.at/the-men-who-killed-google/
Tatsächlich passierte es später, als ich erwartet hatte, aber es wirkt wie ein so klares Ereignis, dass die Nachwirkungen bis heute anhalten.
Giant Freakin' Robot war eine Aggregator-Site. Dieser „Content“ bestand nur aus Links zu anderen Webseiten und wortreichen Kommentaren dazu. Google scheint Aggregator-Sites inzwischen zu erkennen und niedriger zu ranken.
Google selbst ist eine Aggregator-Site, warum sollte es also Traffic an andere Aggregator-Sites weitergeben? Dinge wie Yelp sollten sie auch herabstufen.
Ich frage mich, wofür Menschen, die das Internet schon lange nutzen, die Internetsuche verwenden. Bei mir ist es eines von drei Dingen.
Erstens: Ich weiß, auf welcher Website die Information steht, und gehe direkt dorthin. Beispiele wären Wikipedia, GitHub und Google Maps.
Zweitens: Ich brauche Meinungen oder Feedback echter Menschen, deshalb suche ich bei Google meist nur innerhalb der Domain Reddit.
Drittens: Ich brauche gut bekannte Informationen, die sich leicht überprüfen lassen, und das ist eine Aufgabe, in der große Sprachmodelle sehr gut sind.
Das macht mehr als 95 % meiner „Surf“-Aktivitäten aus, daher würde ich es wohl kaum bemerken, wenn eine große Suchmaschine eines Tages ausfiele.