1 Punkte von GN⁺ 2023-12-24 | 7 Kommentare | Auf WhatsApp teilen

Google-Suche von massiven Spam-Angriffen überrollt

  • Die Suchergebnisse von Google wurden in den vergangenen Tagen von Spam-Angriffen getroffen und sind dadurch faktisch nicht mehr vollständig kontrollierbar.
  • Viele Domains ranken für Hunderttausende Keywords, sodass das Ausmaß dieses Angriffs Millionen von Keyword-Phrasen erreichen könnte.

Wie Googles Algorithmus ausgenutzt werden kann

  • Spam-Seiten scheinen mindestens drei Schwachstellen in der Art auszunutzen, wie Google Websites rankt.
  • Die Suchanfragen, für die Spam-Seiten ranken, haben wenig Wettbewerb und sind daher leicht zu besetzen.
  • Ausgenutzt werden dabei Chancen im lokalen Suchalgorithmus, bei Long-Tail-Keywords sowie durch neu registrierte Domains.
  • Neue Websites haben für kurze Zeit den Vorteil, für Suchanfragen ranken zu können, während Googles Algorithmus die Seite noch einordnet.

Links helfen Google, Spam-Seiten zu finden

  • Bekannt wurde dies durch einen Beitrag von Bill Hartzer, der mit dem Backlink-Tool von Majestic das Link-Netzwerk mehrerer Spam-Seiten offengelegt hat.
  • In den Aufbau des Backlink-Netzwerks wurde zwar viel Aufwand investiert, doch die Links selbst sind offenbar nicht der eigentliche Grund für die hohen Rankings.
  • Links helfen Google jedoch dabei, neue Spam-Seiten zu entdecken, zu crawlen und schließlich überhaupt erst zu ranken.

Unkontrollierbarer Spam in Googles SERPs

  • Mehrere Seiten ranken für Long-Tail-Phrasen, die leicht zu besetzen sind, sowie für Suchanfragen mit lokalen Suchkomponenten.
  • Das Long-Tail-Konzept gibt es seit fast 20 Jahren und es wurde durch das 2006 erschienene Buch "The Long Tail" bekannt gemacht.
  • Spam-Seiten können für Phrasen mit wenig Konkurrenz ranken und so in kurzer Zeit für Hunderttausende Keywords Sichtbarkeit aufbauen.

Wie die Spam-Seiten aussehen

  • Ein direkter Besuch der Spam-Seiten im Browser ist nicht möglich.
  • Die Spam-Seiten leiten automatisch auf andere Domains weiter.
  • Mithilfe von Googles Rich Results Tester wurden die Spam-Seiten dennoch besucht und das HTML der Seiten aufgezeichnet.

Eine Domain rankt für mehr als 300.000 Keywords

  • Die von Bill gesendete Tabelle enthält eine Liste von Keyword-Phrasen, für die eine Spam-Seite rankte.
  • Eine Spam-Seite rankte für mehr als 300.000 Keyword-Phrasen.

Warum diese Spam-Technik wirksam ist

  • Die lokale Suche verwendet einen anderen Algorithmus als die nicht-lokale Suche.
  • Der Algorithmus für die lokale Suche ist toleranter gegenüber lokalen Seitentypen und erleichtert ihnen das Ranking.
  • Google kennt dieses Spam-Problem offenbar mindestens seit dem 19. Dezember, was durch einen Tweet von Danny Sullivan bestätigt wurde.

Meinung von GN⁺

  • Der wichtigste Punkt dieses Artikels ist, dass Googles Suchergebnisse anfällig für groß angelegte Spam-Angriffe sind, was die Zuverlässigkeit der Suchmaschine beeinträchtigen kann.
  • Dass diese Spam-Angriffe wirksam sind, liegt daran, dass sie bestimmte Schwachstellen in Googles Algorithmus ausnutzen; das unterstreicht die Notwendigkeit für Google, den Algorithmus zu verbessern.
  • Der Artikel ist nicht nur aus technischer Sicht interessant, sondern zeigt auch, dass selbst große Technologiekonzerne wie Google weiterhin mit unerwarteten Problemen konfrontiert sein können.

7 Kommentare

 
devstudyman7 2024-03-09

In Googles Dokumentation zum Melden von Spam gilt: Wenn Sie beim Melden von Webdokument-Spam eine Domain wie abc.abc.uk/trashasda sehen, melden Sie bitte abc.uk. Wenn Sie außerdem abc.abc.uk/sitemap.xml zusammen mit einem Suchbegriff melden, der das Problem präzise erkennen lässt, ist das hilfreich. Es scheint sich um eine bereits mit einer fertigen Lösung aufgebaute Website zu handeln, deren Struktur beim Zugriff durch normale Nutzer sofort wieder abgeleitete Dokumente erzeugt. Die richtige Gegenmaßnahme ist, aktiv Meldungen einzureichen. In dem Maß, in dem bei Google darauf geklickt wird, werden erneut Spam-Seiten erstellt, und über Wege wie google.com/url, image.google.com/url, naver redirect usw. werden Bots zum Zugriff veranlasst, die dann wieder auf die erzeugten Spam-Seiten weitergeleitet werden. Klicken Sie daher nicht darauf, sondern kopieren Sie nur den Link und melden Sie ihn. Solange der Redirect-Algorithmus, der explizit über google.com/url weiterleitet, nicht abgeschafft wird, dürfte das aktuelle Problem weiter auftreten.

 
devstudyman7 2024-03-09

Wenn Sie Webdokumente melden, die unter die oben genannte Spam-Lösung fallen,
sollten Sie in den insgesamt 5 Feldern im ersten die Hauptdomain eintragen und in den 4 zusätzlichen URL-Feldern eine Liste der daraus abgeleiteten erzeugten Dokumente angeben. Außerdem ist es gut, die Sitemap dieser Domain als Suchbegriff anzugeben. Wenn man die Sitemap öffnet, sieht man, dass eine Strategie verwendet wird, bei der beim Aufruf sofort Seiten wie /new/asdasd erzeugt werden. Das ist ein raffiniert vorgehender Akteur, der beim Verfassen der Meldung letztlich zusätzliche Seiten erzeugen lässt, die verschwinden, sobald Google sie aufruft. Deshalb sollten Sie die gesamte Domain melden.

 
devstudyman7 2024-03-09

In meinem Fall
(h habe ich durch x ersetzt, / durch |)

xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2

Nachdem ich den Bericht so ausgefüllt habe,

wenn es ein Fall ist, der bereits bei den Subdomains vergammelt ist, sende ich den Bericht mit dem Keyword site:*baddomain.com so ab.

Wenn die Website selbst danach eindeutig Spam ist, schicke ich zusätzlich auch noch ein Meldungsformular für Phishing-Websites mit.

 
devstudyman7 2024-03-09

Ironischerweise sind die Softwares dieser Spam-Websites sogar mit Tag Managern integriert, und obwohl Websites wie https://picsum.photos verwendet werden, werden sie weiterhin problemlos indexiert. Das bedeutet auch, dass Google sie nicht prüft. Selbst wenn die Spam-Aktivitäten das normale Maß deutlich überschritten haben, gilt: Wenn Spam-Webseiten plus AdWords-Anzeigen geschaltet sind, entstehen selbst nach einer Meldung neue abgeleitete Seiten schneller, als der Traffic über die Anzeigen hereinkommt. Besonders unheimlich ist, dass Spam-Websites Tag Manager ganz regulär verwenden.

 
devstudyman7 2024-03-09

Ich reiche seit einem Monat Spam-Meldungen ein. Wenn ihr die Seiten zusätzlich als Spam-Dokumente bzw. Betrugsdokumente meldet und sie zugleich über die Meldeseite für Phishing-Websites meldet, werden sie schneller bereinigt. Ich trage auch die betreffende Seite ein, aber wenn die Top-Level-Domain abc.abc.uk ist, solltet ihr abc.uk eingeben, damit das auch bei der Bereinigung der Domain selbst hilft. Das ist zu einer alltäglichen Aufgabe geworden, die den Webmastern aufgehalst wird.

 
aobamisaki 2023-12-24

Es war ohnehin schon seit Längerem deutlich zu sehen, dass die Qualität der Google-Suchergebnisse insgesamt nachgelassen hat, und wenn dann in so kurzer Zeit solche massiven Angriffe erfolgen, werden viele Menschen den Google-Suchergebnissen wohl noch weniger vertrauen.

 
GN⁺ 2023-12-24
Hacker-News-Kommentare
  • Spam-Seiten prüfen die IP-Adresse von Googlebot

    • Wenn Googlebot erkannt wird, wird auf dieser Seite Inhalt angezeigt
    • Andere Besucher werden auf eine andere Domain mit verdächtigen Inhalten weitergeleitet
    • Früher erlaubte Google keine Seiten, die Googlebot und normalen Nutzern unterschiedliche Inhalte zeigten, und verhängte bei Verstößen hohe Strafen
    • Diese Richtlinie ist verschwunden, könnte aber weiterhin nützlich sein, wenn automatisierte Tools gut funktionieren
  • Erfahrungen eines Nutzers, der zur Suchmaschine Kagi gewechselt ist

    • Manchmal ist es schwer, gute Suchergebnisse zu bekommen, aber auch bei Google sind die Ergebnisse nicht unbedingt besser
    • Der Nutzer passt die Suchergebnisse an seine persönlichen Vorlieben an, indem er Domains "boostet" und "pinnt"
    • Andere Google-Dienste wie Gmail und Google Maps werden weiterhin genutzt, aber die Suche nicht mehr
  • Zunahme von Seiten, die für einfache Fragen übermäßig viel Text liefern

    • Die eigentliche Antwort befindet sich ganz unten auf der Seite
    • Oberflächlich wirkt es relevant, tatsächlich ist es jedoch allgemeiner Inhalt
  • Beobachtungen zum Qualitätsverlust der Google-Suchergebnisse

    • Es ist nicht sicher, wann dieser Trend begonnen hat, aber möglicherweise wurde ihm lange nicht genug Aufmerksamkeit geschenkt
    • Die Spam-Angriffe könnten die letzte Phase sein
  • Zweifel am Suchmaschinenkonzept

    • Das Konzept einer Single-Purpose-Suchmaschine auf Basis von Web-Crawling könnte verschwinden
    • Es könnte besser sein, Google durch mehrere Systeme für spezifische Zwecke zu ersetzen
    • Zum Beispiel technische Fragen direkt auf StackOverflow und GitHub suchen, lokale Orte in verlässlichen Datenbanken suchen usw.
    • Suchmaschinen könnten sich so weiterentwickeln, dass sie mithilfe von LLMs (Large Language Models) den Suchtyp erraten und zu kuratierten, spezialisierten Suchsystemen weiterleiten
  • Hinweise auf Änderungen an Googles Suchalgorithmus

    • Google ändert gelegentlich den Algorithmus und beeinflusst damit das Ranking von Seiten
    • Solche Änderungen können dazu führen, dass bei bestimmten Anfragen Ergebnisse niedriger Qualität weit oben erscheinen
    • Früher war es wichtig, dass SEO-bezogene Seiten solche Algorithmus-Updates beobachteten und diskutierten
  • Behauptung, dass Google die organische Suche aufgegeben hat

    • Selbst Nutzer mit viel SEO-Erfahrung können nur schwer nachvollziehen, warum Google Suchergebnisse so einordnet, wie es geschieht
    • Google macht bezahlte Ergebnisse wertvoller, um Nutzer dazu zu bringen, auf bezahlte Anzeigen zu klicken
  • Kritik an den Grenzen von Googles Suchmaschine

    • Wenn man etwas Bestimmtes sucht, ist sie nützlich, ansonsten werden Bing, ChatGPT, Phind usw. verwendet
    • Das Spiel des Nutzers erscheint bei Bing und anderen Suchmaschinen in den Top-Ergebnissen, bei Google stehen jedoch Spam-Werbeseiten davor
  • Geteilte Erfahrung zum Wechsel zu Bing

    • Mit den Fortschritten von Bing durch den Einsatz von ChatGPT wurde begonnen, statt Google Bing zu verwenden
    • Es ist nicht perfekt, liefert aber im Vergleich zu Google zufriedenstellendere Ergebnisse
  • Kritik an Google als Werbeunternehmen

    • Es wurde ein neues Gmail-Konto erstellt und niemandem mitgeteilt, trotzdem kamen Spam-Mails an
    • Es erscheint plausibel anzunehmen, dass Google seine eigene Liste von E-Mail-Adressen verkauft