1 Punkte von GN⁺ 2026-01-19 | Noch keine Kommentare. | Auf WhatsApp teilen
  • LWN.net ist Ziel eines groß angelegten, Scraping-basierten DDoS-Angriffs aus Zehntausenden von Adressen, wodurch die Reaktionsgeschwindigkeit der Website sinkt
  • Jonathan Corbet erklärt, dass man die Seite gegen AI-bezogene Scraper verteidigen müsse; er wolle zwar keine Hürden für Leser einführen, halte dies aber womöglich für nötig
  • In der Community wurde vermutet, dass kommerzielle Datensammler wie Bright Data hinter dem Angriff stehen könnten; mehrere Nutzer berichteten zudem von ähnlichen Verkehrsspitzen
  • Einige setzen bereits auf RSS-Abonnements, statische Site-Generierung, LLM-Tarpits und ähnliche Gegenmaßnahmen; außerdem wurden Fälle geteilt, in denen der Angriff von großen Cloud-IP-Bereichen wie Azure, Google und AliCloud ausging
  • Der Vorfall gilt als Beispiel dafür, wie AI-Datensammlung die Stabilität des Web-Ökosystems und die Nachhaltigkeit kreativer Arbeit beeinträchtigt

Groß angelegter Scraper-Angriff auf LWN.net

  • Jonathan Corbet erklärte, dass LWN.net den schwersten Scraper-Angriff seiner bisherigen Geschichte erlebt

    • Der Angriff hat die Form eines DDoS unter Einsatz von Zehntausenden von IP-Adressen, was die Reaktionsfähigkeit der Seite beeinträchtigt
    • Er sagte, dass die Verteidigung von LWN gegen AI-bezogene Scraper „nichts ist, was er tun möchte“, und erwähnte, dass er keine Barrieren für den Zugang von Lesern errichten wolle, dies aber notwendig werden könnte
  • Corbet sagte, er könne den Angreifer nicht identifizieren, erwähnte aber die Möglichkeit einer Beteiligung von Bright Data oder einem ähnlichen Wettbewerber

    • Teilweise sei die CPU-Last massiv; eine Skalierung der Server sei zwar möglich, aber „für sorgfältig geschriebene Artikel Geld ausgeben zu müssen, nur um sie an solche Leute zu verfüttern, ist ärgerlich“

Reaktionen und Vorschläge aus der Community

  • Tristan Colgate-McFarlane wies darauf hin, dass Suchmaschinen gestohlene Inhalte bevorzugt anzeigen und dadurch dem ursprünglichen Autor Traffic und Werbeeinnahmen entziehen
  • Mehrere Nutzer berichteten von einem sprunghaften Anstieg des AI-Scraper-Traffics
    • Light Owl erwähnte, dass der Traffic auf seiner Website auf das 20-Fache des Üblichen gestiegen sei
    • Ben Tasker erklärte, dass er mit einer LLM-Tarpit-Roboterfalle einen Teil der Anfragen blockiere
  • Einige berichteten, dass die Angriffe von großen Cloud-IP-Bereichen wie Azure, Google und AliCloud ausgingen
    • Dec, mx alex tax1a und David Gerard teilten jeweils Fälle der Blockierung von MSFT-, Google- und Ali-IP-Bereichen

Diskussion über Gegenmaßnahmen

  • Riku Voipio schlug die Nutzung eines Servers nur für Abonnenten (subscriber.lwn.net) vor, worauf Corbet antwortete, dass dies die Gewinnung neuer Abonnenten erschweren könnte
  • Jani Nikula schlug Zugang nur für registrierte Nutzer vor, doch Corbet entgegnete, dass es bereits das Problem gebe, dass Bots Konten erstellen, weshalb die Wirksamkeit begrenzt sei
  • trademark schlug Content-Sharding vor, um die Cache-Effizienz zu erhöhen, worauf Corbet antwortete, dass nicht der Cache das Problem sei

Erfahrungsberichte anderer Website-Betreiber

  • Mehrere Betreiber berichteten von ähnlichen Angriffsmustern
    • Dec erwähnte, dass Scans nach PHP-Schwachstellen und Login-Versuche auf wp-admin von MSFT-IP-Adressen ausgingen
    • David Gerard erklärte, dass RationalWiki mit einer JavaScript-basierten Cookie-Prüfung dagegen vorgehe, was allerdings den Nebeneffekt habe, dass sogar Googlebot blockiert werde
    • Catherine (whitequark) erwähnte, dass allein die Verarbeitung von 404-Antworten die Serverlast mindere

Wahrnehmung innerhalb der Community

  • Einige formulierten es so, dass „das Web wirklich kaputtgeht“, und kritisierten, dass AI-Scraping den Zerfall des Web-Ökosystems beschleunigt
  • Ayush Agarwal wies darauf hin, dass auch in der Kernel-Community erkannt werden müsse, dass der Einsatz von LLMs kleinen Websites schadet
  • Martin Roukala bemerkte selbstironisch, das Problem sei „durch zu hohe Relevanz entstanden“, worauf Jani Nikula antwortete: „Scraper kümmern sich nicht um so etwas“

Noch keine Kommentare.

Noch keine Kommentare.