- Autor Herman setzt sich auf seiner kostenlosen Plattform „Bear“ mit Spam-Versendern auseinander. Die Plattform ist Ziel von Backlink-Farmen, Kreditkarten-Phishing, Verkäufern illegaler Drogen, Werbetreibenden für Online-Casinos und Krypto-Promotern.
- Bei diesen Spam-Versendern handelt es sich nicht um Bots, sondern um Spam-Farmen, die Inhalte im ganzen Web einreichen können, um SEO-Rankings zu verbessern.
- Als Gegenmaßnahme implementierte Herman einen Mechanismus, der allen ungeprüften Blogs die Tags „no-index“ und „no-follow“ gibt, bis die Prüfung abgeschlossen ist, damit Spam-Beiträge nicht im offenen Internet sichtbar werden.
- Herman nutzt Akismet, das Spam-Erkennungstool von WordPress, um Spam zu erkennen. Er versuchte, mit GPT-4 ein eigenes Spam-Erkennungssystem zu entwickeln, stellte jedoch fest, dass Akismet genauer und kosteneffizienter ist.
- Trotz starker Spam-Erkennung fanden einige Spam-Versender Wege, sich als legitime Blogs auszugeben und Spam in weniger regulierten Bereichen zu posten.
- Das Blockieren von Beiträgen von bestimmten IP-Adressen war nicht wirksam. Spam-Versender nutzen häufig kommerzielle VPN-Dienste wie Nord, die weltweit Server betreiben.
- Daraufhin schlug Herman die Idee von „The Frustration Loop“ vor, um Spam-Versender zu stören. Statt einen Blog zu sperren, wenn Spam erkannt wird, erzeugt das System gefälschte Fehler und macht den Ablauf so unerquicklich wie möglich, damit die Spam-Versender Zeit verlieren und aufgeben.
- The Frustration Loop leert bei erkannter Spam-Aktivität das Formular, deaktiviert das Einfügen in allen Textfeldern, wechselt alle 5 bis 10 Sekunden den Fokus von Elementen und erzeugt bei erneuten Formularübermittlungen jeweils andere Fehler.
- Herman testete das System und kam zu dem Schluss, dass es bei legitimen Nutzern kaum ausgelöst wird. Das System war in den vergangenen drei Monaten in Produktion, und nur ein einziger Nutzer meldete es als Problem.
- Seit der Einführung von The Frustration Loop sank der Spam-Anteil bei neuen Blogs von rund 30 % auf unter 5 %. Herman räumt ein, dass es noch Verbesserungsbedarf und zu schließende Lücken gibt, insgesamt funktioniert es jedoch gut.
1 Kommentare
Hacker-News-Kommentare