Die robots.txt von Wikipedia
(en.wikipedia.org)Eine unterhaltsame robots.txt mit Kommentaren – fehlerhaft arbeitende Bots, Bots, die sich nicht an die Regeln halten, Capture-Bots, Google-Werbebots, der problematische rekursive Modus von wget und mehr.
2 Kommentare
Die Stelle „Doesn't follow robots.txt anyway, but...“ ist irgendwie lustig, haha
Kann man wirklich als Best Practice für
robots.txtbezeichnen!!Vielen Dank für die guten Informationen.