Robots.txt-Parser für NodeJS
(github.com)-
Entwickelt mit dem Ziel, mit dem IETF-Entwurf des Robots Exclusion Protocol kompatibel zu sein
-
Unterstützte Regeln
→ User-agent, Allow, Disallow, Sitemap, Crawl-delay, Host
→ Pfad: Abgleich mit Wildcard(*) und EOL($)
1 Kommentare