Skills zum Umgehen der Playwright-Bot-Erkennung
(github.com/greekr4)Wenn man mit Playwright eine Website aufruft, wird man oft sofort von der Bot-Erkennung blockiert. Ich habe die im Internet kursierenden „Stealth“-Snippets ausprobiert, und einige davon wurden sogar noch leichter erkannt. Deshalb habe ich es selbst mit 8 Detektoren gemessen und nur die Kombinationen als Skill zusammengestellt, die tatsächlich durchkommen.
Installation / Verwendung
- Installation:
npx skills add greekr4/playwright-bot-bypass - Verwendung:
playwright-bot-bypassaufrufen
Etwas überraschend war
- Die häufig genutzte Fälschung von
navigator(gefälschte Plugins, Canvas-Rauschen, Entfernen vonwebdriverusw.) passt subtil nicht zu echtem Chrome und wird dadurch eher selbst zum Erkennungssignal. Eine davon führte in echtem Chrome sogar zu einem Absturz - Deshalb habe ich alle Fälschungen entfernt, es echtem Chrome (headed) überlassen und nur genau 2 Playwright-Spuren beseitigt (
__pwInitScriptsentfernen + CDP-Leak von rebrowser blockieren) - Das Fazit war: „Je weniger man daran herumschraubt, desto seltener wird man erkannt.“
Feedback ist willkommen — insbesondere Hinweise wie „diesen Detektor konnte ich nicht umgehen“, dann übernehme ich das.
Noch keine Kommentare.