34 Punkte von xguru 15 일 전 | 5 Kommentare | Auf WhatsApp teilen
  • Eine auf Web-Scraping und die Automatisierung von KI-Agenten spezialisierte Headless-Browser-Engine
  • Mit integrierter V8-Engine führt sie echtes JavaScript aus und ermöglicht durch die Implementierung des Chrome DevTools Protocol (CDP) die direkte Wiederverwendung von Puppeteer- und Playwright-Code
  • Gegenüber Headless Chrome deutlich leichter: Speicher 30 MB (vs. 200 MB+), Binärdatei 70 MB (vs. 300 MB+), Seitenladen 85 ms (vs. ~500 ms)
  • Durch Seitenladezeiten von 85 ms verkürzt sich die Wartezeit bei großem Crawling im Vergleich zu Chrome um das 5- bis 10-Fache
  • Verteilung als einzelne Binärdatei, also keine externen Abhängigkeiten wie Chrome oder Node.js
  • Integrierter --stealth-Stealth-Modus:
    • Automatische Anwendung von Anti-Bot-Umgehungseinstellungen wie das Verbergen von navigator.webdriver oder die Tarnung nativer Funktionen
    • Zufällige Fingerprints pro Sitzung (GPU, Canvas, Audio usw.)
  • Automatische Blockierung von Werbe-, Analytics- und Telemetrie-Trackern auf 3.520 Domains, wodurch sich auch die Rendering-Geschwindigkeit von Seiten verbessert
  • In der CLI rendert obscura fetch einzelne Seiten, obscura serve startet einen CDP-WebSocket-Server
  • Mit obscura scrape url1 url2 ... --concurrency 25 ist paralleles Scraping besonders einfach
  • Mit --eval "document.title" lassen sich JS-Ausdrücke direkt in der CLI ausführen und nur die Ergebnisse ausgeben, was für einfache Datenextraktion nützlich ist
  • Unterstützt über die CDP-API wichtige Domains wie Target, Page, Runtime, DOM, Network, Fetch und Input und enthält auch DOM→Markdown-Konvertierung (LP.getMarkdown)
  • Verarbeitet bei Formularübermittlung und Login POST-Verarbeitung, 302-Redirects und das Beibehalten von Cookies automatisch, sodass Authentifizierungsabläufe nicht selbst implementiert werden müssen
  • Apache-2.0-Lizenz

5 Kommentare

 
xguru 15 일 전

Das ist ein Headless-Browser, der derzeit stark an Popularität gewinnt.
Die schlanke Bauweise ist gut, aber beliebt ist er vor allem, weil der Stealth-Modus zuverlässig funktioniert.

 
okxrr 15 일 전

GitHub-Konto wurde erst vor einem Monat erstellt

Wenn ich erst einmal einfach nur danach google, gibt es weder Reaktionen noch Erfahrungsberichte.
Auch auf Hacker News, Reddit usw. ist kaum etwas dazu zu finden ..
Vielleicht finde ich es einfach nicht ..
Trotzdem hat es mehr als 6.000 Stars

Wo kann man sehen, was gerade richtig angesagt ist?
Es wirkt wie eine ziemlich riskante Software ..

 
xguru 15 일 전

Ich habe es vor allem oft auf Twitter gesehen. Man sagt, es sei praktisch für die Automatisierung.
Tatsächlich konnte ich den Stealth-Modus selbst noch nicht testen, daher fällt mir eine Bewertung schwer.

 
okxrr 15 일 전

Das scheint nicht besonders üblich zu sein. (Wobei es heutzutage so viele Projekte dieser Art gibt, dass man es vielleicht doch als üblich ansehen muss..)

Es ist aber ein Programm, bei dem die Wahrscheinlichkeit hoch ist, dass man sensible Informationen eingibt und verwendet,
also sollte man es wohl erst nach etwas Zeit einsetzen.

 
pmc7777 14 일 전

Scheint ein Tool zu sein, das von u/Total_Nectarine_3623 erstellt wurde.

https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp

Wenn man sich andere Beiträge ansieht, scheint die Person an ONIST oder CTF interessiert zu sein, also offenbar auch an Informationssicherheit. Die erste Veröffentlichung erfolgte mit einem einzigen riesigen Commit. Das wirkt so, als wäre im ursprünglichen Repository sehr viel Vibe-Coding betrieben und anschließend alles in zahlreiche Commits aufgeteilt worden, sodass man es nicht einfach so veröffentlichen wollte und deshalb zu einem einzigen Commit zusammengefasst hat. Auch der GitHub-Handle h4ckfOr0day deutet darauf hin; bei ONIST oder Tools, die nicht unbedingt über ganz reguläre Wege zugänglich sind, gibt es so etwas wie die Tradition, sie über Wegwerf-Accounts hochzuladen.

Vertrauen in Open Source muss natürlich erst aufgebaut werden, aber es scheint keine besondere Absicht dahinterzustecken.