15 Punkte von xguru 2024-11-14 | 2 Kommentare | Auf WhatsApp teilen
  • Crawlt Websites und wandelt sie in für LLMs nutzbares Markdown oder strukturierte Daten um
  • Wenn eine URL per API übermittelt wird, crawlt es alle Unterseiten und liefert saubere Daten für jede einzelne Unterseite
  • SDKs für Python, Node, Go und Rust verfügbar
  • Unterstützt Integrationen mit LangChain, Llama Index, Dify, Langflow, Zapier und mehr

2 Kommentare

 
hoonix 2024-11-15

Es unterstützt kein Crawling von Unterseiten, aber ich möchte einen Dokumentformat-Konverter mit einem ähnlichen Zweck vorstellen.
https://github.com/DS4SD/docling

 
laeyoung 2024-11-14

Es funktioniert nicht so gut wie gewünscht.