- Eine experimentelle Bibliothek zum Extrahieren von Daten aus HTML, ganz ohne seitenbezogenen Code zu schreiben
- Man gibt nur die gewünschte Datenstruktur und eine URL an, und die Daten werden automatisch extrahiert
- Intern werden zur Kostensenkung HTML-Bereinigung, Aufteilung u. a. durchgeführt; außerdem wird per Hallucination-Check geprüft, ob die extrahierten Daten tatsächlich als korrekte Werte auf der Seite vorhanden sind
- Bietet eine Funktion zum Festlegen eines Budgets für die Kosten von GPT-API-Aufrufen
Noch keine Kommentare.