Scrapeghost – Web-Scraping-Bibliothek mit GPT

xguru · 2023-03-28T10:30:02+09:00

Eine experimentelle Bibliothek zum Extrahieren von Daten aus HTML, ganz ohne seitenbezogenen Code zu schreiben Man gibt nur die gewünschte Datenstruktur und eine URL an, und die Daten werden automatisch extrahiert Intern werden zur Kostensenkung HTML-Bereinigung, Aufteilung u. a. durchgeführt; außerdem wird per Hallucination-Check geprüft, ob die extrahierten Daten tatsächlich als korrekte Werte auf der Seite vorhanden sind Bietet eine Funktion zum Festlegen eines Budgets für die Kosten von GPT-API-Aufrufen

(jamesturk.github.io)

20 Punkte von xguru 2023-03-28 | Noch keine Kommentare. | Auf WhatsApp teilen

Eine experimentelle Bibliothek zum Extrahieren von Daten aus HTML, ganz ohne seitenbezogenen Code zu schreiben
Man gibt nur die gewünschte Datenstruktur und eine URL an, und die Daten werden automatisch extrahiert
Intern werden zur Kostensenkung HTML-Bereinigung, Aufteilung u. a. durchgeführt; außerdem wird per Hallucination-Check geprüft, ob die extrahierten Daten tatsächlich als korrekte Werte auf der Seite vorhanden sind
Bietet eine Funktion zum Festlegen eines Budgets für die Kosten von GPT-API-Aufrufen

Scrapeghost – Web-Scraping-Bibliothek mit GPT

Verwandte Beiträge

Noch keine Kommentare.