- Es gab eine Aufgabe, bei der Zahlenwerte addiert werden mussten, die auf 12 verschiedene E-Mails verteilt waren
- Statt alles mühsam zu kopieren, wurde beim Durchsehen des Gmail-Kontos eine Bildschirmaufnahme aufgezeichnet und anschließend mit Google Gemini versucht, die Zahlen aus dem Video zu extrahieren – mit erstaunlich guten Ergebnissen
Kosteneffizientes Video-Scraping mit AI Studio und QuickTime
- Zuerst wurde mit QuickTime Player eine Bildschirmaufnahme erstellt, während durch die relevanten E-Mails navigiert wurde
- Das aufgezeichnete 35-Sekunden-Video wurde in Googles AI Studio hochgeladen und das Gemini-Modell gebeten, die Daten als JSON-Array zu extrahieren
- Erfolgreich zurückgegeben wurde ein JSON-Array mit Datum und Dollar-Beträgen
- Anschließend wurde um eine Umwandlung ins CSV-Format gebeten, um das Ergebnis in Numbers einzufügen
- Die Kosten lagen bei etwa unter 0,1 Cent und waren damit extrem niedrig. AI Studio ist derzeit kostenlos verfügbar
Grenzen der Alternativen
- Das manuelle Kopieren von Daten ist fehleranfällig und langweilig
- Die Nutzung der Gmail API ist komplex und erfordert viel Aufwand
- Browser-Automatisierung benötigt einen zusätzlichen Schritt zum Parsen der E-Mails
- Der Einsatz ausgefeilter AI-Tools mit Zugriff auf das E-Mail-Konto birgt Risiken wie Prompt Injection
Vorteile von Video-Scraping
- Alles, was auf dem Bildschirm sichtbar ist, kann extrahiert werden
- Nutzer können vollständig kontrollieren, was dem AI-Modell offengelegt wird
- Es ist nicht von Website-Authentifizierung oder Anti-Scraping-Techniken betroffen
- Es gibt keinerlei Setup-Kosten
- Es lässt sich zu sehr niedrigen Kosten einsetzen
- Es könnte auch im Bereich Datenjournalismus nützlich eingesetzt werden
Bonus: LLM-Preisrechner
- Der Autor hat zusätzlich ein eigenes Tool zur Berechnung von Token-Preisen erstellt
- Dabei wurde zunächst ChatGPT Code Interpreter verwendet, allerdings traten Rechenfehler auf
- Mit Claude 3.5 wurde anschließend ein Preisrechner erstellt
- Preise für Eingabe-/Ausgabe-Token lassen sich manuell setzen oder per Preset-Button modellabhängig auswählen
- Der gesamte Erstellungsprozess wurde in 19 Minuten über Gespräche mit Claude iterativ auf 10 Versionen verbessert
- Die Preisinformationen wurden Claude direkt über in die Unterhaltung eingefügte Screenshots entnehmen lassen
Noch keine Kommentare.