21 Punkte von xguru 2024-10-22 | Noch keine Kommentare. | Auf WhatsApp teilen
  • Es gab eine Aufgabe, bei der Zahlenwerte addiert werden mussten, die auf 12 verschiedene E-Mails verteilt waren
  • Statt alles mühsam zu kopieren, wurde beim Durchsehen des Gmail-Kontos eine Bildschirmaufnahme aufgezeichnet und anschließend mit Google Gemini versucht, die Zahlen aus dem Video zu extrahieren – mit erstaunlich guten Ergebnissen

Kosteneffizientes Video-Scraping mit AI Studio und QuickTime

  • Zuerst wurde mit QuickTime Player eine Bildschirmaufnahme erstellt, während durch die relevanten E-Mails navigiert wurde
  • Das aufgezeichnete 35-Sekunden-Video wurde in Googles AI Studio hochgeladen und das Gemini-Modell gebeten, die Daten als JSON-Array zu extrahieren
    • Erfolgreich zurückgegeben wurde ein JSON-Array mit Datum und Dollar-Beträgen
  • Anschließend wurde um eine Umwandlung ins CSV-Format gebeten, um das Ergebnis in Numbers einzufügen
  • Die Kosten lagen bei etwa unter 0,1 Cent und waren damit extrem niedrig. AI Studio ist derzeit kostenlos verfügbar

Grenzen der Alternativen

  • Das manuelle Kopieren von Daten ist fehleranfällig und langweilig
  • Die Nutzung der Gmail API ist komplex und erfordert viel Aufwand
  • Browser-Automatisierung benötigt einen zusätzlichen Schritt zum Parsen der E-Mails
  • Der Einsatz ausgefeilter AI-Tools mit Zugriff auf das E-Mail-Konto birgt Risiken wie Prompt Injection

Vorteile von Video-Scraping

  • Alles, was auf dem Bildschirm sichtbar ist, kann extrahiert werden
  • Nutzer können vollständig kontrollieren, was dem AI-Modell offengelegt wird
  • Es ist nicht von Website-Authentifizierung oder Anti-Scraping-Techniken betroffen
  • Es gibt keinerlei Setup-Kosten
  • Es lässt sich zu sehr niedrigen Kosten einsetzen
  • Es könnte auch im Bereich Datenjournalismus nützlich eingesetzt werden

Bonus: LLM-Preisrechner

  • Der Autor hat zusätzlich ein eigenes Tool zur Berechnung von Token-Preisen erstellt
    • Dabei wurde zunächst ChatGPT Code Interpreter verwendet, allerdings traten Rechenfehler auf
  • Mit Claude 3.5 wurde anschließend ein Preisrechner erstellt
    • Preise für Eingabe-/Ausgabe-Token lassen sich manuell setzen oder per Preset-Button modellabhängig auswählen
  • Der gesamte Erstellungsprozess wurde in 19 Minuten über Gespräche mit Claude iterativ auf 10 Versionen verbessert
  • Die Preisinformationen wurden Claude direkt über in die Unterhaltung eingefügte Screenshots entnehmen lassen

Noch keine Kommentare.

Noch keine Kommentare.