55 Punkte von davespark 2025-11-10 | 3 Kommentare | Auf WhatsApp teilen

Das neu eingeführte File-Search-Tool in der Google Gemini API vereinfacht den Aufbau von RAG-(Retrieval-Augmented Generation)-Systemen revolutionär:

  • Statt des bisher komplexen Setups mit Chunking, Embeddings und Vector-DB genügt ein einmaliger Datei-Upload (2 Zeilen Code), der alles automatisch verarbeitet; bei Anfragen werden relevante Dokumente gesucht und in das Modell eingespeist.
  • Speicher und Query-Embeddings sind kostenlos, nur die anfängliche Indexierung kostet 0,15 $ pro 1 Million Tokens.
  • Unterstützte Dateitypen: PDF, DOCX, TXT usw.
  • In einem Praxisbeispiel werden 3.000 Dateien in nur 2 Sekunden durchsucht, was die Entwicklungszeit für Prototypen deutlich verkürzt.
  • Zusätzlich werden Funktionen wie automatische Zitate und Metadaten-Filterung bereitgestellt.
  • Einschränkungen: maximal 10 Stores pro Projekt, 1 GB im kostenlosen Tier.
  • Bewertung: Senkt die Einstiegshürde für die RAG-Entwicklung und verlagert den Fokus auf die Anwendung.

3 Kommentare

 
kaydash 2025-11-11

Wie man es von Google erwartet

 
dkmin 2025-11-10

Danke fürs Teilen. Die Qualität! Ich bin wirklich neugierig.

 
unknowncyder 2025-11-10

Ich hatte schon gedacht, als sie NotebookLM als Service angeboten haben, dass irgendwann so etwas wie eine NotebookLM-API kommen könnte — und jetzt haben sie es tatsächlich als API-Service namens File Search veröffentlicht. Wahnsinn.

Ich habe versucht, RAG ordentlich hinzubekommen, dafür Pipelines/Workflows aufgebaut, Ollama gestartet und verschiedene Modelle ausprobiert; die Hürde war definitiv etwas hoch. (Man wird es wohl erst wissen, wenn man es selbst ausprobiert.) Wenn die Qualität einigermaßen gewährleistet ist, wäre das wirklich sehr bequem zu nutzen.