Das neu eingeführte File-Search-Tool in der Google Gemini API vereinfacht den Aufbau von RAG-(Retrieval-Augmented Generation)-Systemen revolutionär:
- Statt des bisher komplexen Setups mit Chunking, Embeddings und Vector-DB genügt ein einmaliger Datei-Upload (2 Zeilen Code), der alles automatisch verarbeitet; bei Anfragen werden relevante Dokumente gesucht und in das Modell eingespeist.
- Speicher und Query-Embeddings sind kostenlos, nur die anfängliche Indexierung kostet 0,15 $ pro 1 Million Tokens.
- Unterstützte Dateitypen: PDF, DOCX, TXT usw.
- In einem Praxisbeispiel werden 3.000 Dateien in nur 2 Sekunden durchsucht, was die Entwicklungszeit für Prototypen deutlich verkürzt.
- Zusätzlich werden Funktionen wie automatische Zitate und Metadaten-Filterung bereitgestellt.
- Einschränkungen: maximal 10 Stores pro Projekt, 1 GB im kostenlosen Tier.
- Bewertung: Senkt die Einstiegshürde für die RAG-Entwicklung und verlagert den Fokus auf die Anwendung.
3 Kommentare
Wie man es von Google erwartet
Danke fürs Teilen. Die Qualität! Ich bin wirklich neugierig.
Ich hatte schon gedacht, als sie NotebookLM als Service angeboten haben, dass irgendwann so etwas wie eine NotebookLM-API kommen könnte — und jetzt haben sie es tatsächlich als API-Service namens File Search veröffentlicht. Wahnsinn.
Ich habe versucht, RAG ordentlich hinzubekommen, dafür Pipelines/Workflows aufgebaut, Ollama gestartet und verschiedene Modelle ausprobiert; die Hürde war definitiv etwas hoch. (Man wird es wohl erst wissen, wenn man es selbst ausprobiert.) Wenn die Qualität einigermaßen gewährleistet ist, wäre das wirklich sehr bequem zu nutzen.