- Ollama hat eine Funktion zur Suche nach aktuellen Webinformationen als API veröffentlicht und bietet damit eine Möglichkeit, Halluzinationen von Modellen zu reduzieren und die Genauigkeit zu verbessern
- Auch kostenlose Konten enthalten ein großzügiges kostenloses Suchkontingent; Nutzer mit hoher Frequenz können über Ollama Cloud höhere Limits nutzen
- Auf Basis einer REST-API integriert mit Python- und JavaScript-Bibliotheken, sodass Modelle wie OpenAIs
gpt-oss längere Rechercheaufgaben ausführen können
- Mit
web_search und web_fetch werden Ergebnisse im Umfang von mehreren tausend Tokens zurückgegeben; außerdem wird die Integration mit verschiedenen Tools wie Cline, Codex und Goose über einen MCP-Server unterstützt
- Damit lassen sich Suchagenten direkt aufbauen, was die allgemeine Nutzbarkeit von KI-Modellen zur Interaktion mit aktuellen Daten deutlich erweitert
Einführung in die Web-Suchfunktion von Ollama
- Ollama hat eine Web-Such-API veröffentlicht und schafft damit eine Umgebung, in der KI-Modelle sofort mit aktuellen Webinformationen versorgt werden können
- Dadurch sind sowohl eine Verringerung von Halluzinationen als auch eine Verbesserung der Genauigkeit zu erwarten
- Für einzelne Nutzer wird ein großzügiges kostenloses Suchkontingent bereitgestellt; bei höherem Bedarf lässt sich das Kontingent über ein Ollama-Cloud-Abonnement erweitern
- Die Bereitstellung erfolgt als REST-API; über Python- und JavaScript-Bibliotheken ist auch eine tiefergehende Tool-Integration möglich
- Dank dieser Struktur können verschiedene Modelle wie gpt-oss langfristige Forschungs- und Suchaufgaben ausführen
Beispiele für die API-Nutzung
- Mit einem im Ollama-Konto ausgestellten API-Schlüssel lassen sich Aufrufe per
cURL, in Python über ollama.web_search() und in JavaScript über client.webSearch() durchführen
- Die Ergebnisse werden in einer JSON-Struktur zurückgegeben, die Titel, URL und Zusammenfassung des Inhalts enthält
- Mit der
web_fetch-API lassen sich Inhalte auf URL-Basis bis hin zu Fließtext und Linkliste einer Seite abrufen
Umsetzung eines Suchagenten auf Basis der Web-Suche
- Die Ollama-API kann in Kombination mit Modellen wie Qwen3 und gpt-oss zur Entwicklung automatisierter Multi-Turn-Suchagenten verwendet werden
- Im Beispielcode wird das Modell Qwen3:4B genutzt, um den Ablauf Suche → Schlussfolgerung → Ergebniszusammenfassung zu automatisieren
- Auf Basis der Suchergebnisse wird ein „Thinking“-Prozess durchlaufen; durch wiederholte Nutzung der Ergebnisse von Such- und Fetch-Tool-Aufrufen werden komplexe Recherche- oder Explorationsszenarien umgesetzt
- Das neue Upgrade der Ollama-Engine umfasst unter anderem präzises Speichermanagement, GPU-/Multi-GPU-Optimierung, Leistungsverbesserungen sowie umfassende Unterstützung für Vision-(multimodale) Modelle
Empfohlene Modelle und Leistungshinweise
- Empfohlen werden leistungsstarke Cloud-Modelle mit ausgeprägten Tool-Fähigkeiten, etwa
qwen3:480b-cloud, gpt-oss:120b-cloud und deepseek-v3.1-cloud
- Da Such- und Fetch-Tools Daten im Umfang von mehreren tausend Tokens zurückgeben können, wird empfohlen, die Kontextlänge des Modells auf etwa 32000 Tokens zu erhöhen
Funktion zum Abrufen einzelner Webseiten
- Neben der Web-Suche werden auch APIs und Funktionen bereitgestellt, mit denen sich Text und Linkstruktur einzelner angegebener Webseiten direkt abrufen lassen
- In Python, JavaScript oder per cURL kann einfach eine url als Argument übergeben werden, um
title, content, verlinkte URLs usw. einer Seite zu extrahieren
- Ausführlichere Beispielcodes sind im offiziellen GitHub-Repository verfügbar
Tool- und Agenten-Integration
web_search und web_fetch geben mehrere tausend Tokens an Daten zurück; empfohlen wird daher, den Modellkontext auf 32K oder mehr zu erhöhen
- Durch Unterstützung eines MCP-Servers ist eine direkte Integration mit KI-Entwicklungsumgebungen wie Cline, Codex und Goose möglich
- Beispielcode für Python und JavaScript wird im offiziellen GitHub-Repository bereitgestellt
Erste Schritte
- Die Web-Suche ist in einem kostenlosen Ollama-Konto standardmäßig enthalten; höhere Nutzung ist über ein kostenpflichtiges Abonnement möglich
- Auf der Ollama-Website kann ein Konto erstellt und ein API-Schlüssel ausgestellt werden, um den Dienst sofort zu nutzen
3 Kommentare
Mit dem kostenlosen ollama scheint das für den praktischen Einsatz wohl nicht auf einem ausreichenden Niveau zu sein..
Auf der Preisseite gibt es ebenfalls keine Erklärung zu den Kontingenten, daher kann ich schlecht einschätzen, ob es den Preis wert ist.
Hacker-News-Kommentare