OpenAI-Kompatibilität
- Ollama ist jetzt mit der OpenAI Chat Completions API kompatibel, sodass Ollama lokal mit mehr Tools und Anwendungen genutzt werden kann.
- Die Einrichtung beginnt damit, Ollama herunterzuladen und Modelle wie Llama 2 oder Mistral zu importieren.
Verwendung
cURL
- Verwende das OpenAI-Format, um den OpenAI-kompatiblen API-Endpunkt von Ollama aufzurufen, und ändere den Hostnamen zu
http://localhost:11434.
OpenAI-Python-Bibliothek
- Mit der OpenAI-Python-Bibliothek kann auf den API-Endpunkt von Ollama zugegriffen werden; dabei wird ein erforderlicher, aber nicht verwendeter API-Schlüssel angegeben.
OpenAI-JavaScript-Bibliothek
- Mit der OpenAI-JavaScript-Bibliothek kann auf den API-Endpunkt von Ollama zugegriffen werden; dabei wird ein erforderlicher, aber nicht verwendeter API-Schlüssel angegeben.
Beispiele
Vercel AI SDK
- Das Vercel AI SDK ist eine Open-Source-Bibliothek, die beim Aufbau interaktiver Streaming-Anwendungen hilft.
- Zum Klonen des Beispiel-Repositorys wird
create-next-app verwendet.
Autogen
- Autogen ist ein beliebtes Open-Source-Framework von Microsoft zum Aufbau von Multi-Agenten-Anwendungen.
- In diesem Beispiel wird das Modell Code Llama verwendet; dazu wird Autogen installiert und ein Python-Skript erstellt, um Ollama zu nutzen.
Mehr ist unterwegs
- Dies ist eine erste experimentelle Unterstützung für die OpenAI API.
- Zu den erwogenen künftigen Verbesserungen gehören die Embeddings API, Function Calling, Vision-Unterstützung und Logprobs.
- Weitere Informationen finden sich in der Dokumentation zur OpenAI-Kompatibilität.
Meinung von GN⁺
- OpenAI-API-Kompatibilität: Durch die Kompatibilität von Ollama mit der OpenAI API können Entwickler KI-Modelle in lokalen Umgebungen einfacher integrieren und nutzen. Das ist eine wichtige Veränderung, die die Zugänglichkeit für die Entwicklung KI-basierter Anwendungen erhöht.
- Unterstützung verschiedener Programmiersprachen: Die Unterstützung über Python- und JavaScript-Bibliotheken zeigt die Einsetzbarkeit in unterschiedlichen Entwicklungsumgebungen. Das bedeutet, dass Entwickler KI-Funktionen leicht in ihre bevorzugte Sprache integrieren können.
- Integration mit Open-Source-Frameworks: Die Beispiele zur Anbindung an Open-Source-Frameworks wie Vercel AI SDK und Autogen zeigen das breitere Einsatzpotenzial von Ollama und das Potenzial, communitygetriebene Innovation zu fördern.
1 Kommentare
Hacker-News-Kommentare
In den letzten Monaten hat sich die Benutzerfreundlichkeit lokal gehosteter LLMs erstaunlich verbessert.
llamafilevon Mozilla-Ocho ist.Manche stören sich persönlich daran, dass die OpenAI-API-Kompatibilität zum Community-Standard wird.
Es wird an einer verbesserten Version von Copilot gearbeitet, die unterstützt, dass Nutzer ihr eigenes LLM mitbringen.
Ollama funktioniert besser als andere Tools und läuft einfach.
Das Linux-Installationsskript von Ollama arbeitet im aktuell üblichen Stil.
sudoRoot-Rechte an.Die Kompatibilität mit OpenAI ist etwas irreführend.
Eine Kompatibilitätsschicht kann auch in Bibliotheken aufgebaut werden.
llm(), das mit mehreren LLM-Backends funktioniert.Es wird an einem Projekt gearbeitet, das einen einfachen Wechsel zwischen Open-Source-Modellen (z. B. HF, VLLM) und kommerziellen Modellen (OpenAI, Google, Anthropic, Together) ermöglicht.
Es wird gefragt, wofür Ollama konkret gebraucht wird und warum man nicht einfach direkt
llama.cppverwenden sollte.Außerdem wird gefragt, ob Ollama lediglich
llama.cppdirekt als Dockerized-HTTP-Server aufruft und worin – abgesehen von der neu hinzugefügten OpenAI-API – sonst der Unterschied besteht.