Beta-Start des neuen Plattformdienstes von Mistral AI
- Mistral AI bietet Entwicklern leistungsstarke offene generative Modelle und Möglichkeiten, diese effizient bereitzustellen und anzupassen.
- Heute startet der Beta-Zugang zum ersten Plattformdienst, der drei Chatbot-Endpunkte für textbasierte Anweisungen sowie einen Embedding-Endpunkt bereitstellt.
- Jeder Endpunkt bietet einen anderen Trade-off zwischen Leistung und Preis.
Generative Endpunkte
mistral-tiny und mistral-small verwenden die beiden derzeit veröffentlichten Modelle, während mistral-medium ein Prototypmodell nutzt, das in der Deployment-Umgebung getestet wird.
- Die Modelle integrieren die wirksamsten Alignment-Techniken wie effizientes Fine-Tuning und Direct Preference Optimization, um Modelle zu schaffen, die sich leicht steuern lassen und angenehm zu verwenden sind.
Mistral-tiny unterstützt nur Englisch, Mistral-small unterstützt mehrere Sprachen und Code, und Mistral-medium wird als eines der führenden Service-Modelle bewertet.
Embedding-Endpunkt
Mistral-embed bietet ein Embedding-Modell mit Fokus auf Suchfunktionen und hat eine Embedding-Dimension von 1024.
- Dieses Embedding-Modell erreicht im MTEB einen Retrieval-Score von 55,26.
API-Spezifikation
- Die API folgt der Spezifikation einer populären Chatbot-Schnittstelle, die ursprünglich von einem Wettbewerber vorgeschlagen wurde.
- Es werden Client-Bibliotheken für Python und Javascript bereitgestellt, mit denen die Endpunkte abgefragt werden können.
- Die Endpunkte ermöglichen System Prompts, sodass Nutzer ein höheres Maß an Moderation für die Modellausgabe festlegen können.
Ausbau von Beta-Zugang zu allgemeiner Verfügbarkeit
- Ab heute kann sich jeder für die API registrieren und sie nutzen; die Kapazität soll schrittweise erhöht werden.
- Das Business-Team kann dabei helfen, Anforderungen zu klären und den Zugang zu beschleunigen.
- Während die Plattform zu einem vollständig selbstbedienbaren Angebot stabilisiert wird, kann es noch zu Instabilitäten kommen.
Danksagung
- Dank an NVIDIA für die Unterstützung bei der Integration von TensorRT-LLM und Triton sowie für die gemeinsame Arbeit an einer mit TRT-LLM kompatiblen sparsamen Mixture of Experts.
Meinung von GN⁺
- Der wichtigste Punkt dieses Artikels ist, dass Mistral AI Entwicklern neue generative Modelle und ein Embedding-Modell zur Verfügung stellt, wodurch bessere Funktionen für Textgenerierung und Embeddings nutzbar werden.
- Diese Technologien werden die Weiterentwicklung der künstlichen Intelligenz fördern, und die Fähigkeit, verschiedene Sprachen und Code zu unterstützen, dürfte die Einsatzmöglichkeiten im globalen Markt deutlich erweitern.
- Für Entwickler eröffnet dies mit neuen Tools und APIs spannende Chancen, kreative Projekte und Lösungen zu entwickeln, was die Erwartungen an die Zukunft der Technologie weiter steigert.
1 Kommentare
Hacker-News-Kommentare