- Mistral Large ist ein hochmodernes Modell zur Textgenerierung mit erstklassigen Schlussfolgerungsfähigkeiten
- Es kann komplexe Schlussfolgerungsaufgaben in verschiedenen Sprachen ausführen und für Textverständnis, Transformation und Codegenerierung eingesetzt werden
- Im MMLU-Benchmark zeigt es eine starke Leistung und ist das weltweit zweithöchstplatzierte Modell, das allgemein über eine API verfügbar ist
- Nach GPT-4 mit 86,4 % folgt es mit 81,2 %, Claude 2 mit 78,5 % und Gemini Pro mit 71,8 %
Neue Funktionen und Stärken von Mistral Large
- Beherrscht Englisch, Französisch, Spanisch, Deutsch und Italienisch auf muttersprachlichem Niveau und bietet ein feines Verständnis für Grammatik und kulturellen Kontext
- Das 32K-Token-Kontextfenster ermöglicht eine präzise Informationswiedergabe aus umfangreichen Dokumenten
- Durch die Fähigkeit, präzise Anweisungen zu befolgen, können Entwickler ihre eigenen Moderationsrichtlinien entwerfen; dies wird für die Moderationseinstellungen auf Systemebene in le Chat genutzt
- Integrierte Function Calling ermöglicht zusammen mit dem auf
la Plateforme implementierten Modus für eingeschränkte Ausgaben die Entwicklung von Anwendungen und die Modernisierung von Tech-Stacks im großen Maßstab
Bereitstellung des Modells auf Azure durch die Partnerschaft mit Microsoft
- Mistrals Ziel ist es, führende KI zu demokratisieren; dafür werden Open- und kommerzielle Modelle auf Azure bereitgestellt
- Die Modelle von Mistral sind über La Plateforme und Azure nutzbar und können auch direkt in der eigenen Umgebung bereitgestellt werden
- La Plateforme wird sicher in Mistrals europäischer Infrastruktur gehostet, Azure wird über Azure AI Studio und Azure Machine Learning angeboten
- Die Self-Deployment-Option ermöglicht bei besonders sensiblen Anwendungsfällen Zugriff auf die Modellgewichte; weitere Informationen gibt es in den Success Stories oder über eine Kontaktaufnahme mit dem Team
Fähigkeiten von Mistral Large
- Mistral Large zeigt auf Standard-Benchmarks starke Schlussfolgerungsfähigkeiten im Vergleich zu führenden LLM-Modellen
- Auch bei den mehrsprachigen Fähigkeiten liegt Mistral Large in Französisch, Deutsch, Spanisch und Italienisch deutlich vor LLaMA 2 70B
- Auch bei Coding- und Mathematikaufgaben zeigt es Spitzenleistung
Neues Mistral Small, optimiert für Workloads mit niedriger Latenz
- Zusammen mit Mistral Large wurde das neue Modell Mistral Small veröffentlicht, das auf geringe Latenz und niedrige Kosten optimiert ist
- Mistral Small bietet bessere Leistung als Mixtral 8x7B bei geringerer Latenz und ist damit eine ausgereifte Zwischenlösung zwischen Open-Weight-Angeboten und Flaggschiffmodellen
- Mistral Small nutzt dieselben Innovationen für RAG-Aktivierung und Function Calling wie Mistral Large
- Es bietet preislich wettbewerbsfähige Open-Weight-Endpunkte und neue optimierte Modell-Endpunkte und ermöglicht damit einen umfassenden Blick auf den Performance/Kosten-Trade-off
JSON-Format und Function Calling
- Der JSON-Formatmodus erzwingt, dass die Ausgaben des Sprachmodells gültiges JSON sind
- Über Function Calling können Entwickler ihre eigenen Toolsets mit den Mistral-Endpunkten verbinden und so komplexere Interaktionen mit internem Code, APIs oder Datenbanken ermöglichen
- Function Calling und JSON-Format sind nur für
mistral-small und mistral-large verfügbar; Format-Spezifikationen für alle Endpunkte sollen bald ergänzt werden
Meinung von GN⁺
- Mistral Large ist ein KI-Sprachmodell mit mehrsprachiger Unterstützung und fortgeschrittenen Schlussfolgerungsfähigkeiten; besonders bemerkenswert ist seine Fähigkeit, komplexe Aufgaben in verschiedenen Sprachen auszuführen.
- Das Modell hat das Potenzial, mit bestehenden Modellen wie GPT-4 zu konkurrieren, und insbesondere die Unterstützung verschiedener Sprachen erhöht seine Einsatzmöglichkeiten auf dem globalen Markt.
- Die Partnerschaft mit Azure bietet Mistral AI die Chance, mit seinen Modellen eine breitere Nutzerbasis zu erreichen, und stärkt die Skalierbarkeit und Zugänglichkeit Cloud-basierter KI-Services.
- Die Einführung optimierter Modelle wie Mistral Small kann für Unternehmen, die kosteneffiziente KI-Lösungen mit niedriger Latenz benötigen, eine attraktive Option sein.
- JSON-Format und Function Calling erleichtern Entwicklern die Integration von KI-Modellen in ihre Anwendungen und erhöhen so die Praxistauglichkeit und Flexibilität von KI-Technologie.
1 Kommentare
Hacker-News-Kommentare
Die Ehrlichkeit der Marketingunterlagen wird sehr geschätzt. Benchmark-Werte zu zeigen, die unter denen des Marktführers liegen, ist besser, als Benchmarks wie Google selektiv zu verwenden.
Es wurde bereits viel getan, aber es wäre schön gewesen, noch einmal das Versprechen zu bekräftigen, zur Open-Source-Community beizutragen. Das schien ein wichtiger Teil ihrer Marke zu sein.
Nach der miqu-Affäre habe ich beobachtet und erwartet, dass mehr Open Weights erscheinen würden, aber offenbar muss man das Ergebnis abwarten.
Update zu den Änderungen: Umbenennung von API-Endpunkten und Hinzufügen von Modell-Endpunkten, Veröffentlichung neuer Modelle, Updates bestehender Modelle sowie Hinweise auf geplante Abkündigungen.
Neue API-Funktionen: Function Calling und JSON-Modus sind jetzt für die Modelle Mistral Small und Mistral Large verfügbar.
La Plateforme: Ein Zahlungssystem mit Unterstützung mehrerer Währungen wurde hinzugefügt und Plattformfunktionen für Unternehmen wurden eingeführt.
Le Chat: Einführung einer neuen Chat-Oberfläche, mit der man leicht mit Mistral-Modellen interagieren kann.
Das neue Modell wurde dem Plugin für das LLM-CLI-Tool hinzugefügt. Es kann jetzt wie folgt verwendet werden.
Ich habe mit Le Chat einige Coding-Probleme gelöst, die heute aufgetreten sind, und es lieferte deutlich bessere Antworten als ChatGPT (einschließlich GPT-4). Ich bin nicht sicher, ob die Qualität von ChatGPT, wie manche vermuten, zur Kostensenkung gesunken ist, aber bei diesen Problemen war die Antwortqualität von Mistral deutlich besser.
Ich wusste nicht, dass es Le Chat gibt. Ich wollte einen ChatGPT-Konkurrenten auf Basis von Mistral, und mir gefällt auch, dass sie vor den Produktnamen "le" setzen.
Auf Azure ist Mistral etwas günstiger als GPT-4.
Die Frage ist, ob der ganze Wirbel um Open Weights bereits vorbei ist und ob alles weiterhin geschlossen bleiben wird.
Es gibt nirgendwo Informationen zur Parametergröße; die Frage ist, ob das beabsichtigt ist oder ob ich etwas übersehen habe.
Es ist ein bisschen so, als gäbe es mehrere austauschbare CPU-Architekturen. Jedes Mal, wenn ein neues LLM veröffentlicht wird, entsteht die Hoffnung, dass Monopole weiter zurückgedrängt werden und sich die Lage verbessert. Auch ohne Open-Source-Modelle scheint OpenAI seine Mission bereits erreicht zu haben.