8 Punkte von GN⁺ 2024-02-27 | 1 Kommentare | Auf WhatsApp teilen
  • Mistral Large ist ein hochmodernes Modell zur Textgenerierung mit erstklassigen Schlussfolgerungsfähigkeiten
  • Es kann komplexe Schlussfolgerungsaufgaben in verschiedenen Sprachen ausführen und für Textverständnis, Transformation und Codegenerierung eingesetzt werden
  • Im MMLU-Benchmark zeigt es eine starke Leistung und ist das weltweit zweithöchstplatzierte Modell, das allgemein über eine API verfügbar ist
    • Nach GPT-4 mit 86,4 % folgt es mit 81,2 %, Claude 2 mit 78,5 % und Gemini Pro mit 71,8 %

Neue Funktionen und Stärken von Mistral Large

  • Beherrscht Englisch, Französisch, Spanisch, Deutsch und Italienisch auf muttersprachlichem Niveau und bietet ein feines Verständnis für Grammatik und kulturellen Kontext
  • Das 32K-Token-Kontextfenster ermöglicht eine präzise Informationswiedergabe aus umfangreichen Dokumenten
  • Durch die Fähigkeit, präzise Anweisungen zu befolgen, können Entwickler ihre eigenen Moderationsrichtlinien entwerfen; dies wird für die Moderationseinstellungen auf Systemebene in le Chat genutzt
  • Integrierte Function Calling ermöglicht zusammen mit dem auf la Plateforme implementierten Modus für eingeschränkte Ausgaben die Entwicklung von Anwendungen und die Modernisierung von Tech-Stacks im großen Maßstab

Bereitstellung des Modells auf Azure durch die Partnerschaft mit Microsoft

  • Mistrals Ziel ist es, führende KI zu demokratisieren; dafür werden Open- und kommerzielle Modelle auf Azure bereitgestellt
  • Die Modelle von Mistral sind über La Plateforme und Azure nutzbar und können auch direkt in der eigenen Umgebung bereitgestellt werden
  • La Plateforme wird sicher in Mistrals europäischer Infrastruktur gehostet, Azure wird über Azure AI Studio und Azure Machine Learning angeboten
  • Die Self-Deployment-Option ermöglicht bei besonders sensiblen Anwendungsfällen Zugriff auf die Modellgewichte; weitere Informationen gibt es in den Success Stories oder über eine Kontaktaufnahme mit dem Team

Fähigkeiten von Mistral Large

  • Mistral Large zeigt auf Standard-Benchmarks starke Schlussfolgerungsfähigkeiten im Vergleich zu führenden LLM-Modellen
  • Auch bei den mehrsprachigen Fähigkeiten liegt Mistral Large in Französisch, Deutsch, Spanisch und Italienisch deutlich vor LLaMA 2 70B
  • Auch bei Coding- und Mathematikaufgaben zeigt es Spitzenleistung

Neues Mistral Small, optimiert für Workloads mit niedriger Latenz

  • Zusammen mit Mistral Large wurde das neue Modell Mistral Small veröffentlicht, das auf geringe Latenz und niedrige Kosten optimiert ist
  • Mistral Small bietet bessere Leistung als Mixtral 8x7B bei geringerer Latenz und ist damit eine ausgereifte Zwischenlösung zwischen Open-Weight-Angeboten und Flaggschiffmodellen
  • Mistral Small nutzt dieselben Innovationen für RAG-Aktivierung und Function Calling wie Mistral Large
  • Es bietet preislich wettbewerbsfähige Open-Weight-Endpunkte und neue optimierte Modell-Endpunkte und ermöglicht damit einen umfassenden Blick auf den Performance/Kosten-Trade-off

JSON-Format und Function Calling

  • Der JSON-Formatmodus erzwingt, dass die Ausgaben des Sprachmodells gültiges JSON sind
  • Über Function Calling können Entwickler ihre eigenen Toolsets mit den Mistral-Endpunkten verbinden und so komplexere Interaktionen mit internem Code, APIs oder Datenbanken ermöglichen
  • Function Calling und JSON-Format sind nur für mistral-small und mistral-large verfügbar; Format-Spezifikationen für alle Endpunkte sollen bald ergänzt werden

Meinung von GN⁺

  • Mistral Large ist ein KI-Sprachmodell mit mehrsprachiger Unterstützung und fortgeschrittenen Schlussfolgerungsfähigkeiten; besonders bemerkenswert ist seine Fähigkeit, komplexe Aufgaben in verschiedenen Sprachen auszuführen.
  • Das Modell hat das Potenzial, mit bestehenden Modellen wie GPT-4 zu konkurrieren, und insbesondere die Unterstützung verschiedener Sprachen erhöht seine Einsatzmöglichkeiten auf dem globalen Markt.
  • Die Partnerschaft mit Azure bietet Mistral AI die Chance, mit seinen Modellen eine breitere Nutzerbasis zu erreichen, und stärkt die Skalierbarkeit und Zugänglichkeit Cloud-basierter KI-Services.
  • Die Einführung optimierter Modelle wie Mistral Small kann für Unternehmen, die kosteneffiziente KI-Lösungen mit niedriger Latenz benötigen, eine attraktive Option sein.
  • JSON-Format und Function Calling erleichtern Entwicklern die Integration von KI-Modellen in ihre Anwendungen und erhöhen so die Praxistauglichkeit und Flexibilität von KI-Technologie.

1 Kommentare

 
GN⁺ 2024-02-27
Hacker-News-Kommentare
  • Die Ehrlichkeit der Marketingunterlagen wird sehr geschätzt. Benchmark-Werte zu zeigen, die unter denen des Marktführers liegen, ist besser, als Benchmarks wie Google selektiv zu verwenden.

  • Es wurde bereits viel getan, aber es wäre schön gewesen, noch einmal das Versprechen zu bekräftigen, zur Open-Source-Community beizutragen. Das schien ein wichtiger Teil ihrer Marke zu sein.

  • Nach der miqu-Affäre habe ich beobachtet und erwartet, dass mehr Open Weights erscheinen würden, aber offenbar muss man das Ergebnis abwarten.

  • Update zu den Änderungen: Umbenennung von API-Endpunkten und Hinzufügen von Modell-Endpunkten, Veröffentlichung neuer Modelle, Updates bestehender Modelle sowie Hinweise auf geplante Abkündigungen.

  • Neue API-Funktionen: Function Calling und JSON-Modus sind jetzt für die Modelle Mistral Small und Mistral Large verfügbar.

  • La Plateforme: Ein Zahlungssystem mit Unterstützung mehrerer Währungen wurde hinzugefügt und Plattformfunktionen für Unternehmen wurden eingeführt.

  • Le Chat: Einführung einer neuen Chat-Oberfläche, mit der man leicht mit Mistral-Modellen interagieren kann.

  • Das neue Modell wurde dem Plugin für das LLM-CLI-Tool hinzugefügt. Es kann jetzt wie folgt verwendet werden.

  • Ich habe mit Le Chat einige Coding-Probleme gelöst, die heute aufgetreten sind, und es lieferte deutlich bessere Antworten als ChatGPT (einschließlich GPT-4). Ich bin nicht sicher, ob die Qualität von ChatGPT, wie manche vermuten, zur Kostensenkung gesunken ist, aber bei diesen Problemen war die Antwortqualität von Mistral deutlich besser.

  • Ich wusste nicht, dass es Le Chat gibt. Ich wollte einen ChatGPT-Konkurrenten auf Basis von Mistral, und mir gefällt auch, dass sie vor den Produktnamen "le" setzen.

  • Auf Azure ist Mistral etwas günstiger als GPT-4.

  • Die Frage ist, ob der ganze Wirbel um Open Weights bereits vorbei ist und ob alles weiterhin geschlossen bleiben wird.

  • Es gibt nirgendwo Informationen zur Parametergröße; die Frage ist, ob das beabsichtigt ist oder ob ich etwas übersehen habe.

  • Es ist ein bisschen so, als gäbe es mehrere austauschbare CPU-Architekturen. Jedes Mal, wenn ein neues LLM veröffentlicht wird, entsteht die Hoffnung, dass Monopole weiter zurückgedrängt werden und sich die Lage verbessert. Auch ohne Open-Source-Modelle scheint OpenAI seine Mission bereits erreicht zu haben.