- Veröffentlichung von Mistral NeMo, einem in Zusammenarbeit mit NVIDIA entwickelten Modell mit 12 Milliarden Parametern
- Bietet ein großes Kontextfenster von bis zu 128k Token
- In Schlussfolgern, Weltwissen und Coding-Genauigkeit auf Best-in-Class-Niveau
- Dank Standardarchitektur leicht in Systemen einsetzbar, die Mistral 7B verwenden
- Veröffentlichung vortrainierter Base- und Instruction-tuned-Checkpoints unter der Apache-2.0-Lizenz, um die Adoption durch Forschende und Unternehmen zu fördern
- Mit Quantisierungsbewusstsein trainiert, wodurch FP8-Inferenz ohne Leistungsverlust möglich ist
Mehrsprachiges Modell
- Entwickelt für globale mehrsprachige Anwendungen
- Für Function Calling trainiert und mit großem Kontextfenster ausgestattet
- Besonders stark in Englisch, Französisch, Deutsch, Spanisch, Italienisch, Portugiesisch, Chinesisch, Japanisch, Koreanisch, Arabisch und Hindi
- Ziel ist es, Nutzern aller Sprachen ein KI-Modell auf dem neuesten Stand der Technik bereitzustellen
Tekken, ein effizienterer Tokenizer
- Verwendet den neuen auf Tiktoken basierenden Tokenizer Tekken
- Komprimiert natürlichsprachlichen Text und Source Code in mehr als 100 Sprachen effizienter als der SentencePiece-Tokenizer
- Etwa 30 % effizienter bei Source Code, Chinesisch, Italienisch, Französisch, Deutsch, Spanisch und Russisch
- In Koreanisch bzw. Arabisch jeweils 2- bzw. 3-mal effizienter
- Im Vergleich zum Llama-3-Tokenizer bessere Kompressionsleistung in rund 85 % der Sprachen
Instruction Fine-Tuning
- Mistral NeMo durchläuft fortgeschrittene Fine-Tuning- und Alignment-Phasen
- Im Vergleich zu Mistral 7B deutlich besser darin, Anweisungen präzise zu befolgen, Schlussfolgerungen zu ziehen, Multi-Turn-Gespräche zu verarbeiten und Code zu generieren
Links
- Die Gewichte der Base- und Instruction-Modelle werden auf HuggingFace gehostet
- Mistral NeMo kann mit
mistral-inference ausprobiert und mit mistral-finetune angepasst werden
- Als NVIDIA-NIM-Inferenz-Microservice paketiert und auf ai.nvidia.com verfügbar
1 Kommentare
Hacker-News-Kommentare
Mistral NeMo ist ein in Zusammenarbeit mit NVIDIA entwickeltes 12B-Modell und bietet ein großes Kontextfenster von bis zu 128k Token
Mistral NeMo verwendet den neuen Tokenizer Tekken, der auf mehr als 100 Sprachen trainiert wurde und Text sowie Source Code effizienter komprimiert als SentencePiece
Auch im NVIDIA-Blog gibt es einen Beitrag zu Mistral NeMo
Große Modelle werden in schneller Folge veröffentlicht, was darauf hindeutet, dass Unternehmen Wege gefunden haben, skalierbare Prozesse auszuweiten
Es gibt die Meinung, dass die Erfahrung, sich bei NVIDIA Enterprise anzumelden, um die Paketversion von "NIM" auszuprobieren, umständlich ist
Es gibt die Meinung, dass Mistral, wenn es die Weiterentwicklung von Open Source ernsthaft in Betracht zieht, den für das Modelltraining verwendeten Korpus teilen sollte
Es wird gefragt, ob das Training in mehreren Sprachen einen "Crossover" bietet
Es besteht wenig Verständnis für das Geschäftsmodell, Open-Source-Generative-AI-Modelle kostenlos zu veröffentlichen