- Mistral hat Pixtral 12B vorgestellt, sein erstes Modell, das sowohl Bilder als auch Text verarbeiten kann
- Ein Modell mit 12 Milliarden Parametern und einer Größe von etwa 24 GB
- Es basiert auf Mistrals Textmodell Nemo 12B
- Es kann Fragen zu einer beliebigen Anzahl und Größe von Bildern beantworten, die per URL oder als base64-kodierte Bilder übergeben werden
- Ähnlich wie andere multimodale Modelle wie Anthropics Claude-Familie oder OpenAIs GPT-4 dürfte es Aufgaben wie Bildunterschriften, das Zählen von Objekten auf Fotos und Ähnliches ausführen können
- Der Download ist über GitHub und Hugging Face per Torrent-Link möglich
- Unter der Apache-2.0-Lizenz kann es ohne Einschränkungen heruntergeladen, feinabgestimmt und genutzt werden
- Die Web-Demo funktioniert derzeit noch nicht, soll aber bald in Le Chat und Le Plateforme, Mistrals Plattformen für Chatbot- und API-Dienste, testbar sein
- Kürzlich hat Mistral eine von General Catalyst angeführte Finanzierungsrunde über 645 Millionen US-Dollar abgeschlossen und wurde dabei mit 6 Milliarden US-Dollar bewertet
- Das etwas mehr als ein Jahr alte Unternehmen, an dem Microsoft eine Minderheitsbeteiligung hält, gilt als Europas OpenAI
- Es verfolgt die Strategie, kostenlose „offene“ Modelle zu veröffentlichen, für gemanagte Versionen Gebühren zu verlangen und Unternehmenskunden Beratungsdienste anzubieten
Noch keine Kommentare.