1 Punkte von GN⁺ 5 시간 전 | 1 Kommentare | Auf WhatsApp teilen
  • Mistral positioniert sich nicht mehr nur als Modellanbieter, sondern als Unternehmen für den gesamten AI-Stack, das Compute, Modelle, Plattform und Beratung bündelt
  • Mit einem 40-MW-Rechenzentrum in Paris und Plänen für weitere Rechenzentren differenziert sich das Unternehmen durch offene, anpassbare Modelle, die Kunden besitzen und On-Premises ausführen können
  • Im Mittelpunkt standen weniger neue Modelle als vielmehr Partnerschaften; zentral waren die Kooperationen mit ASML, BNP Paribas und Amazon Alexa+ sowie die Vorstellung von Vibe for Work
  • Im Agenten-System fügt das Harness Kontext, Persistenz und Lernen hinzu, während Reasoning als Schlüsselelement für Fehlerbehebung und Transparenz behandelt wird
  • Kleine, spezialisierte Modelle und On-Premises-Deployment sind eine Strategie für regulierte Branchen und europäische Unternehmen, mit Fokus auf konkreten Return on Investment statt auf den AGI-Wettlauf

Mistrals Positionierung

  • Mistral entwickelt sich über ein reines Modellunternehmen hinaus in Richtung eines Full-Stack-AI-Anbieters, der Compute, Modelle, Plattform und Beratung umfasst
  • Das Unternehmen verfügt über ein 40-MW-Rechenzentrum in Paris und plant zusätzliche Rechenzentren, unter anderem in Schweden
  • Der Unterschied zu Anthropic oder OpenAI liegt darin, dass die Modelle effizient, offen und anpassbar sind und vom Kunden besessen sowie On-Premises ausgeführt werden können
  • Die Botschaft der Veranstaltung legte mehr Gewicht auf Partnerschaften als auf neue Modelle oder technische Durchbrüche
    • Die Kooperationen mit ASML, BNP Paribas und Amazon Alexa+ wurden als Beispiele dafür vorgestellt, wie reale Probleme mit AI gelöst werden
    • Vibe for Work wurde vorgestellt und als Produkt ähnlich zu Claude for Work beschrieben

Produktstrategie und Anwendungsfälle

  • Agenten-Systeme und Harness

    • Modelle allein reichen nicht aus; das Harness übernimmt die Rolle, Kontext, Persistenz und Lernen hinzuzufügen
    • Reasoning wird als zentrales Element behandelt, das dem System ermöglicht, zurückzugehen, sich von Fehlern zu erholen und Transparenz zu wahren
    • Best Practices in Organisationen werden als Skills erfasst und entwickeln sich weiter, während man mit AI-Agenten zusammenarbeitet
  • Kleine, spezialisierte Modelle

    • Mistral zeigt Beispiele, in denen kleine, schnelle und klar fokussierte Modelle große universelle Modelle bei Energieeffizienz und Geschwindigkeit übertreffen
    • Document AI ist ein Modell für OCR und wird vom EU Patent Office für OCR im großen Maßstab genutzt
    • Voxtral ist ein mehrsprachiges Sprachmodell und wird eingesetzt, um Amazon Alexa+ in Europa anzutreiben
    • Robostral wird für industrielle Robotik mit ASML verwendet
    • Bei agentischen Anwendungen mit hohem Token-Verbrauch werden Geschwindigkeit und Effizienz ebenso wichtig wie rohe Leistung
  • Souveränität und On-Premises-Deployment

    • BNP Paribas betreibt Mistral-Modelle in Belgien On-Premises für KYC-Zwecke und hält sensible Daten innerhalb der Bank
    • Abanca nutzt Agenten-Orchestrierung, um sensible Informationen von mehr als einer Million Kunden in der App in großem Maßstab zu verarbeiten
    • Für europäische Unternehmen in regulierten Branchen kann dies eine Alternative sein, um die Abhängigkeit von US-Hyperscalern zu verringern
  • Einsatz in den Geisteswissenschaften

    • Ein Forschungsteam der Austrian Academy of Sciences hat Mistrals Coding-LLM Codestral feinabgestimmt, damit es tausende Jahre alte Papyrusfragmente lesen kann
    • Diese Arbeit trägt dazu bei, eine Sammlung von 180.000 Dokumenten zugänglich zu machen, die in der ägyptischen Wüste gefunden wurden
    • Die Aufgabe wurde als etwas beschrieben, das ohne AI mehr als 2.000 Jahre gedauert hätte
    • Das Apollo-Projekt der Austrian Academy of Sciences zeigt als Beispiel, dass AI auch zu den Geisteswissenschaften beitragen kann
  • Europäische AI-Partnerstrategie

    • Mistrals Vision zielt weniger darauf ab, den AGI-Wettlauf zu gewinnen, sondern vielmehr darauf, ein europäischer Full-Stack-AI-Partner zu werden, der schon heute konkreten Return on Investment liefert
    • Der Erfolg dieser Strategie hängt davon ab, ob mehr europäische Unternehmen Mistrals Ansatz übernehmen
    • Die Kombination aus offenen Modellen, On-Premises-Deployment und Enterprise-Partnerschaften könnte für viele große Organisationen in der EU attraktiv sein
    • Die Zeit der blinden Abhängigkeit von US-Tech-Giganten geht zu Ende; entscheidend ist, dass ein ernstzunehmender europäischer AI-Player entstanden ist

1 Kommentare

 
GN⁺ 5 시간 전
Hacker-News-Kommentare
  • Ich unterstütze Mistral und kleine, auf bestimmte Aufgaben spezialisierte Modelle wirklich, aber Mistral ist seit dem 3. Quartal 2025 viel zu weit zurückgefallen.
    Um heute konkurrenzfähig zu sein, muss man Reasoning-Modelle betreiben können, die auch bei mittlerer Kontextlänge gut sind, und bei Mistral sieht es so aus, als könnten sie das nicht.
    Bei kleinen Modellen sind derzeit Gemma4 und Qwen3.6 am besten, und Mistrals „small“-Modell hat 120B Parameter, also ungefähr viermal so viele, kann aber nicht einmal richtig mit Modellen konkurrieren, die nur ein Viertel so groß sind.
    Vor einem Jahr, zu Zeiten von Mistral Small 3.1, waren sie noch mit dabei, aber inzwischen sind sie fast völlig aus der Wahrnehmung verschwunden.
    Wenn Mistral den On-Premises-Markt und den Markt für auf bestimmte Aufgaben spezialisierte kleine Modelle ernsthaft anvisiert, könnte ein ziemlich guter Stellvertreterindikator sein, ob die Leute auf r/localLlama von einem Modell begeistert sind.

    • Stimme zu. Ich bin zahlender Le Chat Pro-Nutzer und unterstütze eine europäische Alternative wirklich, aber der Qualitätsabstand zwischen Mistral und den Frontier-Labs wird inzwischen so groß, dass er sich kaum noch ignorieren lässt.
      Dass auf der Konferenz kaum über neue Modelle gesprochen wurde, macht mir ebenfalls Sorgen. Für mich persönlich ist das der Bereich, auf den sie sich am stärksten konzentrieren müssten.
      Ich frage mich, was sie ausbremst. Geld, Rechenressourcen, Fähigkeiten, Trainingsdaten — ich weiß es nicht.
      Um wirklich gute Modelle zu bauen, muss man wahrscheinlich mit ziemlich fragwürdigen Daten trainieren, etwa mit Outputs von Frontier-Modellen, und ich fürchte, Mistral ist zu europäisch und zu stark auf Unternehmenskunden ausgerichtet, um dieses Risiko einzugehen.
    • Mistral scheint in die Phase eingetreten zu sein, in der europäische Technologieunternehmen landen, die nicht von US-Unternehmen übernommen wurden: möglichst viel Geld der EU-Steuerzahler abschöpfen.
      Am Ende wird es wohl wie Dailymotion als Zombie-Unternehmen enden.
    • Das weicht leicht vom Thema kleine, auf bestimmte Aufgaben spezialisierte Modelle ab, aber aus Unwissen gefragt: Gibt es einen grundsätzlichen Grund, warum Anbieter von Frontier-Modellen keine kleineren, stärker fokussierten Modelle veröffentlichen?
      Ich denke zum Beispiel an ein Modell, das in Claude Code standardmäßig verwendet würde, eine auf Software spezialisierte Teilmenge von Opus.
      Kleiner, günstiger in Deployment und Nutzung und vielleicht auch schneller.
    • Stimme zu. Wenn die Frontier-Labs die nächste Preiserhöhung durchziehen und die Limits ihrer Abo-Stufen zwangsläufig weiter senken, werden die Leute Modellanbieter viel ernster neu bewerten.
      Dann müsste Mistral bereit sein, aber angesichts der jüngsten Ergebnisse sind die realistischen Erwartungen eher gering.
    • Ich betreibe LLMs lokal, und persönlich sind 22B~32B das Maximum, das ich überhaupt noch ausprobieren würde.
      Wenn Mistral 4 pro Token 6B aktive Parameter hat, dann ist selbst bei 3 bis 3,5 Parametern pro Token auf einer 4090 ein Download- und Speicherbedarf von etwa 240GB für lokale Tests schon fast an der Grenze.
      Das gilt umso mehr, wenn man mehrere Modelle herunterladen und evaluieren will, und es macht es auch schwieriger, dass andere darauf aufbauende Fine-Tunings erstellen, wie es bei früheren Mistral-/Magistral-Modellen der Fall war.
  • Ich habe einen hervorragenden Vortrag eines Regierungsverantwortlichen für IT gehört, der Modelle evaluiert und mit der aktuellen Lage ziemlich unzufrieden war.
    Er will Mistral verwenden, und in manchen Fällen ist es sogar das einzige EU-basierte Modell, das überhaupt infrage kommt, weiß aber auch, dass die Leistung wirklich schlecht ist und sie immer weiter zurückfallen.
    Mistral kann vielleicht trotzdem ein profitables Geschäft aufbauen, einfach weil es für EU-Anwendungsfälle das einzige praktikable Modell ist, selbst wenn es schlecht ist. Das ist traurig und schwer mit anzusehen.

  • Ich wünsche mir wirklich, dass Europa bei AI-Entwicklung und Forschung mitspielt, und ich habe Mistral stark unterstützt.
    Aber der technologische Abstand wird immer größer. Wenn sie das nicht korrigieren können, wird das ein weiterer Beleg dafür sein, dass Europa keine großen Technologieunternehmen mit gutem Ausgang führen kann.
    Praktisch alle chinesischen Labs machen es deutlich besser. Selbst wenn man DeepSeek außen vor lässt: MiMo 2.5 und Minimax 2.7 wurden nicht von Mistral gebaut.
    Die Modelle von Mistral sind entweder schwächer oder größer und langsamer, oder es sind Modelle ohne Mixture of Experts (MoE), was nicht gut ist.

    • https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
      Europa hat sich mit diesem in einer Phase öffentlicher Hysterie hastig zusammengeschusterten Gesetz selbst ins Knie geschossen, und heute würde kein vernünftiges Unternehmen dort noch etwas aufbauen wollen.
      In den USA oder China kann ein AI-Startup mit einem Jungen und einem Computer anfangen, in Europa braucht derselbe Junge zwölf Anwälte.
      Dass Mistral trotz Vorsprung, sehr vielversprechender erster Modelle und der erhaltenen Finanzierung in der Bedeutungslosigkeit verschwindet, könnte das Ergebnis davon sein, dass man versucht hat, all diese Regulierungen einzuhalten.
    • Ich weiß nicht, was genau damit gemeint ist, dass der technologische Abstand immer größer wird. Ist Aufholen nicht einfacher und billiger, als die Spitze selbst zu erschließen?
    • In Bezug auf Mixture of Experts (MoE) erinnere ich mich an Mixtral als das Modell, das zum ersten Mal die Praxistauglichkeit von MoE gezeigt hat.
      Ich war von dem Technical Report tief beeindruckt. Soweit ich weiß, gab es die MoE-Idee an sich natürlich schon vorher.
      Hätte man die Mixtral-Modellfamilie stärker vorangetrieben, hätte sie heute vielleicht einen Ruf wie die Qwen-Reihe. Eine verpasste Chance.
    • Die britische Regierung hat kürzlich angekündigt, 10 Millionen Pfund in AI-Forschung zu stecken, aber wahrscheinlich wird das meiste davon bei Beratern landen.
      Dagegen betrachtet macht Europa es meiner Meinung nach eigentlich ziemlich gut.
  • BNP Paribas betreibt in Belgien Mistral-Modelle On-Premises für KYC, und wichtig ist dabei, dass sensible Daten innerhalb der Bank bleiben.
    Abanca nutzt ebenfalls Agent Orchestration, um große Mengen sensibler Kundendaten zu verarbeiten, etwa die 2 Millionen Kunden der App.
    Für europäische Unternehmen in regulierten Branchen ist das eine bessere Alternative, als von US-Hyperscalern abhängig zu sein, und dass sich Mistral auf On-Premises- und in Europa gehostete Modelle konzentriert, ist ein sehr kluger Kurs.

    • Höflich gesagt halte ich das nicht für „sehr“ klug. Es ist nur eine brauchbare Option in einer Situation mit begrenzter Auswahl.
      Alle machen inzwischen Full-Deployment-Engineering oder kundenspezifisches Engineering, weil man sonst einfach wie ein Unternehmen wirkt, das nur eine Marge auf Token-Kosten aufschlägt.
      Dann werden Neo-SaaS-Unternehmen das Geld abschöpfen. Wer sollte sonst Mistrals AI kaufen, und welche Alternativen gäbe es überhaupt?
    • Dass Mistral mit der Übernahme von Koyeb seine Expertise für großskalige Deployments gestärkt hat, war ebenfalls genau die richtige Entscheidung.
    • Ich glaube nicht, dass sich Mistral auf die Erzeugung von Inhalten wie Code, Bildern oder Videos konzentriert.
      Stattdessen scheinen sie sich auf andere Bereiche wie mehrsprachige Modelle, OCR und Sprache zu fokussieren.
      Ihre Modellübersichtsseite zeigt das auch, aber sie ist so bunt und hat so viele Kategorien und Modellnamen, dass ich immer durcheinanderkomme.
      Hoffentlich führen ihre Entscheidungen zu guten Ergebnissen.
    • Ist das nicht der typische Weg von EU-Startups, nachdem sie B2C oder den weltweiten SaaS-Markt aufgegeben haben? Sich wieder auf B2B mit großen europäischen Unternehmen und auf Regierungsaufträge zu konzentrieren?
      Enterprise-B2B hat sich für europäische Startups immer wie ein Ort zum Sterben angefühlt.
    • Trotzdem: Warum sollte man Mistral On-Premises einsetzen? Warum nicht stattdessen Qwen?
  • Ich war auf der Veranstaltung, und die Zahl der Teilnehmer war beeindruckend, außerdem waren die Führungskräfte der wichtigsten börsennotierten europäischen Unternehmen alle da.
    Interessant war auch, wie viele Partner eingeladen waren. Es reichte von Microsoft, Accenture und EY bis zu Startups wie alpic.ai oder lingo.dev.
    Es sieht auch so aus, als würden sie ihre M&A-Aktivitäten verstärken.

  • Unabhängig vom Geschäft ist das Website-Design wirklich hervorragend: https://mistral.ai/

    • Wirkt viel zu komplex, und auch die Absatzanordnung ist verrutscht.
    • Ich weiß nicht genau, was daran gut sein soll. Ich habe auf dem Handy gescrollt, und es wirkte wie eine ziemlich gewöhnliche Unternehmenswebsite.
    • Mir gefällt das gesamte Branding von Mistral.
  • Ich habe eine E-Mail von Mistral bekommen, in der stand, dass einige, vielleicht die meisten dedizierten Modelle wie devstral bis August schrittweise eingestellt werden und man nun allgemeine Modelle verwenden solle.
    Die Kosten steigen exponentiell.
    Dort steht, dass für Devstral 2 (devstral-2512 und devstral-latest) der Wechsel auf das stärkere Modell Mistral Medium 3.5 (mistral-medium-3-5, mit reasoning_effort auf "high" gesetzt) empfohlen wird, zum Preis von $1.5/$7.5 pro 1 Million Input-/Output-Token.
    Das ist eine Änderung gegenüber den bisherigen $0.4/$2.

    • Ich habe dieselbe E-Mail bekommen, dachte aber, ich hätte bereits alles auf Mistral-Medium-3.5 umgestellt, daher weiß ich nicht genau, welches auslaufende Modell ich noch verwendet habe.
      Jedenfalls habe ich nach der E-Mail gehofft, dass das ein Signal dafür ist, dass sie in den kommenden Monaten ein neues und verbessertes Modell herausbringen wollen.
  • Es scheint überhaupt keinen Burggraben zu geben. Das wirkt wie ein Software-Beratungsunternehmen mit Rechenzentrum.
    Außerdem heißt es im Beitrag, dass viele Kunden diese Modelle On-Premises nutzen, also ist selbst das Rechenzentrum kein wirklicher Vorteil.
    Was sollte irgendein staatlich gefördertes Startup daran hindern, kleine Open-Source-Modelle feinzujustieren?

    • Vielleicht, weil die Destillation kleiner Modelle aus größeren Modellen, die man selbst kontrolliert, zu besseren kleinen Modellen führen kann als Fine-Tuning auf Basis größerer Modelle, die man nicht kontrolliert.
      Ich behaupte nicht, dass das stimmt, sondern nur, dass diese Annahme möglich ist.
  • Als Europäer stimme ich dem hundertfach zu.
    Unter all diesen Akteuren gefallen mir Mistrals Ausrichtung und Transparenz wirklich gut.

    • Auch wenn man kein Europäer ist, ist es gut, einen europäischen Wettbewerber zu sehen, der sich gegen amerikanische und chinesische Modelle stellt.
  • Wenn Abanca Agent Orchestration nutzt, um sensible Kundendaten in „riesigem Maßstab“ zu verarbeiten, also für die 2 Millionen Kunden der App, dann weiß ich nicht, ob mein Maßstab für riesigen Maßstab einfach verzerrt ist.
    Bei 2 Millionen Nutzern wären das doch vielleicht nur ein paar hundert MB an Daten? Selbst bei vielen Daten pro Nutzer wohl nur ein paar GB.

    • Mag sein, aber wenn man Kundenanfragen mit aktuellen großen Sprachmodellen im Agenten-Ansatz bearbeitet, verbraucht man schnell viele Token.
      So wie ich die Präsentation verstanden habe, haben sie wohl Agenten mit begrenzter Verantwortung und vermutlich kleinere Modelle eingesetzt, damit die Antworten schnell und stabil bleiben und die Kosten nicht zu hoch werden.
    • Europäische verbraucherorientierte Unternehmen können nicht so leicht skalieren wie US-Unternehmen, und das ist ein großer Teil des Problems, das Europa generell beim Aufbau von Tech-Unternehmen hat.
      Andererseits können solche Geschäfte recht defensiv sein, führen aber meist nicht zu entsprechend hoher Profitabilität.