3 Punkte von GN⁺ 2025-07-18 | 1 Kommentare | Auf WhatsApp teilen
  • Mistral AI hat fünf neue Funktionen zu Le Chat hinzugefügt, um die Erkundung, den Ausdruck und die Organisation für Nutzer natürlicher und leistungsfähiger zu machen
  • Der Deep-Research-Modus bietet die Möglichkeit, komplexe Fragen schnell in strukturierte Rechercheberichte zu überführen
  • Der Sprachmodus ermöglicht mit dem neuen Sprachmodell Voxtral natürliche und schnelle Gespräche und kann auch ohne Tippen genutzt werden
  • Die mehrsprachige Schlussfolgerung auf Basis von Magistral erzeugt in verschiedenen Sprachen klare und tiefgehende Antworten und ermöglicht auch Sprachwechsel innerhalb eines Satzes
  • Die Projects-Funktion organisiert und speichert Gespräche, Dokumente und Ideen auf Projektebene und eignet sich damit auch für langfristige Arbeit

What’s new in Le Chat.

1. Deep Research mode

  • Eine Funktion, die komplexe Themen schnell im Format strukturierter Berichte recherchiert
  • Unterteilt die Frage des Nutzers in Teilaspekte, findet vertrauenswürdige Quellen und erstellt daraus einen geordneten Bericht
  • Es wird ein toolgestützter Deep-Research-Agent verwendet, doch die Nutzererfahrung bleibt einfach, transparent und vermittelt ein Gefühl der Zusammenarbeit

2. Voice mode

  • Mit einem neuen Sprachmodell namens Voxtral sind natürliche Sprachgespräche möglich
  • Geeignet für viele Situationen, etwa Brainstorming beim Spazierengehen, schnelle Antworten unterwegs oder die Transkription von Besprechungen
  • Geringe Latenz sorgt dafür, dass das System mit der Sprechgeschwindigkeit des Nutzers mithält

3. Natively multilingual reasoning

  • Auf Basis des Schlussfolgerungsmodells Magistral werden komplexe Fragen in verschiedenen Sprachen klar beantwortet
  • Vorteilhaft für mehrsprachige Nutzung, etwa beim Entwurf eines Vorschlags auf Spanisch oder bei der Erklärung juristischer Konzepte auf Japanisch
  • Sprachwechsel innerhalb eines Satzes (Code-Switching) ist ebenfalls möglich

4. Projects

  • Organisiert zusammengehörige Gespräche in Form kontextzentrierter Ordner
  • Jedes Projekt merkt sich seine eigene Bibliothek und den Zustand der Tool-Einstellungen
  • Durch Dokument-Uploads, das Laden von Bibliotheksinhalten und die Verknüpfung mit Gesprächen und Ideen bleibt eine konsistente Arbeitsumgebung erhalten
  • Nützlich für Umzugsplanung, die Konzeption von Produktfunktionen und das Management langfristiger Projekte

5. Advanced image editing

  • Anders als bei typischen Text-zu-Bild-Tools können auch erzeugte Bilder direkt bearbeitet werden
  • Beispiel: Mit Prompts wie „Objekt entfernen“ oder „in eine andere Stadt versetzen“ lassen sich Szenen anpassen
  • Personen, Objekte und Designelemente können konsistent beibehalten und als Serie bearbeitet werden

1 Kommentare

 
GN⁺ 2025-07-18
Hacker-News-Kommentare
  • Die Bildbearbeitungsfunktion scheint wirklich hervorragend zu sein; eigentlich ist genau das das Kernfeature, aber irgendwie wird das nicht richtig deutlich. OpenAI-Modelle verändern Bilder oft großflächig und beschädigen dabei selbst Details, die mit der Anfrage nichts zu tun haben, während dieses Modell irrelevante Bereiche perfekt erhält und nur die gewünschte Bearbeitung sehr gut umsetzt. Allerdings ist die Ausgabeauflösung etwas enttäuschend (das Eingabebild war deutlich größer, das Ergebnisbild ist 1184px). Ich habe ein Foto meines Homeoffice hochgeladen und darum gebeten, „die unten leicht eingerissenen grauen Paneele vollständig so zu restaurieren, als wären sie nagelneu“, und das Ergebnis war ziemlich hervorragend. Die Ausgabequalität ist minimal schlechter als das Original, aber ich erwarte, dass sich auch das bald verbessert

    • Eingabebild: https://i.imgur.com/t0WCKAu.jpeg

    • Ergebnisbild: https://i.imgur.com/xb99lmC.png

    • Ich glaube, dass diese Technik Craigslist stark schaden wird. Zum Beispiel fährt man hin, weil das Auto auf den Fotos völlig in Ordnung aussieht, und vor Ort stellt sich dann heraus, dass der Kotflügel eingedellt ist, die Motorhaube ein Loch hat und der Scheinwerfer kaputt ist.
      Es gab einen Fall, in dem ein Immobilienmakler Hausfotos mit AI komplett neu inszeniert hat, sodass ein heruntergekommenes Haus wie ein Neubau wirkte. Die Leute kamen zur Besichtigung und waren extrem verärgert. Der Makler behauptete, das sei einfach die nächste Stufe von Staging, aber in diesem Fall hat das überhaupt nicht funktioniert. Am Ende wurde das Objekt vom Markt genommen, und viele Leute kamen sogar vorbei, um es zu reparieren (wahrscheinlich Familienangehörige, aber sicher ist das nicht)

    • Nur als Hinweis: Die Links zum Eingabe- und zum Ergebnisbild sind identisch gepostet worden. Ich war anfangs verwirrt, als ich die Unterschiede im Foto finden wollte

    • Für bestimmte Aufgaben ist Kontext wahrscheinlich besser, und vermutlich nutzt Mistral genau das. Vor allem ist es schnell und günstig.
      OpenAI hat allerdings gestern ebenfalls eine neue Bildbearbeitungsfunktion mit höherer Auflösung hinzugefügt. Ich weiß noch nicht, ob das nur für die API gilt oder auch für die Chat-UI. Ergebnis mit demselben Prompt und demselben Eingabebild: https://i.imgur.com/w5Q0UQm.png

    • Neuigkeiten von OpenAI: https://x.com/OpenAIDevs/status/1945538534884135132

    • Sie verwenden Flux Kontext von Black Forest Labs, und das ist wirklich ein hervorragendes Modell

    • Im Bildergebnis sind die Buchtitel verunstaltet

  • Endlich wirkt es so, als wäre die EU aufgewacht. Darauf bin ich stolz. Sobald mein Vertrag mit OpenAI endet, plane ich direkt zu Mistral zu wechseln. Man sollte Europa unterstützen, Viva La France

    • Eigentlich warte ich nur auf Mistral Large 3. Es gab bereits Andeutungen, und es sieht so aus, als würde es bald als Standard-Sprachmodell im neuen Le Chat eingesetzt.
      Im Blogpost zu Mistral Medium 3 vom Mai stand unter „One more thing“ Folgendes:

    Im März Mistral Small, heute Medium, und bald kommt „large“. Das Medium-Modell ist bereits klar besser als andere führende Open-Source-Modelle wie Llama 4 Maverick, deshalb darf man auf den nächsten Schritt gespannt sein
    Mit dieser Version dürfte selbst der Abstand zu den besten großen Modellen nicht mehr besonders relevant sein. Die hohe Geschwindigkeit von Cerebras sorgt im Vergleich zu ChatGPT für eine wirklich starke User Experience

  • Ich leide unter MRF, also Model Release Fatigue. Große Modelle erscheinen so unglaublich häufig, dass ich im IDE ständig nur noch Modelle wechsle, und wenn ich etwas wieder öffne, das vorher gut funktioniert hat, sieht es jetzt plötzlich schlechter aus.
    Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral … wenn man dauernd hin- und herwechselt, wird einem irgendwann ganz schwindelig
    Es ist Erschöpfung durch den ständigen Wechsel von LLM-Modellen

    • Ich verstehe, dass du so empfindest, aber ich finde es wirklich gut, dass ständig so viele Optionen auftauchen. Das Innovationstempo ist großartig. Wenn man immer nur das beste Modell nutzen will, ist das sicher mühsam, aber immer noch viel besser als Stagnation oder Monopol

    • Genau deshalb probiere ich diese neuen Technologien fast gar nicht aus (auch wenn sie Spaß machen). Ich werde sie wahrscheinlich erst in der zweiten Hälfte von 2026 selbst nutzen. Bis dahin werden sich lokale Modelle und Hardware weiterentwickelt haben.
      Mein Respekt gilt denen, die diese experimentellen Versionen jetzt schon aushalten

    • Gerade dieser Wettbewerb ist doch etwas wirklich Gutes. Ich nutze immer nur Premium-Modelle und gebe trotzdem fast kein Geld aus. Es gibt ständig Aktionen oder Möglichkeiten, sie fast kostenlos zu nutzen

    • Man muss da gar nicht unbedingt mithalten. Es reicht völlig, ein Modell zu finden, das gut zu einem passt, und es dann konsequent zu nutzen

    • Dass ältere Versionen schlechter werden, liegt daran, dass Anbieter ihre Ressourcen auf neue Versionen konzentrieren. Dazu kommt der Einfluss des Training-Data-Cutoffs bei älteren Versionen (zum Beispiel claude sonnet 3.5→3.7).
      Ich persönlich nutze nur Claude/Anthropic. Es versteht mich besser. Es ist klug genug, sodass ich nur selten das allerneueste Modell brauche

  • Die Veröffentlichung von Voxtral fand ich deshalb interessant, weil damit wieder Bewegung in konkurrenzfähige Open-Source-Audio-Transkription (Transcription, Sprache→Text) gekommen ist. Ob dafür wirklich ein LLM-Backbone nötig war, ist fraglich, aber der Ansatz ist auf jeden Fall interessant

    • Tatsächlich gibt es viel mehr starke Open-Source-Spracherkennungsmodelle (STT).
      Die Pressemitteilung von Mistral vermittelt den Eindruck, als sei es das Beste seit Whisper, aber die tatsächlich verglichenen Modelle gehören nicht zur Spitzengruppe.
      Offener Benchmark: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
      Zur Einordnung: Das von Mistral verglichene Scribe liegt auf Platz 10.
      Es ist zwar ein englischer Benchmark, aber dort gibt es auch viele mehrsprachige Modelle, also lohnt sich ein Blick (z. B. https://huggingface.co/nvidia/canary-1b-flash)
  • Inzwischen interessieren mich offene Datenmodelle, die auch ethisch überprüfbar sind, deutlich mehr als Open Code oder Open Weights.
    Ich würde zum Beispiel gern ein Modell nutzen, das mir sagen kann, ob eine von mir benannte Ressource in den Trainingsdaten enthalten war oder nicht

  • Ich kann mich des Eindrucks nicht erwehren, dass die AI-Branche derzeit einfach nur die Dienste von OpenAI kopiert.
    Die Services anderer Unternehmen sind im Grunde dieselben, nur mit einer anderen Struktur.
    Auch die eigentliche Innovation ist in Wirklichkeit gar nicht so groß

    • Wenn man sie tatsächlich benutzt, sind sie überhaupt nicht gleich. Bei Alltagsaufgaben wie Coding sind die Unterschiede zwischen den Modellen sehr groß

    • Es fühlt sich inzwischen so an, als würde die ganze Welt neue Dienste auf Basis einer Funktion f(input: string): string aufbauen. Da ist es fast unvermeidlich, dass sich vieles ähnelt

    • OpenAI hat die Deep-Research-Funktion ebenfalls von Google übernommen. Sie haben denselben Namen verwendet, und bei Mistral ist es genauso

    • Das ist eher ein Zeichen für gesunden Wettbewerb im Markt. Beispiele wie Apple, die über Jahrzehnte Innovation geliefert haben, sind ein Produkt monopolistischer Gatekeeping-Strukturen

    • Am Ende wird fast überall dieselbe Technologie eingesetzt. Der Unterschied liegt im Wesentlichen nur in Trainingsdaten und Rechenleistung

  • Ich nutze ChatGPT sehr viel. Ich würde Le Chat auch gern einmal ausprobieren und frage mich, ob es einen großen Unterschied gibt oder ob es sich fast gleich anfühlt

  • Falls du die Deep-Research-Funktion von OpenAI noch nicht ausprobiert hast, kann ich sie nur empfehlen. Einen wirklich brauchbaren Ersatz habe ich bisher nicht gefunden. Ich habe auch die von Google ausprobiert, war aber nicht besonders beeindruckt.
    Für Ingenieure kann sie bei der Untersuchung von Trade-offs enorm viel Zeit sparen

    • Die Research-Funktion von Anthropic ist ebenfalls ziemlich gut. Meiner Meinung nach auf OpenAI-Niveau.
      Bei Google ist die Bezahlversion etwas präziser, aber die Ergebnisberichte sind viel zu langatmig und dadurch mühsam zu lesen. Es wirkt wie eine Uni-Hausarbeit, in der jemand nur die Wortzahl erfüllen will

    • Mir hat das besonders bei Marktrecherche sehr geholfen (im Startup-Kontext). Es fühlt sich an, als hätte man einen klugen Junior-Planer-/PM-Assistenten eingestellt

    • Ich würde auch empfehlen, die Research-Funktion von Kimi 2 auszuprobieren. Ich war überrascht, wie gut die Ergebnisse waren

    • Die Ergebnisse von OpenAI und Gemini fallen ziemlich unterschiedlich aus. Man kann nicht sagen, dass eines davon besser ist; sie sind einfach deutlich verschieden

    • Perplexities ist auch nicht schlecht. Allerdings habe ich kein bezahltes OpenAI-Abo, daher kann ich keinen direkten Vergleich anstellen

  • Die Prompt-Beispiele sind nicht besonders gut. Zum Beispiel ist bei Antworten zur persönlichen Planung eine direkte Antwort ohne Deep Research sogar deutlich besser (nur der Visa-Teil wird ordentlich beantwortet)

  • Ich frage mich, ob Voxtral vielleicht im Futo-Android-Keyboard eingesetzt werden könnte