Verbessertes Gemini 2.5 Flash und Flash-Lite vorgestellt
(developers.googleblog.com)- Google hat neue Preview-Versionen von Gemini 2.5 Flash und 2.5 Flash-Lite vorgestellt; im Fokus stehen bessere Qualität und höhere Effizienz
- Flash-Lite ist mit besserem Verständnis von Anweisungen, weniger weitschweifigen Antworten sowie verbesserter Multimodalität und Übersetzungsleistung optimal für schnelle und kostengünstige Umgebungen geeignet
- Flash bietet stärkere Tool-Nutzung und bessere Token-Effizienz, wodurch die Leistung bei komplexen agentischen Aufgaben deutlich steigt
- In realen Tests stieg der SWE-Bench-Verified-Wert um 5 %, in internen Benchmarks verbesserte sich die Leistung bei langfristigen Aufgaben um 15 %
- Beide Modelle unterstützen den Alias
-latest, sodass sich die neuesten Funktionen ohne Codeänderungen nutzen lassen; wer Stabilität bevorzugt, kann weiterhin die bestehenden2.5-Modelle verwenden
Überblick über Gemini 2.5 Flash und Flash-Lite
- Die neuesten Versionen von Gemini 2.5 Flash und Flash-Lite wurden in Google AI Studio und Vertex AI veröffentlicht. Ziel dieses Releases ist es, kontinuierlich bessere Modellqualität und höhere Effizienz bereitzustellen
- Das neue Flash-Lite und Flash zeigen gegenüber den bisherigen Modellen insgesamt deutlich verbesserte Leistung bei Qualität, Geschwindigkeit und Kosten
- Bei Flash-Lite werden 50 % der Ausgabetokens eingespart, bei Flash 24 %, was niedrigere Betriebskosten und schnellere Verarbeitung ermöglicht
Aktualisiertes Gemini 2.5 Flash-Lite
- Verbesserte Befolgung von Anweisungen: Das Verständnis und die Ausführung komplexer Anweisungen oder System-Prompts wurden deutlich verbessert
- Mehr Knappheit: Kürzere und leichter verständliche Antworten senken die Token-Kosten und reduzieren die Latenz in Umgebungen mit hohem Traffic
- Stärkere Multimodalität und bessere Übersetzungsqualität: Die Zuverlässigkeit bei Audiotranskription, Bilderkennung und Übersetzungen wurde insgesamt erhöht
- Die Preview-Version von Flash-Lite kann direkt unter dem Modellnamen
gemini-2.5-flash-lite-preview-09-2025getestet werden
Aktualisiertes Gemini 2.5 Flash
- Stärkere Tool-Nutzung: Die agentische Einsetzbarkeit in komplexen Multi-Step-Szenarien wurde deutlich verbessert; auf SWE-Bench Verified wurde gegenüber der vorherigen Version ein um 5 Prozentpunkte höherer Wert erreicht (48,9 % → 54 %)
- Verbesserte Kosteneffizienz: Höhere Ausgabequalität bei geringerem Token-Verbrauch, mit positiven Effekten auf Latenz und Infrastrukturkosten
- Auch das Feedback von Primer-Nutzern fällt positiv aus
- Yichao „Peak“ Ji, Mitgründer und Chief Scientist von Manus, sagte: „Das neue Gemini-2.5-Flash-Modell vereint beeindruckende Geschwindigkeit und Intelligenz. Bei agentischen Aufgaben mit langfristigen Zielen hat sich die Leistung um 15 % verbessert, wodurch sich dank hoher Kosteneffizienz noch besser skalieren lässt.“
- Die Preview-Version von Gemini 2.5 Flash ist unter dem Modellnamen
gemini-2.5-flash-preview-09-2025verfügbar
Mit Gemini loslegen
- Durch die Veröffentlichung von Preview-Modellen im vergangenen Jahr konnten Entwickler neue Funktionen früh ausprobieren und Feedback geben
- Die heute vorgestellten Preview-Versionen werden nicht offiziell in neue stabile Versionen überführt, sondern dienen als Grundlage zur Qualitätssteigerung kommender regulärer Releases
- Anstelle langer Modellnamen wurde der Alias
-latesthinzugefügt, damit sich immer problemlos das neueste Modell verwenden lässt. Dieser Alias verweist automatisch auf die aktuellste Version und ermöglicht es, neue Funktionen ohne Codeänderungen zu testengemini-flash-latestgemini-flash-lite-latest
- Falls eine bestimmte Version aktualisiert oder eingestellt wird, erfolgt mindestens zwei Wochen vorher eine Benachrichtigung per E-Mail. Der Alias ist lediglich eine Referenz; Preise, Funktionen und Limits können sich je nach Release unterscheiden
- Wenn langfristige Stabilität erforderlich ist, wird die weitere Nutzung der bestehenden Modellnamen
gemini-2.5-flashundgemini-2.5-flash-liteempfohlen
Bedeutung
- Dieses Release ist kein Aufstieg in eine offiziell stabile Version, sondern ein Preview-Update, das Experimente und Nutzerfeedback für künftige stabile Modelle ermöglichen soll
- Google verfolgt mit Gemini weiterhin ein Gleichgewicht aus Geschwindigkeit, Intelligenz und Kosteneffizienz und verbessert das System fortlaufend, damit Entwickler bessere KI-Anwendungen bauen können
1 Kommentare
Hacker-News-Kommentare
application/jsonanfordert, kann das Tool nicht genutzt werden, und wenn man beides will, muss man entweder hoffen, dass das JSON trotzdem korrekt herauskommt, was oft scheitert, oder im ersten Request das Tool verwenden und im zweiten Request formatieren. Umständlich, aber als Workaround immerhin recht simpelllm-gemini-Plugin ergänzt. Es lässt sich peruvxohne separate Installation ausführen. Beispiel:Die Release Notes gibt es hier. Zur Pelikan-Diskussion siehe diesen Beitrag
gemini-2.5-flash-lite-preview-09-2025undgemini-2.5-flash-preview-09-2025