- Google hat neue Preview-Versionen von Gemini 2.5 Flash und 2.5 Flash-Lite vorgestellt; im Fokus stehen bessere Qualität und höhere Effizienz
- Flash-Lite ist mit besserem Verständnis von Anweisungen, weniger weitschweifigen Antworten sowie verbesserter Multimodalität und Übersetzungsleistung optimal für schnelle und kostengünstige Umgebungen geeignet
- Flash bietet stärkere Tool-Nutzung und bessere Token-Effizienz, wodurch die Leistung bei komplexen agentischen Aufgaben deutlich steigt
- In realen Tests stieg der SWE-Bench-Verified-Wert um 5 %, in internen Benchmarks verbesserte sich die Leistung bei langfristigen Aufgaben um 15 %
- Beide Modelle unterstützen den Alias
-latest, sodass sich die neuesten Funktionen ohne Codeänderungen nutzen lassen; wer Stabilität bevorzugt, kann weiterhin die bestehenden 2.5-Modelle verwenden
Überblick über Gemini 2.5 Flash und Flash-Lite
- Die neuesten Versionen von Gemini 2.5 Flash und Flash-Lite wurden in Google AI Studio und Vertex AI veröffentlicht. Ziel dieses Releases ist es, kontinuierlich bessere Modellqualität und höhere Effizienz bereitzustellen
- Das neue Flash-Lite und Flash zeigen gegenüber den bisherigen Modellen insgesamt deutlich verbesserte Leistung bei Qualität, Geschwindigkeit und Kosten
- Bei Flash-Lite werden 50 % der Ausgabetokens eingespart, bei Flash 24 %, was niedrigere Betriebskosten und schnellere Verarbeitung ermöglicht
Aktualisiertes Gemini 2.5 Flash-Lite
- Verbesserte Befolgung von Anweisungen: Das Verständnis und die Ausführung komplexer Anweisungen oder System-Prompts wurden deutlich verbessert
- Mehr Knappheit: Kürzere und leichter verständliche Antworten senken die Token-Kosten und reduzieren die Latenz in Umgebungen mit hohem Traffic
- Stärkere Multimodalität und bessere Übersetzungsqualität: Die Zuverlässigkeit bei Audiotranskription, Bilderkennung und Übersetzungen wurde insgesamt erhöht
- Die Preview-Version von Flash-Lite kann direkt unter dem Modellnamen
gemini-2.5-flash-lite-preview-09-2025 getestet werden
Aktualisiertes Gemini 2.5 Flash
- Stärkere Tool-Nutzung: Die agentische Einsetzbarkeit in komplexen Multi-Step-Szenarien wurde deutlich verbessert; auf SWE-Bench Verified wurde gegenüber der vorherigen Version ein um 5 Prozentpunkte höherer Wert erreicht (48,9 % → 54 %)
- Verbesserte Kosteneffizienz: Höhere Ausgabequalität bei geringerem Token-Verbrauch, mit positiven Effekten auf Latenz und Infrastrukturkosten
- Auch das Feedback von Primer-Nutzern fällt positiv aus
- Yichao „Peak“ Ji, Mitgründer und Chief Scientist von Manus, sagte: „Das neue Gemini-2.5-Flash-Modell vereint beeindruckende Geschwindigkeit und Intelligenz. Bei agentischen Aufgaben mit langfristigen Zielen hat sich die Leistung um 15 % verbessert, wodurch sich dank hoher Kosteneffizienz noch besser skalieren lässt.“
- Die Preview-Version von Gemini 2.5 Flash ist unter dem Modellnamen
gemini-2.5-flash-preview-09-2025 verfügbar
Mit Gemini loslegen
- Durch die Veröffentlichung von Preview-Modellen im vergangenen Jahr konnten Entwickler neue Funktionen früh ausprobieren und Feedback geben
- Die heute vorgestellten Preview-Versionen werden nicht offiziell in neue stabile Versionen überführt, sondern dienen als Grundlage zur Qualitätssteigerung kommender regulärer Releases
- Anstelle langer Modellnamen wurde der Alias
-latest hinzugefügt, damit sich immer problemlos das neueste Modell verwenden lässt. Dieser Alias verweist automatisch auf die aktuellste Version und ermöglicht es, neue Funktionen ohne Codeänderungen zu testen
gemini-flash-latest
gemini-flash-lite-latest
- Falls eine bestimmte Version aktualisiert oder eingestellt wird, erfolgt mindestens zwei Wochen vorher eine Benachrichtigung per E-Mail. Der Alias ist lediglich eine Referenz; Preise, Funktionen und Limits können sich je nach Release unterscheiden
- Wenn langfristige Stabilität erforderlich ist, wird die weitere Nutzung der bestehenden Modellnamen
gemini-2.5-flash und gemini-2.5-flash-lite empfohlen
Bedeutung
- Dieses Release ist kein Aufstieg in eine offiziell stabile Version, sondern ein Preview-Update, das Experimente und Nutzerfeedback für künftige stabile Modelle ermöglichen soll
- Google verfolgt mit Gemini weiterhin ein Gleichgewicht aus Geschwindigkeit, Intelligenz und Kosteneffizienz und verbessert das System fortlaufend, damit Entwickler bessere KI-Anwendungen bauen können
Noch keine Kommentare.