Gemini 2.5 Deep Think jetzt in der Gemini-App verfügbar
(blog.google)- Gemini 2.5 Deep Think ist als Funktion für nur Google AI Ultra-Abonnenten in der Gemini-App eingeführt worden
- Mit neuen Parallel-Denktechniken (parallel thinking) und aktuellen Forschungsergebnissen wurde, auf Basis eines IMO-Goldmedaillen-Modells, die Eignung für den praktischen Einsatz weiter verbessert
- Zeigt hervorragende Leistungen bei unterschiedlichen anspruchsvollen Aufgaben wie kreativer Problemlösung, mathematischem und wissenschaftlichem Schlussfolgern sowie der Entwicklung von Algorithmen
- Um die Leistung zu steigern, wird die Denkzeit (Thinking Time) verlängert, sodass verschiedene Ideen und Lösungsansätze gleichzeitig erkundet werden, was tiefere Überlegungen und kreativere Ergebnisse ermöglicht
- Zur Sicherheit und verantwortungsvollen KI-Entwicklung wurden die Evaluierung und Gegenmaßnahmen verstärkt, und der weitere Ausbau für API- und Enterprise-Nutzung wurde angekündigt
Veröffentlichung von Gemini 2.5 Deep Think
- Die Funktion Gemini 2.5 Deep Think wird Google AI Ultra-Abonnenten über die Gemini-App bereitgestellt
- Es handelt sich um eine Version, die Feedback von vertrauenswürdigen Testern und Forschenden sowie aktuelle Forschungsergebnisse einbezieht
- Basierend auf einem Modell auf Goldmedaillen-Niveau beim jüngsten International Mathematical Olympiad (IMO) wurden Geschwindigkeit und Praxistauglichkeit für reale Nutzererfahrungen verbessert
- Mit dieser Veröffentlichung wird die Eignung als Werkzeug für kreative Problemlösung erweitert, mit dem Ziel, die Funktionen auf Basis von Rückmeldungen von Mathematikerinnen, Mathematikern und Forschenden weiter zu optimieren
Funktionsweise von Deep Think
- Durch den Einsatz von parallelem Denken kann Gemini komplexe Probleme analysieren, indem es zugleich verschiedene Ideen und Lösungsansätze exploriert, vergleicht und kombiniert
- Die Denkzeit (Thinking Time) des Modells wurde verlängert, damit mehrere Hypothesen vertieft untersucht und kreativere Lösungswege gefunden werden
- Durch Reinforcement Learning wurde gelernt, diese erweiterten Schlussfolgenpfade aktiv zu nutzen und die intuitive sowie tiefere Problemlösung deutlich zu verbessern
Hauptleistungen und Einsatzgebiete von Deep Think
- Inkrementelle Entwicklung und Design: Erreicht hohe Leistung bei der schrittweisen Weiterentwicklung komplexer Systeme oder Designs
- Wissenschaftliche und mathematische Entdeckung: Besonders stark bei anspruchsvollen kreativen Fragestellungen wie mathematischem Schlussfolgern oder der Interpretation wissenschaftlicher Arbeiten
- Algorithmus- und Codeentwicklung: Liefert führende Ergebnisse bei schwierigen Programmierproblemen, bei denen Strukturierung, Zeitkomplexität und Trade-offs berücksichtigt werden müssen
- Auf aktuellen Benchmarks (z. B. LiveCodeBench V6, Humanity’s Last Exam) belegt es erstklassige Leistungen in Code-, Wissens- und Schlussfolgerungsaufgaben im Vergleich zu früheren Modellen
Verantwortungsvolle Entwicklung und Sicherheit von Gemini
- Gemini 2.5 Deep Think zeigt in Sicherheitsbewertungen bessere Inhaltsicherheit und einen objektiveren Ton als frühere Pro-Modelle
- Mit steigender Komplexität wird das Risiko ebenfalls bewertet; die Frontier-Safety-Bewertung und notwendige Gegenmaßnahmen wurden verstärkt
- Detaillierte Sicherheitsresultate sind in der Model Card einsehbar
So nutzen Sie Deep Think
- Google AI Ultra-Abonnenten können im Modell-Dropdown der Gemini-App nach Auswahl von 2.5 Pro den Deep Think-Schalter in der Prompt-Bar aktivieren und das Feature bis zu einer vorgegebenen Anzahl pro Tag nutzen
- Codeausführung, Google Search und andere Tools sind automatisch integriert, wodurch deutlich längere Antworten entstehen
- Künftig sind weitere Tests für Gemini API und Enterprise geplant
1 Kommentare
Hacker-News-Kommentare
Ich habe den neuen Deep-Think-Agenten getestet, aber nach nur fünf Prompts sofort das tägliche Nutzungslimit erreicht. Für einen Service in dieser Qualität bei $250 im Monat ist das schon enttäuschend. Gegenüber o3-pro oder Grok 4 Heavy ist die Preisleistung deutlich schlechter. In der AI-Community galt diese Funktion als der einzige Teil, der den Preis von Google Ultra halbwegs rechtfertigen könnte. Umso unverständlicher ist es, dass Google im AI Studio sein bestes Modell kostenlos anbietet, zahlende Ultra-Abonnenten aber mit so einer Abrechnungspolitik abspeist. Was die Leistung angeht: Bei einem schwierigen geschäftlichen Problem bekam ich eine klare und überzeugende Lösung, die mit dem Ergebnis unseres internen Meetings übereinstimmte. Am Ende kam o3 aber für deutlich weniger Geld zu einem sehr ähnlichen Schluss. Der Bericht von o3 wirkte nur etwas weniger sauber strukturiert. Ich muss es wohl noch weiter testen
Leute, ich habe Gemini Deep Think mit „Erstelle ein SVG-Bild eines Pelikans auf einem Fahrrad“ gefüttert, und das kam dabei heraus: https://www.svgviewer.dev/s/5R5iTexQ Simon Willison war ich damit zuvor!
Wer es selbst ausprobieren will, kann die LLM-CLI von simonw und das Plugin llm-consortium verwendenVorteil 1: Man kann beliebige Modelle frei kombinieren. Die Zusammenstellung lässt sich unabhängig vom jeweiligen Labor nach Wunsch konfigurierenVorteil 2: Mit dem Plugin llm-model-gateway lässt sich alles auf einmal über eine lokale API mit der eigenen App oder einem Coding-Kollaborationstool verbinden https://x.com/karpathy/status/1870692546969735361
Installations- und Beispielbefehle sowie sogar ein Beispiel dafür, dass man auch ein consortium of consortium machen kann, wurden direkt mitgeliefert.
https://GitHub.com/irthomasthomas/llm-consortium
llm servenicht zu sehen istEs ist nicht dasselbe Modell, das vor einigen Wochen bei der IMO eine Goldmedaille geholt hat, aber ein sehr naher Verwandter https://x.com/OfficialLoganK/status/1951262261512659430Es ist noch nicht per API verfügbar
Dieser Ansatz ähnelt Grok 4 Heavy: Mehrere „Reasoning“-Agenten laufen parallel, vergleichen anschließend ihre Antworten miteinander und wählen die beste aus; das dauert ungefähr 30 Minuten. Die Resultate sind hervorragend, aber für einen fairen Benchmark-Vergleich sollte man es eigentlich eher mit Grok 4 Heavy als mit Grok 4 vergleichen, da Letzteres ein schnelleres Single-Agent-Modell ist
OpenAI ist auf $200 gegangen, Anthropic auf $100 bzw. $200, Gemini auf $250 und Grok sogar auf $300. Nur OpenAI spricht von „praktisch unbegrenzt“, und im ChatGPT-Pro-Plan habe ich das Limit tatsächlich noch nie erreicht. Bei Claude Max bin ich dagegen mehrfach an Grenzen gestoßen. Ich frage mich, warum diese Unternehmen ihre Limits nicht klar offenlegen
In den letzten Monaten habe ich Gemini genutzt und das Gefühl, dass es eher immer schlechter wird. Halluzinationen kommen viel zu häufig vor, und selbst wenn man darauf hinweist, beharrt die AI darauf. Das macht es schwer, ihr zu vertrauen
Google-AI-Ultra-Abonnenten können ab heute Deep Think in der Gemini-App nutzen, mit einer festen Anzahl an Prompts. Mich würde aber genauer interessieren, ob „fester Satz“ eine feste Anzahl meint oder ob bestimmte Prompt-Typen vorgegeben sind
Wenn ich mit Gemini CLI Zeitpläne erstelle, versucht es oft trotzdem eigenmächtig Änderungen vorzunehmen und bringt den Plan durcheinander, selbst wenn ich mehrfach klar eingreife und sage, dass es keine spontanen Aktionen machen soll