Google stellt das KI-Modell Gemini vor
(blog.google)- Gemini ist das erste KI-Modell, das im MMLU 90 % erreicht und damit menschliche Expert:innen übertrifft
- Als multimodales KI-Modell übertrifft es in multimodalen Benchmarks für Bild/Video/Audio auch GPT-4V und Whisper
- Optimiert in drei Modellvarianten je nach Größe
- Ultra: das größte und leistungsfähigste Modell für komplexe Aufgaben
- Pro: skalierbar für ein breites Spektrum an Aufgaben
- Nano: das effizienteste Modell für On-Device-Aufgaben
- Versteht, erklärt und erzeugt hochwertigen Code in den weltweit am häufigsten verwendeten Programmiersprachen wie Python, Java, C++, Go usw.
- Ebenfalls vorgestellt wurde AlphaCode 2 für Competitive Programming auf Basis von Gemini
- Gemini 1.0 wurde in großem Maßstab auf einer für KI optimierten Infrastruktur mit TPU v4 und v5e trainiert
- stabiler, besser skalierbar und effizienter
- Starker Fokus auf Responsibility und Safety
- umfassende Sicherheitsbewertungen durchgeführt
- Gemini Pro ist direkt in Google Bard verfügbar
- in 170 Ländern auf Englisch verfügbar; Unterstützung für weitere Modalitäten und neue Sprachen folgt in Kürze
- Gemini Nano wird auf das Pixel 8 Pro kommen
- In den kommenden Monaten soll Gemini auch in Suche, Werbung, Chrome und Duet AI integriert werden
- Ab dem 13. Dezember können Entwickler:innen und Unternehmenskunden die Gemini API über Google AI Studio und Google Cloud Vertex AI nutzen (nur Pro)
- Gemini Ultra wird ebenfalls bald verfügbar sein
- derzeit werden umfassende Vertrauens- und Sicherheitsprüfungen abgeschlossen, darunter Red-Team-Tests durch vertrauenswürdige externe Organisationen; vor einer breiteren Veröffentlichung wird das Modell durch Fine-Tuning und Reinforcement Learning from Human Feedback (RLHF) weiter verfeinert
- Gemini Ultra wird zunächst einigen Kund:innen, Entwickler:innen, Partnern sowie Fachleuten für Sicherheit und Verantwortung für erste Tests und Feedback bereitgestellt und Anfang nächsten Jahres für Entwickler:innen und Unternehmenskunden veröffentlicht
- Anfang nächsten Jahres soll mit Gemini Ultra auch Bard Advanced starten, eine neue hochmoderne KI-Umgebung mit Zugriff auf die besten Modelle und Funktionen
7 Kommentare
Als ich das Video gesehen habe, dachte ich: „Bard ist doch schon ziemlich enttäuschend – und das soll das jetzt schon alles übertroffen haben?“
Anscheinend war das Video inszeniert. Ist das dann nicht Betrug..?
https://www.tomshardware.com/news/google-gemini-ai-video-staged
Ich erinnere mich an so einen Tweet: „Manche denken, Google liege bei KI zurück, aber sie sind auf ihrem ganz eigenen another level.“
Heute ist die Google-Aktie stark gestiegen.
nano soll auf dem Pixel 8 Pro verfügbar sein ... aber
https://blog.google/products/pixel/pixel-feature-drop-december-2023/
Im Geltungsbereich gibt es eigentlich nur den Voice Recorder ohne Unterstützung für Koreanisch und
gboard, für das man sich in der Beta zusätzlich separat per Opt-in anmelden muss.Ist das nicht vielleicht der Grund, warum sie das Pixel in Korea nicht verkaufen..? Haha
Ich habe mein Pixel 1 übrigens immer noch ;_;
Endlich ist es da. Ich bin gespannt, wie es aussehen wird, wenn es umfassend in Google-Produkten eingesetzt wird.
Das interessanteste Video ist Hands-on with Gemini: Interacting with multimodal AI.
Es dauert etwa 6 Minuten, also schaut es euch unbedingt einmal an. Wenn sich multimodale AI weiterentwickelt, wird wohl Jarvis, wie wir ihn aus Filmen kennen, Wirklichkeit werden.
Schon GPT-4 Vision war beeindruckend, aber es wirkt wirklich so, als würde das Zeitalter von Jarvis kommen ... +_+