16 Punkte von xguru 2023-12-07 | 7 Kommentare | Auf WhatsApp teilen
  • Gemini ist das erste KI-Modell, das im MMLU 90 % erreicht und damit menschliche Expert:innen übertrifft
  • Als multimodales KI-Modell übertrifft es in multimodalen Benchmarks für Bild/Video/Audio auch GPT-4V und Whisper
  • Optimiert in drei Modellvarianten je nach Größe
    • Ultra: das größte und leistungsfähigste Modell für komplexe Aufgaben
    • Pro: skalierbar für ein breites Spektrum an Aufgaben
    • Nano: das effizienteste Modell für On-Device-Aufgaben
  • Versteht, erklärt und erzeugt hochwertigen Code in den weltweit am häufigsten verwendeten Programmiersprachen wie Python, Java, C++, Go usw.
  • Ebenfalls vorgestellt wurde AlphaCode 2 für Competitive Programming auf Basis von Gemini
  • Gemini 1.0 wurde in großem Maßstab auf einer für KI optimierten Infrastruktur mit TPU v4 und v5e trainiert
    • stabiler, besser skalierbar und effizienter
  • Starker Fokus auf Responsibility und Safety
    • umfassende Sicherheitsbewertungen durchgeführt
  • Gemini Pro ist direkt in Google Bard verfügbar
    • in 170 Ländern auf Englisch verfügbar; Unterstützung für weitere Modalitäten und neue Sprachen folgt in Kürze
  • Gemini Nano wird auf das Pixel 8 Pro kommen
  • In den kommenden Monaten soll Gemini auch in Suche, Werbung, Chrome und Duet AI integriert werden
  • Ab dem 13. Dezember können Entwickler:innen und Unternehmenskunden die Gemini API über Google AI Studio und Google Cloud Vertex AI nutzen (nur Pro)
  • Gemini Ultra wird ebenfalls bald verfügbar sein
    • derzeit werden umfassende Vertrauens- und Sicherheitsprüfungen abgeschlossen, darunter Red-Team-Tests durch vertrauenswürdige externe Organisationen; vor einer breiteren Veröffentlichung wird das Modell durch Fine-Tuning und Reinforcement Learning from Human Feedback (RLHF) weiter verfeinert
    • Gemini Ultra wird zunächst einigen Kund:innen, Entwickler:innen, Partnern sowie Fachleuten für Sicherheit und Verantwortung für erste Tests und Feedback bereitgestellt und Anfang nächsten Jahres für Entwickler:innen und Unternehmenskunden veröffentlicht
    • Anfang nächsten Jahres soll mit Gemini Ultra auch Bard Advanced starten, eine neue hochmoderne KI-Umgebung mit Zugriff auf die besten Modelle und Funktionen

7 Kommentare

 
wedding 2023-12-09

Als ich das Video gesehen habe, dachte ich: „Bard ist doch schon ziemlich enttäuschend – und das soll das jetzt schon alles übertroffen haben?“

Anscheinend war das Video inszeniert. Ist das dann nicht Betrug..?
https://www.tomshardware.com/news/google-gemini-ai-video-staged

 
botplaysdice 2023-12-08

Ich erinnere mich an so einen Tweet: „Manche denken, Google liege bei KI zurück, aber sie sind auf ihrem ganz eigenen another level.“

Heute ist die Google-Aktie stark gestiegen.

 
ganadist 2023-12-07

nano soll auf dem Pixel 8 Pro verfügbar sein ... aber
https://blog.google/products/pixel/pixel-feature-drop-december-2023/

Im Geltungsbereich gibt es eigentlich nur den Voice Recorder ohne Unterstützung für Koreanisch und gboard, für das man sich in der Beta zusätzlich separat per Opt-in anmelden muss.

 
xguru 2023-12-07

Ist das nicht vielleicht der Grund, warum sie das Pixel in Korea nicht verkaufen..? Haha
Ich habe mein Pixel 1 übrigens immer noch ;_;

 
ragingwind 2023-12-07

Endlich ist es da. Ich bin gespannt, wie es aussehen wird, wenn es umfassend in Google-Produkten eingesetzt wird.

 
xguru 2023-12-07

Das interessanteste Video ist Hands-on with Gemini: Interacting with multimodal AI.
Es dauert etwa 6 Minuten, also schaut es euch unbedingt einmal an. Wenn sich multimodale AI weiterentwickelt, wird wohl Jarvis, wie wir ihn aus Filmen kennen, Wirklichkeit werden.

 
kuroneko 2023-12-07

Schon GPT-4 Vision war beeindruckend, aber es wirkt wirklich so, als würde das Zeitalter von Jarvis kommen ... +_+