- Googles Project Genie ist ein experimenteller Forschungsprototyp, mit dem Nutzer mithilfe von Text und Bildern interaktive virtuelle Welten erzeugen, erkunden und remixen können
- Es basiert auf dem Modell Genie 3 und erzeugt in Echtzeit Wege und Umgebungen entsprechend den Bewegungen der Nutzer
- Es wird als Web-App angeboten; die Modelle Nano Banana Pro und Gemini sind integriert und unterstützen Funktionen zum Skizzieren, Erkunden und Remixen von Welten
- Aufgrund der Grenzen des Modells hat die frühe Version Einschränkungen wie Unstimmigkeiten mit physikalischen Gesetzen, Verzögerungen bei der Charaktersteuerung und ein 60-Sekunden-Limit
- Derzeit ist es für Google AI Ultra-Abonnenten in den USA (ab 18 Jahren) verfügbar; eine Ausweitung auf weitere Regionen ist geplant
Überblick über Project Genie
- Project Genie ist ein experimenteller Forschungsprototyp von Google DeepMind auf Basis von Genie 3, der Nutzern eine Umgebung bietet, in der sie virtuelle Welten erstellen, erkunden und remixen können
- Verfügbar für Google AI Ultra-Abonnenten in den USA (ab 18 Jahren)
- Nutzer können über Text-Prompts und Bilder Welten erzeugen und sie in Echtzeit erkunden
- Das Projekt ist ein erster Schritt, immersive Technologien zur Welterzeugung für allgemeine Nutzer zugänglich zu machen, und eine Erweiterung der Forschung zu World Models
Fortschritte bei World Models
- World Models sind Systeme, die dynamische Veränderungen in Umgebungen simulieren und die Auswirkungen von Handlungen vorhersagen
- Google DeepMind will über die Forschung an Agenten für spezifische Umgebungen wie Schach oder Go hinausgehen und AGI-Systeme entwickeln, die die Vielfalt der realen Welt erkunden können
- Genie 3 erzeugt in Echtzeit Wege entsprechend der Bewegung der Nutzer und simuliert physische Interaktionen
- Es unterstützt die dynamische Erzeugung von Welten statt statischer 3D-Schnappschüsse
- Es kann in verschiedensten Szenarien eingesetzt werden, etwa in Robotik, Animation, Fiktion oder bei der Erkundung historischer Orte
So funktioniert Project Genie
- Es handelt sich um einen webbasierten Prototyp, in den neben Genie 3 auch die Modelle Nano Banana Pro und Gemini integriert sind
- Es besteht aus drei Kernfunktionen
-
1. World Sketching (Weltskizze)
- Mit Text und Bildern (generiert oder hochgeladen) lassen sich lebendige Umgebungen entwerfen
- Charaktere und Erkundungsweise können definiert werden; unterstützt werden verschiedene Fortbewegungsarten wie Gehen, Fliegen und Fahren
- Durch die Integration von Nano Banana Pro sind Vorschauen und Feinanpassungen der Welt möglich
- Es kann zwischen Ego- und Third-Person-Perspektive gewählt werden
-
2. World Exploration (Welterkundung)
- Die erzeugten Welten sind erkundbare Umgebungen, in denen entsprechend dem Verhalten der Nutzer in Echtzeit Wege erzeugt werden
- Während der Erkundung kann die Kameraperspektive angepasst werden
-
3. World Remixing (Welt-Remix)
- Auf Basis der Prompts bestehender Welten lassen sich neu interpretierte Welten rekonstruieren
- Über eine Galerie oder Zufallserkundung können Welten anderer Nutzer erkundet oder verändert werden
- Fertige Welten und der Erkundungsprozess können als Video heruntergeladen werden
Verantwortungsvolle KI-Entwicklung
- Project Genie ist ein experimenteller Forschungsprototyp innerhalb von Google Labs und wird nach den Prinzipien verantwortungsvoller KI-Entwicklung betrieben
- Aufgrund der aktuellen Grenzen des Modells werden folgende Einschränkungen genannt
- Die erzeugten Welten können von der Realität abweichen oder nicht mit Prompts bzw. physikalischen Gesetzen übereinstimmen
- Es kann zu Verzögerungen bei der Charaktersteuerung oder verminderter Reaktionsfähigkeit kommen
- Es gibt ein 60-Sekunden-Limit für die Generierung
- Die im August 2025 angekündigte promptbasierte Ereignisänderungsfunktion ist noch nicht enthalten
- Künftige Updates und Verbesserungen sollen auf der offiziellen DeepMind-Seite einsehbar sein
Zukunftspläne und Ausbau der Zugänglichkeit
- Project Genie wurde auf Basis von gemeinsamer Forschung mit vertrauenswürdigen Testern entwickelt
- Diese Veröffentlichung ist ein Schritt, um zu verstehen, wie Nutzer World Models tatsächlich einsetzen
- Derzeit ist es nur für Google AI Ultra-Abonnenten in den USA verfügbar; eine Ausweitung auf weitere Regionen ist geplant
- Google plant langfristig, Technologien zur Welterzeugung für mehr Nutzer zu öffnen
Noch keine Kommentare.