- Über Gemini und Whisk steht eine Funktion zur Verfügung, mit der sich textbasierte Prompts in hochauflösende 8-Sekunden-Videos umwandeln lassen
- Mit dem Modell Veo 2 lassen sich realistische Videos erzeugen; verfügbar ist es für Abonnenten von Google One AI Premium
- Mit Whisk Animate können Bilder in 8-sekündige animierte Clips umgewandelt werden
- Aus Sicherheitsgründen enthalten alle erzeugten Videos ein digitales Wasserzeichen von SynthID
So erstellt man Videos in Gemini
- Veo 2 ist ein Modell, das hochauflösende, detailreiche Videos erzeugen kann und durch das Verständnis realistischer Physik und menschlicher Bewegungen lebendige Charakterbewegungen und realistische Szenen liefert
- Nutzer können in Gemini Veo 2 auswählen, um 8-sekündige Videoclips in 720p-Auflösung zu erzeugen
- Beschreibt man eine Szene, setzt Gemini die Idee als Video um; je detaillierter die Beschreibung, desto mehr Kontrolle hat man über das finale Video
- Die erzeugten Videos lassen sich leicht auf Plattformen wie TikTok oder YouTube Shorts teilen
Bildern mit Whisk Animate Leben einhauchen
- Whisk ist ein Experiment von Google Labs, mit dem sich mithilfe von Text- und Bild-Prompts neue Ideen visualisieren lassen
- Mit Whisk Animate lassen sich Bilder in lebendige 8-Sekunden-Videos umwandeln; verfügbar ist die Funktion für Abonnenten von Google One AI Premium
Sicherheitsansatz
- Um die Sicherheit bei der Videogenerierung zu erhöhen, enthalten alle mit Veo 2 erzeugten Videos ein digitales Wasserzeichen von SynthID
- Durch Nutzerfeedback sollen kontinuierliche Verbesserungen erfolgen; zudem werden Bewertungen durchgeführt, um die Erzeugung von Inhalten zu verhindern, die gegen Richtlinien verstoßen
2 Kommentare
Google DeepMind stellt das Video-Generierungsmodell Veo 2 vor
Hacker-News-Kommentare
Whisk wurde vor ein paar Monaten stillschweigend als Demo für Imagen 3 veröffentlicht. Überraschenderweise macht es Spaß und ist solide umgesetzt.
Ich würde gern „Ja“-Anteile auf das Polymarket-Ereignis kaufen, dass bis 2027 ein von einer einzelnen Person gemachter Film mehr als 100 Millionen Dollar einspielt.
Ich habe in Veo2 48 Dollar an GCP-Credits verbraucht, um 12 Videos mit je 8 Sekunden zu erstellen. Vorsicht ist geboten.
Ich hätte nicht gedacht, dass es außerhalb einer kostenpflichtigen API möglich sein würde, 8-Sekunden-Videos zu erzeugen.
Ich bin in diesem Bereich technisch nicht besonders versiert, aber ich frage mich, warum alles Text-zu-X ist.
Eine Werbung im Ghibli-Stil zu machen, ist mutig. Ich dachte, dieser Stil wäre inzwischen ausgeschöpft.
Google Vids verwendet ebenfalls Veo 2. Das sorgt für Produktverwirrung.
Die Inhaltsmoderation ist extrem frustrierend. Das könnte der Hauptgrund sein, warum Veo2 und Gemini am Ende scheitern.
All das ist technisch beeindruckend, aber für jemanden, der in diesem Bereich hart gearbeitet hat, ist es auch eine große Warnung.
Krita-ai-diffusion, das an Krita angebunden ist und img2img mit Masking und txt2img kombiniert, ist das Werkzeug, das Künstler am ehesten stärkt.
Im Vergleich zu vor einem Jahr ist das ein sehr beeindruckender Launch. Für ML ist die Lage derzeit gut, weil alle großen Unternehmen miteinander konkurrieren und die Technik vorantreiben. Das ist in den USA (oder allgemein) selten.