- Sora ist ein KI-Modell, das anhand von Textanweisungen realistische und fantasievolle Szenen erzeugt
- Es kann Videos mit einer Länge von bis zu 1 Minute erstellen, bleibt dabei den Prompts der Nutzer treu und hält zugleich eine hohe visuelle Qualität
- Vorgestellt werden Video-Beispiele, die auf Basis verschiedener Prompts mit detaillierten Szenarien erzeugt wurden
- Alle Videos auf dieser Seite wurden direkt von Sora erstellt und überhaupt nicht nachbearbeitet
- Derzeit wird Sora zur Bewertung möglicher Risiken Red Teams zur Verfügung gestellt und OpenAI holt Feedback von bildenden Künstlern, Designern und Filmschaffenden ein
- OpenAI möchte den Fortschritt der Forschung teilen, um Feedback von Außenstehenden zu erhalten und der Öffentlichkeit die Zukunft der KI-Fähigkeiten zu zeigen
Fähigkeiten von Sora
- Es kann komplexe Szenen mit vielen Charakteren, spezifischen Bewegungen sowie präzisen Details von Motiv und Hintergrund erzeugen
- Es versteht nicht nur die Prompts der Nutzer, sondern auch, wie Dinge in der physischen Welt existieren
Sicherheit von Sora
- Bevor Sora in OpenAI-Produkte integriert wird, sollen verschiedene Sicherheitsmaßnahmen ergriffen werden
- Dazu gehören die Entwicklung von Tools zur Erkennung irreführender Inhalte sowie eines Klassifikators, der feststellen kann, ob ein Video von Sora erzeugt wurde
Forschungstechnik
- Sora ist ein Diffusionsmodell, das mit einem stark verrauschten Video beginnt und schrittweise das Rauschen entfernt, um ein Video zu erzeugen
- Es verwendet eine Transformer-Architektur ähnlich den GPT-Modellen und bietet dadurch eine hervorragende Skalierbarkeit
Meinung von GN⁺
- Sora ist eine innovative KI-Technologie zur Videoerzeugung auf Basis textbasierter Anweisungen und eröffnet kreativen Fachleuten neue Möglichkeiten
- Durch Sicherheitsmaßnahmen und Feedback lernt das System den Einsatz in der realen Welt und spielt eine wichtige Rolle dabei, KI-Systeme schrittweise sicherer zu machen
- Diese Technologie scheint ein wichtiger Meilenstein auf dem Weg zur künftigen AGI (Artificial General Intelligence) zu sein
6 Kommentare
Wirklich, da bleibt einem nur Staunen.
Damit werden sie wohl 7 Billionen einsammeln ...?
Ob es ein echtes Video oder ein von KI erzeugtes Video ist, lässt sich auf den ersten Blick kaum erkennen.
Wow … ich möchte das schnell ausprobieren.
Mit einem Diffusionsmodell ist wohl gemeint, dass es nach demselben Prinzip wie Stable Diffusion funktioniert, oder?
Der Markt für Stockfotos und Stockvideos dürfte es schwer haben..
Die Qualität der Generierung ist wirklich unglaublich. Entwickelt sich das so schnell?
Hacker-News-Kommentare