Imagen - Googles Text-to-Image-Diffusionsmodell
(imagen.research.google)- Ein KI-Modell, das Sprache auf tiefem Niveau versteht und realistische Bilder erzeugt
- Erzeugt in Bewertungen durch Menschen Bilder, die gegenüber OpenAIs DALL-E 2 bevorzugt wurden
→ in Bezug auf Qualität und die Bild-Text-Ausrichtung - Veröffentlicht wurden nur die Forschungsarbeit und Beispielbilder
→ Eine von außen nutzbare Demo-Version soll wegen ethischer Probleme und ähnlicher Gründe nicht veröffentlicht werden
2 Kommentare
Gestern habe ich in einer Buchhandlung ein Exemplar von Alice im Wunderland gesehen, in das Standbilder aus Disney-Animationsfilmen als Illustrationen eingefügt waren. Ich frage mich, welches Ergebnis herauskäme, wenn man in ein solches Modell die einzelnen Szenen aus Alice im Wunderland eingeben würde.
DALL·E 2 vorgestellt
Wie funktioniert DALL-E 2?