Imagen - Googles Text-to-Image-Diffusionsmodell

xguru · 2022-05-25T09:32:41+09:00

Ein KI-Modell, das Sprache auf tiefem Niveau versteht und realistische Bilder erzeugt Erzeugt in Bewertungen durch Menschen Bilder, die gegenüber OpenAIs DALL-E 2 bevorzugt wurden → in Bezug auf Qualität und die Bild-Text-Ausrichtung Veröffentlicht wurden nur die Forschungsarbeit und Beispielbilder → Eine von außen nutzbare Demo-Version soll wegen ethischer Probleme und ähnlicher Gründe nicht veröffentlicht werden

(imagen.research.google)

10 Punkte von xguru 2022-05-25 | 2 Kommentare | Auf WhatsApp teilen

Ein KI-Modell, das Sprache auf tiefem Niveau versteht und realistische Bilder erzeugt
Erzeugt in Bewertungen durch Menschen Bilder, die gegenüber OpenAIs DALL-E 2 bevorzugt wurden
→ in Bezug auf Qualität und die Bild-Text-Ausrichtung
Veröffentlicht wurden nur die Forschungsarbeit und Beispielbilder
→ Eine von außen nutzbare Demo-Version soll wegen ethischer Probleme und ähnlicher Gründe nicht veröffentlicht werden

2 Kommentare

kunggom 2022-05-25

Gestern habe ich in einer Buchhandlung ein Exemplar von Alice im Wunderland gesehen, in das Standbilder aus Disney-Animationsfilmen als Illustrationen eingefügt waren. Ich frage mich, welches Ergebnis herauskäme, wenn man in ein solches Modell die einzelnen Szenen aus Alice im Wunderland eingeben würde.

xguru 2022-05-25

DALL·E 2 vorgestellt
Wie funktioniert DALL-E 2?

Imagen - Googles Text-to-Image-Diffusionsmodell

Verwandte Beiträge

2 Kommentare