1 Punkte von GN⁺ 2023-11-28 | 1 Kommentare | Auf WhatsApp teilen

DALL·E-Bildtransformationsparty

  • DALL·E bietet eine Party zur Bildtransformation.
  • Zu den Bildthemen, die Nutzer mögen, gehören „Gnome“, „ältere Sibirier“ und „seltsame Katzen“.
  • Mit einem OpenAI-API-Schlüssel kann auf Basis eines Start-Prompts die Bildgenerierung gestartet werden.

Erweiterte Einstellungen

  • Über erweiterte Einstellungen wie die Anzahl der Wiederholungen können Nutzer den Bildgenerierungsprozess anpassen.
  • Mit GPT-4-Vision-Prompts lässt sich der Standard-Prompt verändern oder benutzerdefiniert gestalten, etwa lustiger, bizarrer, einfallsreicher oder indem alles in Katzen verwandelt wird.

Meinung von GN⁺

  • Das Wichtigste an diesem Beitrag ist, dass sich mit DALL·E verschiedene Bilder erzeugen und nach den Wünschen der Nutzer verändern lassen.
  • Die kreative und personalisierte Bildgenerierung bietet Menschen eine interessante Erfahrung und kann als Beispiel für den technologischen Fortschritt und die Möglichkeiten der künstlichen Intelligenz gesehen werden.

1 Kommentare

 
GN⁺ 2023-11-28
Hacker-News-Kommentare
  • Es macht ziemlich viel Spaß, mit Prompts herumzuspielen und zu sehen, was sich über eine Reihe von Bildern erzeugen lässt. Inspiriert von einem aktuellen Twitter-Post habe ich versucht, für jeden Prompt eine steigende "Intensität" einzustellen. Das Thema begann als Vorschlag meines Kindes, und es war erstaunlich zu sehen, wie das Chaos einer gewöhnlichen Ziege in kosmischen Horror am Ende des Universums ausartete. Link: dalle.party
  • Ein Custom-Prompt, der mir persönlich gefallen hat: Alle Details des Bildes sorgfältig durchdenken und in Bezug auf Stil, Farbe und Beleuchtung konzeptualisieren. Im letzten Schritt das Ganze zu einem Absatz verdichten und den Gedanken mit den auffälligsten Merkmalen und sehr präziser Sprache zusammenfassen. Link: dalle.party
  • Es macht auch Spaß, mit gegensätzlichen Konzepten zu spielen. Es beginnt mit einer einfachen Katze, entwickelt sich zu einer bequem daliegenden Gurke und wechselt am Ende in eine Gegenwelt. Link: dalle.party
  • Das erinnert an das Partyspiel "Telestrations". Die Teilnehmer wechseln sich damit ab, zu zeichnen und das aufzuschreiben, was sie sehen, und es ist unterhaltsam, das Ergebnis zu betrachten, während man errät, was die nächste Zeichnung sein wird. Ein alternativer Anzeigemodus, der das Bild und den nächsten Prompt zeigt, wäre schön. Man kann in den Mobilmodus wechseln oder die Fenstergröße anpassen, um erst den Prompt zu lesen und dann das Bild zu sehen.
  • Ich hatte eher eine schrittweise technische Evolution als einen technischen Rückschritt erwartet, aber stattdessen driftete es schnell in einen surrealen Bereich ab. Start-Prompt: "Ein Hybrid aus einer futuristischen Dampflokomotive und einer da-Vinci-Flugmaschine". Ergebnis: dalle.party
  • Bild-Text-Modelle scheinen überhaupt nicht zu wissen, was ein Foto tatsächlich enthält. Es wirkt, als würden sie Muster aus den Trainingsdaten abgleichen. Das zeigt, dass das Modell beim Rendern von Bildern aus Text zwar so wirkt, als würde es "verstehen", was das Modell will, in die umgekehrte Richtung aber weit von echtem "Verstehen" entfernt ist.
  • Ich habe es noch nicht ausprobiert, aber ich vermute, dass es dem kommerziell verkauften Spiel Scrawl ähnelt. Die Teilnehmer reichen Papier weiter und verwandeln dabei die Beschreibung des Nachbarn in eine Zeichnung oder umgekehrt, bevor sie es erneut weitergeben. Link: boardgamegeek.com
  • Als Ergebnis mit dem Start-Prompt "Künstliche Intelligenz malt ihre eigenen Bilder" zeigte es durchgehend Roboter, die auf Leinwände malen. Die ersten vier sind Bilder von Robotern, die nächsten drei Galaxien und die letzten beiden Landschaftsgemälde. Link: dalle.party
  • Es ist interessant zu sehen, dass bestimmte Prompts und Themen relativ stabil bleiben. Das Beispiel mit den "Gnomen" ist zum Beispiel stabil, während das Beispiel "eine Katze hält einer Maus eine Vorlesung" schnell in einen seltsamen surrealen Bereich abdriftet.
  • Ich bin etwas enttäuscht, dass die Ergebnisse ziemlich verrauscht sind, aber das Konzept selbst ist reizvoll. Link: dalle.party