17 Punkte von xguru 2022-08-19 | 2 Kommentare | Auf WhatsApp teilen
  • Adventure-Game im Stil von Sierra und LucasArts aus den 1990er-Jahren
  • Wenn man DALL-E direkt anweist, Pixelart zu zeichnen, sind die Ergebnisse nicht gut
  • Für Pixelisierung und Dithering wurde ImageMagick verwendet
  • Nach vielen Versuchen wurde eine Stil-Formulierung gefunden, mit der sich passende Bilder erzeugen lassen
    in the style of a high quality, atmospheric high renaissance oil on canvas painting
  • Was getan wurde, um die Perspektive zu steuern und den gewünschten Ort darzustellen
    • Epoche, Tageszeit und Beleuchtung festlegen: on a sunny day in the 2000s
    • Konkrete Beschreibung des gesamten Orts (town, city oder ein bekannter Ort)
    • Der Bereich, auf den fokussiert werden soll (facade, hotel entrance), sowie die umliegenden Gebäude houses, streets, plains
    • Leere Flächen können explizit angefordert werden: …and street in front, plaza surrounded by…
    • Man muss darum bitten, Platz freizulassen. Sonst füllt DALL-E ihn mit irgendetwas
    • Die Kameraposition kann festgelegt werden: seen from second-floor balcony
    • Niemals video game einfügen. Sonst wird alles mit blauem Neonlicht überzogen
  • DALL-E erzeugt Bilder mit 1024x1024, daher muss man sie für heutige Bildschirme auf etwa 19:10 anpassen
    • Das Bild wird in der Mitte geteilt und die leeren Bereiche an beiden Seiten werden transparent gemacht, danach
    • wird es erneut zu DALL-E hochgeladen und mit demselben Prompt angewiesen, den Rest zu erzeugen
    • Der Prompt kann außerdem angepasst werden, damit noch zusätzliche Elemente erzeugt werden
  • Rechnet man mit der aktuellen Preisstruktur von DALL-E
    • Ein erfolgreiches Spiel hat etwa 70 Szenen, aber nehmen wir an, es werden 50 erstellt
    • Um ein einziges gewünschtes Ortsbild zu erhalten, muss man ungefähr 200 Bilder erzeugen. Bei 50 Orten sind das insgesamt 10.000 Bilder
    • Wenn man für Korrekturen und horizontale Erweiterung etwa das Doppelte ansetzt, müssen rund 20.000 Bilder erzeugt werden
    • 20.000 * $0.0543 = etwa $1.087; wenn man annimmt, dass es manchmal schneller klappt, also ungefähr $1.000
    • Bei 6 Sekunden pro Generierung sind das 120.000 Sekunden = 33 Stunden

2 Kommentare

 
ifmkl 2022-08-19

Nebenbei bemerkt scheint imageMagick wirklich das Beste zu sein ...

 
eususu 2022-08-19

Ehrlich gesagt: ziemlich genial!