- Die Bildgenerierungsfunktion von ChatGPT wurde umfassend verbessert und bietet nun präzisere Bearbeitung sowie schnellere Generierung
- Das Modell GPT‑Image‑1.5 befolgt Textanweisungen genauer und kann Bilder anpassen, ohne Ähnlichkeit, Beleuchtung und Komposition einer Person zu verlieren
- Über die neue Images-Seitenleistenoberfläche werden Preset-Stile, trendige Prompts und die Wiederverwendung von Erscheinungsbildern unterstützt
- Auch in der API gibt es dieselben Leistungsverbesserungen, dazu 20 % geringere Kosten; geeignet für die Erstellung von Markenlogos und Produktbildern
- Dieses Update wird sofort an alle ChatGPT- und API-Nutzer ausgerollt und verbessert Nutzwert und Qualität der Bildgenerierung deutlich
Einführung in GPT‑Image‑1.5
- Eine neue Version von ChatGPT Images auf Basis des leistungsstärksten Bildgenerierungsmodells wurde veröffentlicht
- Befolgt Textanweisungen genauer und erlaubt Bearbeitungen, während Detailmerkmale wie Gesichtsähnlichkeit erhalten bleiben
- Die Bildgenerierung ist bis zu 4-mal schneller, was iterative Experimente und die Ideenfindung effizienter macht
- Das Modell liefert ausdrucksstarke Transformationen, dichtes Text-Rendering und natürliche Ergebnisse
- Es unterstützt alles von kleinen Korrekturen bis zur vollständigen Rekonstruktion und ermöglicht mit Preset-Stilen eine einfache Generierung
- Der Rollout für alle ChatGPT-Nutzer läuft schrittweise; in der API wird es als GPT‑Image‑1.5 bereitgestellt
Ergebnisse passend zur Nutzerabsicht
- Das Modell verändert nur die angeforderten Bereiche und bewahrt dabei Beleuchtung, Komposition und Personenähnlichkeit konsistent
- So wird eine hohe Übereinstimmung bei Fotobearbeitung, Simulation von Kleidung und Frisuren, Stilfiltern und konzeptionellen Transformationen erreicht
- ChatGPT fungiert wie ein mobiles Creative Studio und übernimmt sowohl praktische Bearbeitung als auch künstlerische Neugestaltung
- Es unterstützt verschiedene Bearbeitungstypen wie Hinzufügen, Entfernen, Kombinieren und Mischen
- Die kreative Transformationsfunktion zum Hinzufügen von Elementen wie Text und Layout wurde verbessert
- Gegenüber GPT Image 1.0 wurde das Verständnis von Anweisungen verbessert, was feinere Bearbeitungen ermöglicht
- Die Qualität beim dichten und kleinen Text-Rendering wurde verbessert
Neuer Bereich für Bildgenerierung
- In ChatGPT wurde eine dedizierte Images-Seitenleiste eingeführt, die Erkundung und Erstellung von Bildern verkürzt
- Enthält Preset-Filter, trendige Prompts und die Wiederverwendung von Erscheinungsbildern
- Ein einmaliger Upload kann wiederholt genutzt werden, ohne die Camera Roll erneut verwenden zu müssen
- Die Bildgenerierung ist bis zu 4-mal schneller, mehrere Bilder können gleichzeitig erzeugt werden
- Von kleinen Änderungen bis zur vollständigen Neugestaltung werden Ergebnisse geliefert, die der Vision des Nutzers entsprechen
Zusätzliche Qualitätsverbesserungen
- Sofort nutzbare Qualitätssteigerungen bei der Darstellung vieler kleiner Gesichter und dem Rendering natürlicher Ergebnisse
- Beispiel: Eine Straßenszene im London der 1970er Jahre wird realistisch nachgebildet, mit verbessertem Fokus auf Details und Personendarstellung
Verbesserungen und Grenzen
- Gegenüber der frühen Version wurden in verschiedenen Anwendungsfällen klare Leistungsverbesserungen bestätigt
- Einige Ergebnisse sind jedoch weiterhin nicht perfekt; besonders bei mehreren Gesichtern und mehrsprachiger Verarbeitung gibt es noch Verbesserungspotenzial
Bereitstellung von GPT Image 1.5 über die API
- Die API-Version enthält dieselben Verbesserungen wie ChatGPT Images
- Konsistenz von Markenlogos und zentralen Visuals bleibt erhalten
- Geeignet für die Bildgenerierung in Marketing und E-Commerce
- Ein- und Ausgabekosten sinken um 20 %, sodass mit demselben Budget mehr Bilder erzeugt werden können
- Kann im OpenAI Playground, in der Galerie und im Prompt-Guide ausprobiert werden
- Unternehmen wie Wix, Canva, Figma und Envato setzen es bereits ein
- Wix bewertet es als „Generierung hochwertiger und hochkonsistenter Bilder, die schnelle Produktions-Workflows unterstützt“
Veröffentlichung und Rollout
- Das neue ChatGPT-Images-Modell wird sofort weltweit an alle ChatGPT- und API-Nutzer ausgerollt
- Es kann ohne separate Modellauswahl genutzt werden; die frühere Version bleibt in Form eines Custom GPT erhalten
- OpenAI bewertet dieses Update als wichtigen Schritt in der Entwicklung der Bildgenerierungstechnologie
- Weitere Verbesserungen wie noch feinere Bearbeitung und mehrsprachige Unterstützung sind geplant
Noch keine Kommentare.