- Verknüpft ChatGPT mit einem Visual Foundation Model und unterstützt so das Senden und Empfangen von Bildern während eines Chats
- ChatGPT ist sprachbasiert trainiert und kann daher keine Bilder verarbeiten oder erzeugen
- VFM kann Bilder verstehen und verarbeiten, ist aber nur für einmalige Ein- und Ausgaben geeignet
- Durch die Verbindung beider Systeme sind Bildgenerierung, Änderungen an erzeugten Bildern sowie das Entfernen oder Verändern bestimmter Objekte in gesendeten Bildern möglich
- Bilder können zusammen mit Sprache übertragen werden
- Zusammenarbeit zwischen mehrstufigen KI-Modellen bei komplexen visuellen Fragen oder Bearbeitungsbefehlen
- Feedback zu den bearbeiteten Ergebnissen usw.
1 Kommentare
Sobald der Anfang gemacht ist, geht die Entwicklung wirklich rasant voran.