OpenAI führt Googles SynthID-Wasserzeichen für KI-Bilder zusammen mit Verifizierungstool ein
(openai.com)- OpenAI stärkt sein mehrschichtiges Provenance-Modell zur Identifizierung von KI-generierten Inhalten, indem es C2PA-Konformität, SynthID-Wasserzeichen und ein öffentliches Verifizierungstool kombiniert
- C2PA transportiert mithilfe von Metadaten und kryptografischen Signaturen den Kontext zur Erstellung und Bearbeitung von Inhalten mit, kann jedoch im Verlauf von Umwandlungen beschädigt werden
- SynthID von Google DeepMind ergänzt Bilder aus ChatGPT, Codex und der OpenAI API um unsichtbare Wasserzeichen und gleicht damit Schwächen von Metadaten aus
- Die Vorschau des öffentlichen Verifizierungstools prüft Content Credentials und SynthID in hochgeladenen Bildern und hilft dabei einzuschätzen, ob sie von OpenAI erzeugt wurden
- Keine einzelne Technologie ist ausreichend; das Provenance-Ökosystem wird stärker, wenn gemeinsame Standards, beständige Wasserzeichen und öffentliche Verifizierung kombiniert werden
Stärkung des Ansatzes zur Herkunft von Inhalten
- OpenAI stärkt sein mehrschichtiges Provenance-Modell, um Vertrauen im Internet aufzubauen, und will die Identifizierbarkeit von KI-generierten Inhalten auf Basis offener Standards und plattformübergreifender Zusammenarbeit verbessern
- Es gibt drei zentrale Änderungen
- C2PA-Konformität soll anderen Tools und Plattformen helfen, Provenance-Signale leichter zu erkennen
- In Zusammenarbeit mit Google werden Bilder um SynthID-Wasserzeichen ergänzt
- Es wird eine Vorschau eines öffentlichen Verifizierungstools bereitgestellt, mit dem die Öffentlichkeit prüfen kann, ob ein Bild von OpenAI erzeugt wurde
- Provenance-Signale liefern den nötigen Kontext, um zu beurteilen, woher Inhalte stammen, wie sie erzeugt oder bearbeitet wurden und ob sie mit den gemachten Angaben übereinstimmen
Vertrauensökosystem durch C2PA-Konformität
- OpenAI beteiligt sich seit 2024 an der Entwicklung und Einführung von Provenance-Standards und begann damit, von DALL·E 3 erzeugten Bildern Content Credentials hinzuzufügen
- Später wurden Content Credentials auch auf ImageGen und Sora angewendet
- OpenAI ist dem Steuerungsgremium der branchenübergreifenden Organisation Coalition for Content Provenance and Authenticity (C2PA) beigetreten, die offene technische Standards für die Herkunft von Inhalten vorantreibt
- C2PA nutzt Metadaten und kryptografische Signaturen, damit medienbezogene Informationen sicher zusammen mit dem Inhalt selbst weitergegeben werden können
- Diese Informationen liefern Kontext für Journalistinnen und Journalisten, die Herkunft bewerten, für Plattformen, die Entscheidungen zur Integrität treffen, und für Menschen, die Online-Inhalte besser verstehen möchten
- OpenAI ist vor Kurzem zu einem C2PA-konformen generativen Produkt geworden
- C2PA-Konformität bildet die Grundlage dafür, dass Plattformen an Inhalte angehängte Provenance-Informationen auf vertrauenswürdige Weise lesen, bewahren und weitergeben können
- Provenance-Informationen werden besonders dann wertvoll, wenn sie über die Plattform hinaus erhalten bleiben, auf der Inhalte ursprünglich erstellt wurden, und Konformität macht genau das möglich
Mehrschichtige Bildherkunft mit SynthID
- C2PA-Metadaten bilden die Grundlage dafür, Informationen darüber mitzuführen, woher Inhalte stammen, wie sie erzeugt oder bearbeitet wurden und wer diese Informationen signiert hat
- Metadaten können entfernt werden, beim Hoch- und Herunterladen verloren gehen oder durch Umwandlungen wie Formatwechsel, Größenanpassungen oder Screenshots beschädigt werden
- Um Provenance-Informationen robuster zu machen, führt OpenAI unsichtbare Wasserzeichen über Google DeepMinds SynthID ein
- Zum Start betrifft dies Bilder, die über ChatGPT, Codex und die OpenAI API erzeugt wurden
- SynthID fungiert als zusätzliche Wasserzeichen-Ebene, die den auf C2PA-Metadaten basierenden Ansatz ergänzt
- OpenAI hat Provenance- und Wasserzeichen-Ansätze bereits zuvor in realen Bereitstellungsumgebungen erprobt
- Bei Sora werden sichtbare Wasserzeichen verwendet
- Bei Voice Engine werden Audio-Wasserzeichen eingesetzt
- Es wird weiter getestet und erforscht, ob Genauigkeit und Zuverlässigkeit auch über die Zeit erhalten bleiben
- C2PA und SynthID gleichen unterschiedliche Schwächen des jeweils anderen aus
- C2PA hilft dabei, detaillierten Kontext in Inhalte einzubetten, aber Metadaten können entfernt oder beschädigt werden
- SynthID hilft dabei, Signale auch dann zu erhalten, wenn Metadaten nicht bestehen bleiben, und kann Transformationen wie Screenshots länger überstehen
- Metadaten liefern mehr Informationen, als ein Wasserzeichen allein bereitstellen kann
- Werden beide Ansätze zusammen eingesetzt, ist die Widerstandsfähigkeit der Herkunftsinformationen höher, als wenn jede Methode einzeln verwendet wird
Vorschau des öffentlichen Verifizierungstools
- OpenAI stellt eine Vorschauversion eines öffentlichen Verifizierungstools bereit, das dabei helfen soll zu prüfen, ob ein Bild mit ChatGPT, der OpenAI API oder Codex erzeugt wurde
- Das Tool überprüft, ob hochgeladene Bilder Provenance-Signale wie Content Credentials und SynthID enthalten
- Ziel ist es, mehrere Signale zusammenzuführen, damit Nutzerinnen und Nutzer Herkunftsinformationen von Inhalten leichter verifizieren und interpretieren können
- Das öffentliche Verifizierungstool kann von OpenAI stammende SynthID-Wasserzeichen zuverlässig erkennen und, falls vorhanden, auch C2PA-Metadaten anzeigen
- Da keine Erkennungsmethode perfekt ist, zieht das Tool bei fehlender Erkennung keine eindeutigen Schlussfolgerungen
- Auch wenn keine Metadaten oder Wasserzeichen erkannt werden, bedeutet das nicht zwingend, dass das Bild nicht mit OpenAI-Tools erzeugt wurde
- Provenance-Signale können in manchen Fällen entfernt werden
- Zum Zeitpunkt der Veröffentlichung ist das Verifizierungstool auf von OpenAI erzeugte Inhalte beschränkt
- In den kommenden Monaten soll damit auch die branchenweite Arbeit unterstützt werden, die plattformübergreifende Verifizierung ermöglichen soll
- Mit der Zeit wird voraussichtlich auch Support für weitere Arten von Inhalten hinzukommen, denen man online begegnet
Kommende Aufgaben
- Keine einzelne Provenance-Technologie ist ausreichend
- Ein starker Provenance-Ansatz muss gemeinsame Standards, langlebige Wasserzeichensignale und öffentliche Verifizierung kombinieren
- Mit bestehender Unterstützung für Content Credentials, C2PA-Konformität, der Einführung von SynthID und der Vorschau des öffentlichen Verifizierungstools will OpenAI zu einem stärker interoperablen Provenance-Ökosystem beitragen
1 Kommentare
Hacker-News-Kommentare
Wenn man KI-Bilder mit schwarzem Hintergrund erzeugen lässt, ist SynthID auf einem ordentlichen Monitor sichtbar. Es ist nur ein sich wiederholendes verschwommenes Muster, nichts Besonderes
Ich konnte es ziemlich gut entfernen, indem ich jedes zweite Pixel maskiert, dann die fehlenden Pixel neu erzeugt und anschließend mit einem Versatz von 1 Pixel erneut jedes zweite Pixel maskiert habe
Für das Auffüllen der Pixel habe ich ein vorhandenes Modell verwendet, aber vor den Änderungen zuerst eine Tiefenkarte exportiert und das Rauschen reduziert, damit die neu erzeugten maskierten Pixel zum ursprünglichen Inhalt passen. Das Ergebnis war nicht zu 100 % perfekt, aber mit mehr Zeit und einem für diesen Zweck feinabgestimmten Modell dürfte sich jede Art von KI-Wasserzeichen ohne große Probleme entfernen lassen
https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
Welche Informationen stecken in den Metadaten oder in SynthID? Wie viele Bits kann SynthID codieren?
Könnte man so etwas wie eine Nährwerttabelle für synthetische Inhalte erstellen? So nach dem Muster 10 % synthetischer Text, 30 % synthetische Bilder
Ihre heutige Realität war zu 15 % synthetisch (75 % Großkonzerne, 25 % Open-Weights-Neocloud)
Die tatsächlich ausgerollte Version dürfte wohl ziemlich anders sein
[0]:https://arxiv.org/html/2510.09263v1
SynthID wirkt komplett kompromittiert, was OpenAIs neues Wasserzeichen dagegen offenbar noch nicht ist, und das finde ich interessant [1]
[1] https://github.com/wiltodelta/remove-ai-watermarks
Das ist einfach nur wirkungslose Schaufensterpolitik
Aus der Perspektive von jemandem, der mit Tools Dinge für verschiedene Medien erstellt, würde ich solche Tools einfach meiden, wenn sie irgendeine von mir nicht gewählte Metadatenlast einfügen
Muss ich wirklich beim Erstellen von Texturen für Videospiele solchen merkwürdigen DRM-Müll einbauen? Wie lange gibt es Photoshop schon, und warum gilt dort eine Ausnahme?
Photoshop stammt nicht von Google oder OpenAI, und die Einstiegshürde, mit Photoshop fotorealistische Täuschungsbilder zu erstellen, ist viel höher als bei KI. Es gibt außerdem bereits Verfahren, die den Einsatz traditioneller Bildbearbeitung zumindest unvollkommen erkennen
Nur wenn Google oder OpenAI geistige Eigentumsrechte an ihren Bildern geltend machen, wäre SynthID DRM, und ich weiß nicht, ob das rechtlich haltbar wäre
Gut. Alle sagen zwar, es werde entfernt werden, aber ich habe noch kein Repository gesehen, das das reproduzierbar zeigt
Ich habe das am ersten Tag nach Erscheinen von Nano Banana Pro getestet, und es hat funktioniert. Es funktioniert auch jetzt noch mit Nano Banana 2
Ich habe es nirgendwo veröffentlicht, weil ich mich arrogant genug fühlte zu glauben, dass das öffentliche Bekanntmachen das Internet noch schlechter machen würde. Aber wenn ich am ersten Tag darauf gekommen bin, dann sind natürlich auch Hunderte Millionen andere Programmierer darauf gekommen, also war das reine Arroganz
Allerdings entstehen dabei Artefakte, die typisch für SD-Modelle sind, und die könnten auf andere Weise erkannt werden. Oder man sieht sie, wenn man stark hineinzoomt und genau hinschaut
Es ist schon ziemlich treffend, dass direkt neben diesem Beitrag gerade dieser hier steht: https://news.ycombinator.com/item?id=48200569
Ist das so etwas wie Metadaten bei mp3s?
Wenn man einen Screenshot eines KI-Bildes macht, gilt das dann auch noch als KI-Bild? Ich frage mich, ob es im Bild selbst verborgen ist oder ob es sich um Metadaten handelt
Zuerst wird geprüft, ob das Foto von OpenAI stammt, und als Nächstes werden dann Abonnentendaten und Standortinformationen eingebettet
Irgendwann wird man erkennen, dass eigentlich niemand KI-generierte Fotos oder Texte sehen will. Dann wird dieses Tool in der breiten Öffentlichkeit scheitern und nur noch für staatliche Zwecke funktionieren
Sind solche Wasserzeichen nicht leicht zu entfernen oder zu verfälschen? Es scheint nur so lange hilfreich zu sein, wie sich Menschen selten darauf verlassen und es sich deshalb nicht lohnt, sie zu umgehen
Wenn Social-Media-Plattformen anfangen würden, Bilder mit solchen Wasserzeichen zu verbieten, würden sie wohl über Nacht alle entfernt
Die Methoden, die ich bisher gesehen habe, sind entweder seltsame Tricks mit Transparenz oder mit einem Overlay des Originalbilds beim Einsatz von Bearbeitungsfunktionen, oder man erzeugt ein NB-generiertes Bild mit einem Diffusionsmodell bei niedrigem Rauschpegel neu; dabei verändert sich allerdings auch das Original
https://github.com/aloshdenny/reverse-SynthID
Das wirkt dem tatsächlich offenen Standard C2PA unterlegen: https://contentauthenticity.org/