2 Punkte von GN⁺ 2024-05-15 | 1 Kommentare | Auf WhatsApp teilen

Sir, there's a cat in your mirror dimension

  • Früher wurde bereits über den Frequenzbereich gesprochen.

    • Dabei handelt es sich um eine Technik, mit der Alltagssignale in die Amplituden ihrer Bestandteilswellenformen umgewandelt werden.
    • Die gebräuchlichste Grundlage sind Sinuswellen mit ansteigender Frequenz.
    • Viele andere Wellenformen können ebenfalls unterschiedliche Frequenzräume erzeugen.
  • Zwei wichtige Eigenschaften der Transformation in den Frequenzbereich:

    • Reversibilität: Aus dem Frequenzbild lassen sich die ursprünglichen Daten wiederherstellen.
    • Ein-/Ausgabe-Symmetrie: Mit derselben mathematischen Operation kann in beide Richtungen transformiert werden.
  • In der Praxis ist diese Unterscheidung wichtig.

    • Besonders relevant ist sie bei der Kompression.
    • Wenn man ein Bild in den Frequenzbereich transformiert und die Präzision der Hochfrequenzanteile reduziert, sinkt die Datenmenge.
    • Das resultierende Bild wirkt optisch weiterhin gleich.

MS Paint als hochmodernes Kompressionstool verwenden

  • Ein Bild im Frequenzbereich sieht wie verteiltes Rauschen aus.

    • Das meiste davon ist visuell nicht wichtig.
    • Die Transformation ist ein Hebel, der zwischen zwei funktional identischen Dimensionen hin- und herwechselt.
    • Dadurch kam die Frage auf, ob man einige Daten in diese Spiegeldimension verlagern und dort unterbringen könnte.
  • Um das zu testen, wurde ein Katzenfoto genommen und mit der diskreten Kosinustransformation (DCT) seine Form im Frequenzbereich berechnet.

    • Zeit-Katze, Frequenz-Katze.
  • Anschließend wurde das Frauenfoto aus dem früheren Beispiel verwendet, das Muster aus „Katzenrauschen“ aus der Spiegeldimension darübergelegt und die Deckkraft reduziert.

    • Zeit-Frau und Frequenz-Katze.
  • Beim Compositing entstehen zwangsläufig Verluste.

    • Theoretisch würde sich das Frauenfoto in gleichmäßiges Rauschen zerlegen, wenn man für das zusammengesetzte Bild per DCT die Darstellung im Frequenzbereich berechnet.
    • Das injizierte „Katzenrauschen“ würde sich zu einem erkennbaren Katzenbild zusammenziehen.
  • Genau das passiert auch in der Praxis.

    • Frequenz-Katze und Zeit-Frau.
  • Wer es selbst überprüfen will, kann das zusammengesetzte Bild herunterladen und in MATLAB Folgendes ausführen:

    woman = imread("woman-with-cat.png");  
    colormap('gray');  
    imagesc(woman, [0 255]);  
    pause(1);  
    cat = dct2(woman);  
    imagesc(imgaussfilt(cat, 1), [-4 4]);  
    
  • Interessanterweise überlebt die Katze auch Größenänderungen des Host-Dokuments.

    • Beim Hochskalieren wird das Bild gekachelt.
    • Beim Herunterskalieren wird das Bild beschnitten.
  • Es stellte sich die Frage, wie stark verlustbehaftete Kompression die Katze beschädigt.

    • Die Auswirkungen waren geringer als erwartet.
    • Bei hoher JPEG-Qualität sieht das Bild ziemlich ordentlich aus.
    • Sinkt die Qualitätseinstellung, wird das rechte untere Quadrant stark quantisiert.
    • Das Chaos der JPEG-Kompression im Frequenzbereich.
  • Diese Visualisierung zeigt, wie viele Informationen der JPEG-Algorithmus zerstört.

    • Das meiste davon bemerken wir nicht.
  • Es gab schon viele frühere Beispiele dafür, Audiospektrogramme als versteckte Nachrichten zu verwenden.

    • Auch über Text-Steganografie mithilfe von JPEG-DCT-Koeffizienten wurde bereits diskutiert.
    • Der Punkt ist weniger, dass diese Technik besonders nützlich wäre, sondern dass Frequenzbereich und Zeitbereich auf interessante Weise miteinander verbunden sind.

Meinung von GN⁺

  1. Verständnis von Frequenzbereichstransformationen: Transformationen in den Frequenzbereich spielen eine wichtige Rolle bei Datenkompression und Signalverarbeitung. Wer sie versteht, kann Bild- und Audiodaten effizienter verarbeiten.
  2. Einsatz von MATLAB: MATLAB ist ein leistungsstarkes Werkzeug für Datenanalyse und Visualisierung. Der Artikel zeigt ein praktisches Einsatzbeispiel dafür.
  3. Grenzen der JPEG-Kompression: Die Grenzen der JPEG-Kompression lassen sich hier visuell nachvollziehen. Das hilft dabei, Wege zu finden, die Dateigröße zu reduzieren und zugleich die Bildqualität zu erhalten.
  4. Steganografie: Steganografie mit dem Frequenzbereich ist ein interessantes Thema im Zusammenhang mit Datensicherheit. Sie zeigt, wie sich versteckte Nachrichten übertragen lassen.
  5. Unterhaltsame Anwendung von Technik: Der Artikel zeigt, wie sich Technik auf spielerische und kreative Weise einsetzen lässt. Das weckt Interesse und regt zu neuen Ideen an.

1 Kommentare

 
GN⁺ 2024-05-15
Hacker-News-Diskussion

Zusammenfassung ausgewählter Hacker-News-Kommentare

  • Thema des Bildes und Spektralenergie:

    • Bei den meisten Fotos ist das erkennbare Motiv dort, wo die Spektralenergie am Ursprung (oben links) konzentriert ist.
    • Das Motiv eines Fotos befindet sich in der Regel in der Mitte des Bildrahmens, wodurch Interferenzen zwischen Daten im Raum- und Frequenzbereich minimiert werden.
  • Grundlagen des digitalen Watermarking:

    • Diese Technik bildet die Grundlage für robustes digitales Watermarking von Signalen wie Bildern oder Audio.
    • Die Hauptanwendung besteht darin, urheberrechtlich geschütztes Material auch dann noch zu erkennen, nachdem ein Signal stark verarbeitet wurde.
  • Zeit-Frequenz-Dualität der Fourier-Transformation:

    • Die mathematischen Prinzipien der Fourier-Transformation funktionieren unabhängig von der Richtung der Transformation gleich.
    • Wenn man den Frequenzplot der Katze in den Raumplot der Frau einbettet, zeigt die Fourier-Transformation der Frau die Katze.
  • Bitte um Bestätigung des Verfahrens:

    • Es wird ein Foto aufgenommen, die Katze in den Frequenzbereich transformiert und anschließend in das sichtbare Bild der Frau eingefügt.
    • Führt man auf das zusammengesetzte Bild erneut eine DCT aus, erscheint die Katze.
  • Anwendung von Steganografie:

    • Eine interessante Anwendung von Steganografie zum Verbergen illegaler Bilder.
    • Wenn man ein Bild in den Frequenzbereich transformiert und in ein anderes Bild einbettet, können es nur diejenigen sehen, die wissen, wie man den Vorgang rückgängig macht.
  • Aphex Twins Audio-Spektrogramm-Trick:

    • Ähnlich wie der unterhaltsame Trick von Aphex Twin, bei dem im Audio-Spektrogramm eines Tracks ein seltsames Gesicht erscheint.
  • Bedeutung der Position bei der DCT:

    • Wäre die Katze stärker oben links konzentriert gewesen, hätte diese Demo vermutlich nicht gut funktioniert.
    • Da die DCT viele Hochfrequenzanteile enthält, wäre die Katze oben links wahrscheinlich überdeckt worden.
  • Verständnis von Bildkompression:

    • Die Erkenntnis, dass der Frequenzbereich für Bildkompression genutzt werden kann.
    • Es wird gefragt, ob die meisten Bildkompressionsalgorithmen so funktionieren, dass sie die ruhigen Bereiche im Frequenzbereich entfernen.
  • Konkrete Methode der DCT:

    • Es scheint, dass die DCT hier anders angewendet wurde als mit den in JPEG verwendeten 8x8-Kacheln.
    • Offenbar wurden in diesem Fall keine 2D-DCT-Basisfunktionen verwendet.
  • Musik- und Bildkodierung:

    • Ähnlich wie bei Aphex Twin und Venetian Snares, die Bilder in Sound kodiert haben.
    • Mit bestimmten Tools lässt sich sehen, dass die Frequenzen das Bild einer Katze darstellen.