25 Punkte von kciter1 2025-01-21 | 1 Kommentare | Auf WhatsApp teilen
  • Ein Musiksuchsystem besteht aus zwei Phasen: Registrierung und Suche
    • Registrierung: Vorhandene Audiodateien werden in Audio-Fingerprints umgewandelt und in einer Datenbank gespeichert
    • Suche: Die eingegebene Audiodatei wird in einen Audio-Fingerprint umgewandelt und anschließend mit der Datenbank verglichen, um ähnliche Audiodateien zu finden
  • Grundwissen
    • WAV-Datei: Unkomprimiertes PCM-Format, das das Original ohne Datenveränderung beibehält
    • Sampling: Umwandlung eines analogen Signals in ein digitales; je höher die Samplingrate, desto genauer das Ergebnis
    • Spektrogramm: Ein Diagramm, das Veränderungen von Frequenz und Amplitude visualisiert
    • Fourier-Transformation: Wandelt ein Signal in den Frequenzbereich um, um Klang zu analysieren
    • Peak: Daten, die wesentliche Frequenzkomponenten darstellen; Rauschen kann entfernt und die Daten komprimiert werden
    • Audio-Fingerprint: Wird durch Hashing der Peak-Daten erzeugt und für Speicherung und Suche in der Datenbank verwendet
  • Implementierungsprozess
    1. Eine WAV-Datei einlesen und Sampling-Daten erzeugen
    2. Die Sampling-Daten per Fourier-Transformation in ein Spektrogramm umwandeln
    3. Peaks aus dem Spektrogramm extrahieren
    4. Die Peak-Daten hashen und einen Audio-Fingerprint erzeugen
    5. Den Audio-Fingerprint in der Datenbank speichern oder darüber suchen, um ähnliche Audiodateien zu identifizieren

1 Kommentare

 
supersanic 2025-01-23

Umi