- Ein Musiksuchsystem besteht aus zwei Phasen: Registrierung und Suche
- Registrierung: Vorhandene Audiodateien werden in Audio-Fingerprints umgewandelt und in einer Datenbank gespeichert
- Suche: Die eingegebene Audiodatei wird in einen Audio-Fingerprint umgewandelt und anschließend mit der Datenbank verglichen, um ähnliche Audiodateien zu finden
- Grundwissen
- WAV-Datei: Unkomprimiertes PCM-Format, das das Original ohne Datenveränderung beibehält
- Sampling: Umwandlung eines analogen Signals in ein digitales; je höher die Samplingrate, desto genauer das Ergebnis
- Spektrogramm: Ein Diagramm, das Veränderungen von Frequenz und Amplitude visualisiert
- Fourier-Transformation: Wandelt ein Signal in den Frequenzbereich um, um Klang zu analysieren
- Peak: Daten, die wesentliche Frequenzkomponenten darstellen; Rauschen kann entfernt und die Daten komprimiert werden
- Audio-Fingerprint: Wird durch Hashing der Peak-Daten erzeugt und für Speicherung und Suche in der Datenbank verwendet
- Implementierungsprozess
- Eine WAV-Datei einlesen und Sampling-Daten erzeugen
- Die Sampling-Daten per Fourier-Transformation in ein Spektrogramm umwandeln
- Peaks aus dem Spektrogramm extrahieren
- Die Peak-Daten hashen und einen Audio-Fingerprint erzeugen
- Den Audio-Fingerprint in der Datenbank speichern oder darüber suchen, um ähnliche Audiodateien zu identifizieren
1 Kommentare
Umi