Als moderner Jäger und Sammler, läßt es sich nicht vermeiden, daß in der eigenen Musiksammlung früher oder später Duplikate vorhanden sind. Ein Vergleich per Metadaten, wie Titel und Künstler, fällt oft schwer, wenn sie schlecht gepflegt sind.
Ein anderer Ansatz ist die Verwendung von so genannten akustischen Fingerabdrücken (acoustic fingerprint). Mir ist jedoch keine freie Lösung für den »Hausgebrauch« bekannt.
Eine einfache Alternative sind Hash-Werte, wie MD5- oder SHA1-Hashes. Einfach auf einen Datei angewendet, bedeutet jedoch, daß die eingebetteten Metadaten in die Hash-Berechnung einfließen. Dieses Problem läßt sich mit dem Programm shnhash umgehen. Es berechnet den Hash-Wert auf Basis der dekomprimierten Samples. Es ist also notwendig komprimierte Formate, wie MP3- oder Ogg-Dateien, vorher zu dekomprimieren. Als Beispiel wird hier sox verwendet.
- SHA1-Hash
$ sox datei.mp3 /tmp/$$.wav && shnhash -m /tmp/$$.wav | cut --delimiter=" " --fields=1 && rm /tmp/$$.wav
- MD5-Hash
$ sox datei.mp3 /tmp/$$.wav && shnhash -s /tmp/$$.wav | cut --delimiter=" " --fields=1 && rm /tmp/$$.wav