DANKE erstmal an ds211user für den Tipp mit den SynoCLI File Tools! Hab ich gleich installiert und ausprobiert.
Jetzt aber zwei (klitzekleine) Wermutstropfen für alle auf Hashwerten beruhenden "Datei-Vergleicher":
a) Mir ist passiert, dass zwei MD5-identische Dateien (Beide wichtig und mit unterschiedlichen Dateinamen) als duplikate angezeigt wurden.
b) Mit ist auch passiert, dass zwei ECHT identische .jpg Dateien unterschiedliche MD5 hashes hatten
Bei a) handelte es sich um sogenannte sidecar Dateien (*.xml Format), in denen identische Metadaten zu zwei RAW-Dateien standen. Und keine von denen sollte natürlich gelöscht werden. Das lässt sich natürlich vermeiden, wenn man von vornherein die Duplikatsuche auf reine Bilddateien beschränkt, ohne sidecars.
Bei b) war ich ziemlich perplex und hab mir dann mit dem file comparison tool (fc in der Windows command line) die Dateien angeschaut. Das hier war der Unterschied der beiden .jpgs:
Code:
C:>fc 0007_edited.jpg 0007_edited-1.jpg
Vergleichen der Dateien 0007_edited.jpg und 0007_EDITED-1.JPG
***** 0007_edited.jpg
Adobe Photoshop Album 2.0
2007:02:21 05:57:33
∟
***** 0007_EDITED-1.JPG
Adobe Photoshop Album 2.0
2007:02:21 06:02:40
∟
*****
Die waren irgendwann mal durch Adobe Photoshop Album gelaufen und hatten verschiedene timestamps.
Die gute Nachricht: Mit
Digikam wurden auch diese Duplikate gefunden. (Und darüber hab ichs dann auch bemerkt)
Meine Vorgehensweise wird jetzt wohl so sein:
Mit einem 1. Durchlauf mit einem hash-Wert basierten tool (jdupes!) den Großteil aller Duplikate "erschlagen". Dann mit Digikam (das ich sowieso zur Bildverwaltung nutze) auch die die wenigen Sonderfälle behandeln.
Nebenbei: Digikam kann auch sowas wie "Suche nach ähnlichen Bildern"... Aber das führt her vom Thema weg