Tipps & Tricks Storage Management

Doppelte Dateien finden und entfernen

Professionelles Projektmanagement mit der TreeSize Duplikatsuche.

Blog Author Joachim Marder

Joey

CEO
Doppelte Dateien löschen mit TreeSize
Veröffentlicht am 03.08.2021

Wo gehobelt wird, da fallen auch Späne: Oft ist es nämlich so, dass Dateien verschoben oder kopiert und anschließend vergessen werden. Egal, ob man gemeinsam über SharePoint, ein Netzlaufwerk oder auch allein auf seinem lokalen Laufwerk an Projekten arbeitet.

Mit der Zeit entstehen immer mehr Dateiduplikate - also doppelte Dateien, die in verschiedenen Ordnern gespeichert sind. Je nach Strukturtiefe können diese Dateiduplikate in den Untiefen der eigenen Ordnerpfade verschwinden und große Mengen an Speicherplatz verschwenden. TreeSize hilft dabei, genau diese doppelten Dateien zu finden und zu entfernen.

Doppelte Dateien verschwenden Festplattenspeicher

So ist es auch einem unserer Kunden passiert: Eine Baufirma organisiert seine vielen Projekte in Unterverzeichnissen, in denen es die jeweiligen Planungs- und Arbeitsdateien ablegt. Dabei erhält jedes Projekt viele PDF-Dateien mit allgemeingültigen Normen und Standards.

Im Ergebnis häuft die Baufirma mit der Zeit ständig echte Duplikate dieser Ausgangsdokumente an. Somit würden über die Zeit hunderte von Gigabytes an Speicherplatz allein für die Dateiduplikate verschwendet werden. Ein manuelles Suchen nach diesen Dateien ist aufgrund der schieren Dateimenge nicht zu stemmen und unwirtschaftlich.

Mit TreeSize ist es möglich, auf lokalem Dateisystem und auf Servern nach doppelten Dateien zu suchen und zu entfernen.

Auf NTFS-formatierten Speichermedien ist sogar eine Deduplikation möglich. Dabei werden die Dateiduplikate durch NTFS-Hardlinks ersetzt – damit verbraucht jedes Dateiduplikat nicht mehr seinen eigenen Speicherplatz, sondern weist jeweils auf denselben Ort auf der Festplatte hin.

Somit verhindert TreeSize Verluste wichtiger Dateien und gibt gleichzeitig neuen Speicherplatz frei.

Unser Kunde führt nun regelmäßig zum Ende des Monats einen Scan seiner Dateisysteme durch und sucht dabei auch nach Dateiduplikaten. Mit einem einfachen Klick können doppelte Dateien mit TreeSize dedupliziert werden.

Doch wie funktioniert das Ganze in der Praxis?

 

Mit TreeSize nach doppelten Dateien suchen und Duplikate sicher entfernen

Die TreeSize Dateisuche ist ein sehr starkes Tool, mit dem Sie die Organisation Ihrer Projektarbeit professionell unterstützen können. Öffnen Sie dazu TreeSize und wählen Sie unter „TreeSize Dateisuche öffnen“ den Eintrag „Doppelte Dateien“. Hier können Sie zunächst die Laufwerke auswählen, die in der Suche nach Dateiduplikaten berücksichtigt werden sollen.

Möchten Sie auch einen Server als Scan-Ziel auswählen, zum Beispiel um auf Ihrem SharePoint nach doppelten Dateien zu suchen? Klicken Sie dafür auf das Plus-Symbol, wählen Sie „SharePoint“ und tragen Sie Ihre Login-Credentials ein.

Neben SharePoint kann TreeSize auch Amazon S3 Cloud Storage, Linux- und Unixserver mit SSH und WebDAV untersuchen.

Bevor Sie mit der Duplikatsuche beginnen können Sie zudem noch Filterregeln festlegen, um zum Beispiel Dateien, die eine bestimmte Größe unterschreiten, von der Ergebnisliste auszuschließen. Somit erhöhen Sie die Übersichtlichkeit in Ihren Ergebnissen.

Wenn Sie alles eingestellt haben, lassen Sie TreeSize nach Duplikate suchen. TreeSize bietet hierbei verschiedene Prüfverfahren, etwa MD5 oder SHA256. Oder auch ganz einfach Name, Datum und Dateigröße.

TreeSize listet Ihnen die Ergebnisse übersichtlich auf, sodass Sie genau nachvollziehen können, welche Dateien an welchen Orten Duplikate aufweisen. Sortieren Sie die Ergebnisliste zum Beispiel nach Größe, um die größten Platzverschwender zu identifizieren.

Schließlich können Sie entweder alle oder einzelne Ergebniseinträge zur Deduplizierung markieren. Jetzt können Sie die Dateiduplikate einfach löschen - oder clever deduplizieren.

Im Fenster „Deduplikation“ können Sie sich nochmal einen Überblick über den Speicherplatz verschaffen, den Sie mit TreeSize potenziell zurückgewinnen können.

Jetzt nur noch auf "Ausführen" klicken. Fertig! Sie haben jetzt wieder mehr Speicherplatz zur Verfügung.

Wichtig: Die Deduplikation mit NTFS-Hardlinks funktioniert nur auf NTFS-formatierten Speichermedien, wie etwa Ihre internen Windows-Festplatten oder externe Speichermedien wie Festplatten und USB-Sticks, die NTFS-formatiert sind. Liegen Dateiduplikate an anderen Ablageorten wie zum Beispiel SharePoint, müssen Sie diese stattdessen wie gewohnt löschen.

 

Planen Sie als Nächstes die Suche nach doppelten Dateien mit TreeSize fest in Ihren Prozess zur Projektverwaltung ein.

Für die großen Batzen: Mit TreeSize nach doppelten Ordnerstrukturen suchen

Nicht jeder Anwendungsfall ist mit einer einfachen Dateisuche abgedeckt. Ein weiterer Kunde berichtet uns vor einiger Zeit, dass sein Use Case noch etwas spezieller ist. Ein Staatsarchiv steht vor dem Problem, dass nicht nur einzelne Dateien, sondern ganze Ordnerstrukturen auf seinen Servern mehrmals vorliegen. In der Summe können mehr als 10.000 Dateiduplikate mit der TreeSize Dateisuche identifiziert werden.

Es würde viel zu viel Zeit kosten, alle Dateien einzeln auf Dateiebene zu überprüfen. TreeSize kann nun auch auf Ordnerebene nach Duplikaten suchen. Damit ist die lästige Aufgabe im Handumdrehen erledigt.

TreeSize ist ein Muss für die übersichtliche Organisation von Projekten und ein Lebensretter für überfüllte Festplatten. Mit der TreeSize Duplikatsuche können doppelte Dateien schnell und einfach sowohl auf Servern als auch auf lokalen Laufwerken identifiziert werden. So lösen Sie Dateiduplikate auf ohne die Angst, dass wichtige Inhalte verloren gehen.

 

Möchten Sie immer auf dem neuesten Stand bleiben? Abonnieren Sie unseren Newsletter!

Hat Ihnen der Beitrag gefallen, haben Sie noch weitere Ideen oder Feedback für uns? Schreiben Sie uns, wir freuen uns auf den Austausch!