Come eliminare i file duplicati dal pc

Esistono molti modi per liberare spazio dal disco fisso: si cancellano i file temporanei del browser, si svuota il Cestino, si disinstallano programmi ormai inutilizzati e si va a caccia di documenti che non servono più a nulla.

Ecco i  Programmi per migliorare le prestazioni del computer

Dimenticato qualcosa?

Probabilmente il vostro disco fisso è pieno di doppioni, di immagini duplicate, musica e filmati in tripla o quadrupla copia… se li cercate sono più di quanti pensiate.

Vi siete mai domandati il perché?

La ragione è presto detta: quando si spostano i file da una cartella (o unità) all’altra, si tende a fare un Copia e Incolla, e non un Taglia e Incolla. Questo perché la prima procedura è più rapida e sicura della seconda. Una volta terminata la copia ci si dimentica presto del file originario, aiutati dal fatto che ormai i dischi sono talmente grandi da non creare problemi immediati di spazio. Infine è sempre corretto pensare che una copia di backup non fa mai male.

Tuttavia se esplorate i vostri dischi fissi alla ricerca di file clone, potreste davvero trovare interi Gigabyte di spazio occupati da inutili doppioni: che ne dite di sbarazzarvene?

I software più sofisticati controllano anche il checksum del CRC (sta per “cyclic redundancy check”).

Vediamo in particolare cosa significhi ricercare file identici sulla base di questi parametri.

eliminare file duplicati

Nomi identici dei File duplicati

Il nome considerato identico è proprio quello del file: l’etichetta seguita dall’estensione. Il programma considera solamente il nome e nessun altro elemento per comparare i file. Di solito la ricerca per identità di nome ha senso disgiunta dalle altre solo quando cercate un file specifico di cui conoscete il nome, sapete che ne avete vari esemplari nelle cartelle del disco e volete recuperarli. Di certo l’identità di nome non garantisce quella di contenuto, quindi fate sempre una verifica prima di procedere con una cancellazione.

Stesse dimensioni dei File duplicati

Se può capitare che due file abbiano lo stesso nome (magari avete lasciato quello predefinito proposto dal programma, per esempio il classico “Documento1.doc” di Word…), è meno probabile che abbiano le stesse dimensioni: la dimensione di un documento è un buon parametro che, accoppiato al nome, fa la differenza in caso di identità di quest’ultimo.

Data dei file

La data dei file è sempre un elemento abbastanza criptico su cui si genera confusione: quando create un documento esso prende la data e l’ora di quell’istante. Se ne cambiate il contenuto, il file manterrà la stessa data di creazione, ma ne avrà anche una nuova di modifica. Se create una copia di questo documento, essa avrà una nuova data di creazione, ma quella di modifica sarà la stessa, tramandata dal file originario. Di solito i programmi di ricerca dei doppioni controllano la data di modifica, non quella di creazione.

La “prova del nove”

Ogni file ha un proprio “codice di controllo” chiamato “checksum”, che serve a verificare che i dati in esso contenuti, i singoli bit, siano scritti in modo corretto. Questo checksum viene elaborato con il metodo CRC (Cyclic Redundancy Check), un sistema abbastanza complicato basato su calcolo modulare. Ai nostri fini basti sapere che il checksum di ogni singolo file è praticamente la sua impronta digitale, quindi la prova definitiva della sua identità. Perché non si usa solo questo sistema per cercare i file clone? Perché il calcolo CRC richiede tempi di attesa alti che non vale la pena di spendere se la ricerca è ben mirata.

Fa tutto il software, o quasi

Esistono molti programmi per individuare file clone all’interno del disco fisso: in altri articoli vi descriviamo il funzionamento di quelli che riteniamo i migliori, cui dedichiamo anche i passo a passo.

Il loro funzionamento è abbastanza elementare: effettuano la scansione delle unità alla ricerca di file con elementi identici. Di solito vengono analizzati il nome (etichetta ed estensione), le dimensioni, la data di modifica.

Elenco dei software per eliminare i duplicati

Glossario dell’articolo

CRCCyclic Redundancy Control”. Sistema di calcolo per verificare l’integrità dei file.
Checksum È un codice di controllo, il risultato del calcolo CRC. È considerato l’impronta digitale del file.
Tag I3D Meta-dati contenuti all’interno dei file musicali per indicare artista, titolo e numero della traccia, nome dell’album,anno,
genere.