Gestire record duplicati su più file Excel è un incubo che porta via tempo, crea incoerenze nei dati ed errori costosi.

Senza un processo di deduplica affidabile, rischi di inviare più email allo stesso contatto, prendere decisioni sbagliate basate su dati duplicati e sprecare ore a confrontare i record manualmente.

Scopri come deduplicare in modo efficiente i dati su più file Excel con tecniche e tool collaudati che ti fanno risparmiare tempo, mantengono l’integrità dei dati e prevengono future duplicazioni.

In questa guida vedrai come rimuovere record duplicati su più liste anche con strutture diverse:

Step 1: Importa i file da deduplicare su Datablist

Registrati a Datablist e importa almeno due file.

Schermata iniziale di Datablist
Schermata iniziale di Datablist

Assicurati di avere almeno un identificatore univoco nei tuoi file.

Nota: il Duplicates Finder di Datablist funziona con qualsiasi numero di file Excel/CSV. Possono avere strutture diverse: serve solo un identificatore di matching in ciascun file/lista.

File A da deduplicare rispetto al File B
File A da deduplicare rispetto al File B

Ho scelto l'URL LinkedIn dei miei prospect come identificatore univoco.

File B da deduplicare rispetto al File A
File B da deduplicare rispetto al File A

Un identificatore univoco non deve essere “assolutamente” unico: può essere anche il nome azienda o un nome proprio, purché lo definisci come tuo identificatore univoco.

Step 2: Trova i duplicati tra le tue liste

Poi, clicca su “Clean” e seleziona “Duplicates finder”.

Selezionare “Duplicates Finder” in Datablist
Selezionare “Duplicates Finder” in Datablist

Nota: puoi partire dal file che preferisci. Il processo e i risultati saranno gli stessi.

Imposta tutto per deduplicare tra i tuoi file CSV.

  1. Clicca su "Selected Properties and Multi Collections" e
  2. Clicca su "Check Duplicate Items Across Several Collections"
  3. Seleziona le collections su cui deduplicare — puoi scegliere due o più file, senza limiti.
Come selezionare una o più collections su cui deduplicare
Come selezionare una o più collections su cui deduplicare

Scegli la proprietà su cui fare la deduplica.

Una proprietà analoga deve esistere su ciascuno dei tuoi file. Per ogni proprietà da usare nella deduplica, seleziona la proprietà corrispondente in ogni collection.

Selezione proprietà per la deduplica
Selezione proprietà per la deduplica

Nel mio esempio, rimuoverò tutti i prospect presenti in "File A" da "File B" in base all'URL LinkedIn.

Puoi selezionare più proprietà per il matching dei duplicati. In questo caso, i record dovranno avere valori corrispondenti su tutte le proprietà. Se vuoi trovare duplicati su una proprietà OPPURE su un’altra, esegui il processo due volte, una per ciascuna proprietà.

Seleziona i meccanismi di confronto con cui vuoi lavorare.

Per gli ID (ID CRM, ID interni) uso sempre "Exact". Per proprietà testuali come URLs, Emails, ecc. scelgo l'algoritmo "Smart" per la massima accuratezza quando deduplico più file.

Se hai Names che potrebbero avere refusi o leggere variazioni, usa uno degli algoritmi di distanza (Levenshtein Distance o Jaro-Winkler Distance).

Meccanismi di confronto disponibili
Meccanismi di confronto disponibili

Clicca su “Run duplicates check” quando hai scelto l’opzione più adatta alla tua deduplica.

Step 3: Scegli le operazioni di pulizia per i duplicati

Imposta le regole di pulizia scegliendo tra:

  • Rimuovere gli elementi duplicati dalla collection X
  • Tenere gli elementi duplicati solo nella collection X (opzione disponibile solo quando si deduplica su 3 o più collections)
Impostazione delle regole di pulizia
Impostazione delle regole di pulizia

Clicca su "Process duplicate items" per continuare.

Il mio file pulito ora contiene solo nuovi prospect, senza duplicati.

Importante - Quando fai deduplica su più liste, l'algoritmo non rimuove i duplicati all'interno di un singolo file. Se esistono duplicati dentro un file, inizia eseguendo la deduplica su ciascun file.

File ripulito dai duplicati
File ripulito dai duplicati

Casi d'uso per questo workflow

  • Evitare di contattare lo stesso prospect due volte.
  • Evitare di contattare più persone della stessa azienda.
  • Consolidare i dati dei clienti da vari reparti o sedi.
  • Pulire e unire più liste contatti da diverse campagne di vendita.
  • Consolidare feedback dei clienti o risposte a survey da più fonti.