Lead Deduplication fa parte di una corretta igiene dei dati. I duplicati compromettono la qualità dei dati dei tuoi Lead. La produttività commerciale cala e il problema cresce finché non inizi a fare deduplication con regolarità.
Se vuoi pulire il database dei tuoi Lead prima di migrarlo in un nuovo CRM o ripulire il CRM attuale, questa guida ti aiuterà a unire i Lead duplicati.
I sistemi CRM come Salesforce o HubSpot hanno funzioni di deduplication integrate, ma con limiti. Rilevano i contatti ridondanti, tuttavia la fusione richiede tempo: le corrispondenze esatte vengono unite in automatico, mentre i valori in conflitto vanno risolti manualmente uno a uno.
Datablist è perfetto per manipolare dati su grandi dataset. Il Duplicates Finder rileva i record duplicati e ha una potente funzione di merge automatico per unire i Lead duplicati senza perdere dati. Le corrispondenze esatte vengono rimosse e i valori in conflitto combinati. L’algoritmo proprietario di Datablist consolida Note, Email o Numeri di telefono in conflitto in un singolo record Lead.
In questa guida passo passo scoprirai:
- Come trovare automaticamente i Lead duplicati
- Come deduplicare i Lead automaticamente
- Come unire manualmente i Lead duplicati rimasti
- Come aggiornare il CRM con la tua lista di Lead pulita
- Come esportare i gruppi di duplicati in un file Excel per l’elaborazione esterna
Note: Questa guida riguarda la Lead Deduplication. Ma il processo è simile per qualsiasi elenco di record: Contatti, Aziende, Prodotti, ecc.
Trova Lead duplicati
Per iniziare, importa il tuo database di Lead in Datablist.
Con Datablist, i dati sono organizzati in collections. Una collection conserva un elenco di record che condividono lo stesso modello dati. Devi importare i Lead usando file esterni. Datablist supporta file CSV ed Excel. Clicca "Import CSV/Excel", quindi seleziona il file con il tuo elenco di Lead.
Clicca + per creare una nuova collection. Assegnale un nome (e un’icona 🚀). Oppure clicca "Start with a CSV/Excel file" dalla home.
Poi passa alla schermata "Properties". In questo passaggio vengono elencate le colonne rilevate durante il parsing del file CSV. Datablist controlla ogni colonna per identificare il tipo di dato corretto. Per esempio, indirizzi email e URL vengono riconosciuti automaticamente.
Se necessario, seleziona manualmente il tipo di dato. Disattiva l’import se hai colonne CSV che non devono essere importate.
Nello step successivo, l’anteprima mostra il contenuto del tuo file. Clicca "Import {x} items" per avviare l’import.
Se i tuoi Lead sono distribuiti su più file, importali tutti nella stessa collection. Se la collection contiene già dati, durante l’import verrà mostrato uno step di mapping per allineare le colonne del CSV con le Properties esistenti.
Ora che il database dei Lead è caricato in una collection di Datablist, clicca su "Duplicates Finder" nell’header per avviare l’analisi dei duplicati.
Seleziona come confrontare i Lead per iniziare la deduplication. Sono disponibili due modalità:
- All Properties - Due record sono considerati duplicati se hanno una corrispondenza esatta su tutti i valori delle loro proprietà.
- Selected Properties - I record vengono confrontati su proprietà specifiche.
Note - In Datablist, il termine "Property" è sinonimo di Field o Column in altri sistemi.
Per la deduplicazione dei Lead, seleziona "Selected Properties".
Ora scegli quali identificatori sono unici per un Lead. Per le persone può essere l’indirizzo email, per le aziende l’URL del sito.
Quindi clicca "Next". Vedrai una schermata di revisione. Clicca "Run duplicates check" per avviare l’analisi.
Importante
- L’analisi è in sola lettura. Nessuna modifica ai dati verrà applicata finché non passerai alla fase successiva e al merge dei Lead.
- Datablist confronta i testi con un algoritmo case-insensitive. Se due valori sono uguali ma con maiuscole diverse, verranno elencati come Lead duplicati.
Deduplica automatica dei Lead
Il Duplicates Finder di Datablist offre due meccanismi per rimuovere i Lead duplicati: automatico e manuale. Per unire i Lead duplicati, inizia con l’Auto Merge e poi gestisci manualmente i record rimasti.
L’Auto Merge funziona con 3 algoritmi:
- Merge non-conflicting leads - Esegue uno "smart merge": unisce i record con valori uguali o complementari.
- Combine conflicting values - Combina i valori testuali delle proprietà in conflitto usando un delimitatore.
- Drop conflicting values - Mantiene il valore dell’elemento master ed elimina gli altri valori in conflitto per unire i Lead in un singolo record.
Gli algoritmi di merge e di combinazione sono sicuri: i dati di tutti i Lead duplicati vengono mantenuti durante l’unione. Ma con drop conflicting values i valori diversi per una proprietà vengono eliminati, tenendone solo uno.
Ecco un esempio di come lavora ciascun algoritmo:
Merging non-conflicting leads
email | First Name | Last Name
james@gmail.com | James
james@gmail.com | | Bond
Verrà unito in:
email | First Name | Last Name
james@gmail.com | James | Bond
Combinare la proprietà Phone con un punto e virgola
email | Phone | First Name | Last Name
james@gmail.com | +33 1 34 65 23 | James |
james@gmail.com | 06 13 42 78 23 | | Bond
Verrà unito in:
email | Phone | First Name | Last Name
james@gmail.com | +33 1 34 65 23;06 13 42 78 23 | James | Bond
Drop conflicting values su AccountId
AccountId | email | First Name | Last Name | Job Title
934DSFG39FGDS | james@gmail.com | James | |
ODFJSDK123aSD | james@gmail.com | | Bond | CEO
Verrà unito in:
AccountId | email | First Name | Last Name | Job Title
ODFJSDK123aSD | james@gmail.com | James | Bond | CEO
Come configurare Auto Merge per unire i Lead?
I 3 algoritmi coprono la maggior parte dei casi d’uso di lead deduplication.
Per deduplicare i tuoi Lead:
- Usa l’opzione combining values per le proprietà testuali come
Notes,Phone Number,Email Address. - Usa l’opzione drop conflicting values per:
- Proprietà tecniche come
Account Idche richiedono un singolo valore. - Proprietà di tipo "Relation". Per esempio
Lead owner,Account. - Proprietà non testuali che non possono essere combinate. Per esempio le date/ore come
Last Activity,Contacted on, e le checkbox.
- Proprietà tecniche come
Importante: vedi Aggiorna il tuo CRM con la lista di Lead pulita per la reimportazione dei dati nel CRM.
Per qualsiasi domanda su Auto Merge, contattaci.
Unire manualmente i Lead duplicati rimasti
Usa il Merging Assistant di Datablist per unire manualmente i Lead duplicati rimasti.
Scorri alla sezione "Or merge duplicate items manually" per vedere i record duplicati ancora presenti.
A sinistra di ogni gruppo di Lead duplicati, il pulsante "Merge Items" apre il Merging Assistant.
Si apre lo strumento di merge. A destra, Datablist seleziona il record con più dati come "Primary item". A sinistra, i Lead duplicati rimanenti sono i "Secondary Items".
Quando possibile, i valori delle proprietà dei Secondary Items vengono preselezionati per essere uniti nel Primary item. Se più valori sono in conflitto, dovrai decidere quale mantenere.
Se il "Primary item" risultante ti soddisfa, clicca Merge per confermare il processo. Tutti i Lead secondari verranno eliminati per mantenere un unico record Lead combinato.
Puoi anche modificare o eliminare i duplicati direttamente da questo elenco.
Aggiorna il tuo CRM con la lista di Lead pulita
Gestire più valori in una singola cella
Datablist può combinare più valori in una singola cella. Potresti ritrovarti con più valori uniti tramite un delimitatore.
Per esempio, una proprietà Phone unita:
email | Phone | First Name | Last Name
james@gmail.com | +33 1 34 65 23;06 13 42 78 23 | James | Bond
Se il tuo CRM usa campi multipli per i numeri di telefono, vorrai dividere questi valori. Un record migliore sarebbe:
email | Phone 1 | Phone 2 | First Name | Last Name
james@gmail.com | +33 1 34 65 23 | 06 13 42 78 23 | James | Bond
Per gestire questa trasformazione puoi:
- Usare la funzione "Split Property" di Datablist per creare più proprietà da dati multi-valore
- Oppure eseguire del codice script direttamente in Datablist per dividere i valori
- Oppure esportare i Lead in un file Excel e post-processare con Excel o Google Sheets
Come usare "Split Property" per dividere dati multi-valore in più proprietà
Datablist ha uno strumento integrato per dividere il testo di una proprietà in nuove proprietà. È perfetto per gestire i risultati combinati dell’algoritmo di deduplication.
Apri lo strumento cliccando su "Split Property" nel menu "Edit".
Seleziona la proprietà con i valori multipli. E scegli lo stesso delimitatore che hai usato durante la combinazione.
L’ultima impostazione definisce quante parti verranno create. Deve corrispondere al numero massimo di valori che può avere una singola cella. Per email e numeri di telefono, in genere sono due o tre.
Prima di processare i dati, Datablist mostra un’anteprima del risultato. Controlla che i dati divisi corrispondano all’aspettativa. Poi clicca "Split Property" per processare tutto.
Dopo l’elaborazione, la proprietà iniziale resta invariata e vengono create nuove proprietà per memorizzare i testi divisi. Rinominale per farle coincidere con le colonne d’import nel tuo CRM.
Dividere i valori con un delimitatore usando uno script JavaScript su Datablist
Per divisioni più complesse o ulteriori manipolazioni, Datablist offre un potente strumento per eseguire codice JavaScript sui tuoi dati. Puoi usarlo per dividere il testo in più proprietà.
Per prima cosa, crea le proprietà extra in cui salvare i valori separati se non esistono già. Crea per esempio Phone 2, Phone 3 o Email 2, Email 3, ciascuna destinata a un singolo valore dopo la divisione.
Poi clicca su "Run Javascript" nel menu "Edit" per aprire l’editor degli script.
Adatta lo script seguente alle tue proprietà:
function runOnItem(item){
if(!item.phone) return null;
var parts = item.phone.split(';');
if(parts.length===1) return null;
return {
phone1: parts[0],
phone2: parts[1]
}
}
Nota: Elabora ogni proprietà combinata separatamente. Se hai una proprietà con numeri di telefono e un’altra con indirizzi email, prima esegui lo script sui numeri di telefono, poi lanciane un secondo per le email.
Ecco un esempio di codice che divide il contenuto di una proprietà con chiave phone1. La divisione avviene su un punto e virgola. I numeri risultanti vengono salvati in 2 proprietà: phone1 e extraphone.
Per aiuto sulla scrittura dello script, contattaci.
Esporta i gruppi di duplicati in un file Excel o CSV
In qualunque momento del processo di deduplication puoi esportare i duplicati rimasti. Datablist esporta in Excel o file CSV.
Esporta i duplicati quando vuoi pulirli manualmente con Excel o esternalizzare il lavoro a un fornitore.
FAQ
Che cos'è la Lead Deduplication?
La Lead Deduplication, o deduplica dei lead, è il processo di trovare e unire i record duplicati per ottenere un elenco pulito di voci uniche.
Un Lead rappresenta una persona o un’azienda. Un Lead duplicato si verifica quando esistono più record per la stessa persona o azienda.
I duplicati compaiono quando hai diverse fonti di Lead che confluiscono in un unico elenco: lead magnet, webinar, newsletter o inserimenti manuali.
Perché la deduplicazione nel CRM è importante?
La deduplication nel CRM è vitale per mantenere dati clienti accurati, affidabili e completi. È cruciale per diversi motivi:
-
Accuratezza dei dati: Unendo i duplicati, il team si affida a un’unica fonte affidabile. Più voci per lo stesso cliente generano attività ridondanti, come comunicazioni duplicate, follow-up doppi o ticket di supporto duplicati.
-
Customer Insights: I record duplicati falsano analisi e report. La deduplication consente insight accurati eliminando doppioni che distorcono metriche come tassi di acquisizione, conversione o customer lifetime value.
-
Riduzione dei costi: Mantenere duplicati in un CRM comporta costi inutili.
-
Data governance e compliance: I duplicati possono compromettere governance e conformità, specialmente con regolamenti come il GDPR. Deduplicando, migliori la conformità, tuteli la privacy e proteggi i dati da accessi o usi non autorizzati.
In cosa è diversa dalla deduplicazione di Salesforce e HubSpot?
In Salesforce puoi configurare regole di matching per rilevare duplicati. Quando vengono trovati, i Lead esattamente uguali vengono uniti automaticamente. Ma Salesforce e HubSpot non possono unire automaticamente i Lead con valori in conflitto. Un assistente di merge manuale ti fa unire i Lead uno per volta. Per elenchi grandi, strumenti di automatic deduplication come Datablist ti fanno risparmiare tempo nel processo.
Come confronta i valori Datablist per trovare i duplicati?
Prima di unire i duplicati, Datablist esegue un algoritmo per rilevarli. L’algoritmo ha due modalità: un confronto completo per trovare Lead con gli stessi valori su tutti i campi; e un confronto su uno o più campi selezionati.
Eseguire il Duplicate Finder su un campo selezionato è consigliato per la lead deduplication. Seleziona solo il campo che identifica un Lead. Email o sito web aziendale sono ottimi identificatori.
L’algoritmo di deduplication ignora le maiuscole/minuscole. Non incidono sul confronto.
Si possono combinare tutte le proprietà dei Lead?
Puoi combinare solo proprietà basate su testo. L’algoritmo di combinazione usa un delimitatore di stringa per unire più valori. Sono compatibili tutti i tipi basati su testo: Text, LongText, Email, Url, ecc. Checkbox, Number e Datetime non sono compatibili e vengono ignorati durante la combinazione.
Usa il Merging Assistant manuale o l’impostazione di drop conflicting values per unirli.
Come gestire i valori in conflitto che non voglio combinare?
Usa l’impostazione Drop conflicting values per unire i Lead duplicati senza combinare i valori. È utile per proprietà Checkbox, Number e Datetime che non possono essere combinate.
Come spostare i valori in conflitto in altre proprietà?
Per spostare i valori in conflitto in un’altra proprietà, dividi il processo in due step:
- Unisci i valori in conflitto in un’unica proprietà con un delimitatore
- Poi dividi i valori multipli con un delimitatore in due o più proprietà
Vedi gestire più valori in una singola cella per la guida passo passo.
Quanti Lead posso elaborare?
Il Duplicates Finder di Datablist lavora con elenchi molto grandi, con centinaia di migliaia di record. Per prestazioni migliori, esegui l’algoritmo su laptop o desktop. Browser moderni come Google Chrome, Apple Safari e Mozilla Firefox sono più veloci di Microsoft Edge.
Quanto dura il processo di deduplicazione?
La deduplication è quasi istantanea. Per elenchi di Lead molto grandi (centinaia di migliaia di record) richiede pochi secondi.
Non devi aspettare ore per vedere i risultati delle impostazioni. Buona pratica: clona la collection prima di eseguire gli algoritmi di merge. Se il risultato non ti soddisfa, riparti dalla collection clonata.
Devo risolvere tutti i conflitti dei duplicati?
No. Gli elementi della collection vengono aggiornati a ogni operazione di deduplication. Puoi procedere in modo incrementale: inizia con l’auto-merge delle corrispondenze esatte, visualizza i duplicati rimasti, imposta le regole di combinazione, ecc., finché non elimini tutti i duplicati.
Quali CRM sono compatibili con Duplicates Finder di Datablist?
Datablist lavora con file CSV. Qualsiasi CRM che consente export/import in CSV è compatibile. Puoi deduplicare i Lead di HubSpot CRM o Salesforce CRM facilmente, entrambi offrono export/import CSV.
Datablist può connettersi direttamente alle API del CRM per deduplicare i Lead?
Non ancora. Al momento, i Lead vanno importati in Datablist manualmente con file esterni. I file CSV ed Excel sono i metodi consigliati per importare i Lead in Datablist.



















