La déduplication de leads fait partie des bonnes routines d’hygiène des données. Avoir des doublons dégrade la qualité de vos listes de leads. Votre productivité commerciale baisse et le problème empire tant que vous ne mettez pas en place une déduplication régulière.

Que vous vouliez nettoyer vos leads avant une migration CRM ou nettoyer votre CRM actuel, ce guide vous aidera à fusionner vos doublons sans rien perdre !

Les CRM comme Salesforce ou Hubspot intègrent parfois une déduplication native mais celle-ci reste limitée : ils détectent les contacts redondants, mais la fusion est longue. Les doublons exacts sont fusionnés automatiquement, mais la moindre valeur conflictuelle impose une opération manuelle ligne par ligne.

Datablist est idéale pour manipuler de grands volumes de données. Le Duplicates Finder repère les doublons et dispose d’une fonction de fusion intelligente pour grouper plusieurs doublons de leads sans perte d’information : les valeurs identiques sont dédupliquées et les valeurs conflictuelles regroupées dans une fiche unique grâce à un algorithme puissant.

Dans ce tuto pas-à-pas, vous verrez :

Note : Ce guide traite de la déduplication des leads mais la démarche est identique pour toute base : contacts, sociétés, produits, etc.

Comment trouver les leads en double

Commencez par importer votre base de leads dans Datablist.

Sur Datablist, les données s’organisent en "collections". Une collection regroupe une liste d’enregistrements partageant le même modèle de données. Importez vos leads via un fichier externe. Datablist accepte les fichiers CSV et Excel. Cliquez sur "Import CSV/Excel" et sélectionnez votre fichier.

Cliquez sur le + pour créer votre collection, donnez-lui un nom (et une icône 🚀). Ou cliquez sur "Start with a CSV/Excel file" depuis l’accueil.

Raccourci création collection
Raccourci création collection

Vous accédez ensuite à l’écran "Propriétés". Il liste les colonnes détectées dans votre CSV. Datablist tente d’identifier automatiquement le type de chaque colonne (mails, urls...).

Vous pouvez définir le type de données à la main si besoin, ou désactiver l’import de colonnes inutiles.

Mapping colonnes CSV
Mapping colonnes CSV

À l’étape suivante, prévisualisez vos données puis cliquez sur "Importer {x} éléments".

Vos leads sont répartis sur plusieurs fichiers ? Importez-les tous dans la même collection ! Sur une collection déjà existante, un mapping s’affichera pour correspondre vos colonnes.


Une fois vos leads chargés, cliquez sur le menu "Duplicates Finder" pour lancer l’analyse des doublons.

Lancer l'analyse des doublons
Lancer l'analyse des doublons

Définissez le mode de comparaison :

  • Toutes les propriétés : deux fiches sont considérées comme doublons si elles sont identiques sur tous les champs.
  • Propriétés sélectionnées : la comparaison porte sur un ou plusieurs champs choisis.

Note – Sur Datablist, "Propriété" est synonyme de colonne ou champ dans d’autres outils.

Pour la déduplication de leads, utilisez plutôt "Propriétés sélectionnées".

Sélectionnez le mode fusion
Sélectionnez le mode fusion

Choisissez alors l’identifiant unique de votre fiche lead : souvent l’email pour une personne, l’url d’entreprise pour une société.

Choisissez votre identifiant
Choisissez votre identifiant

Cliquez sur "Next" puis "Run duplicates check" pour lancer l’analyse.

Important

  • L’analyse ne modifie jamais vos données à ce stade !
  • La comparaison ignore la casse (majuscule/minuscule) : "EMAIL@EXEMPLE.FR" et "email@exemple.fr" sont jugés égaux.

Comment dédoublonner automatiquement les leads

Le Duplicates Finder de Datablist propose deux approches : automatique et manuelle. Commencez par l’Auto Merge, puis gérez les cas complexes à la main.

Trois algorithmes :

  • Fusionner les valeurs non conflictuelles : fusionne intelligemment toutes les infos différentes et garde chaque valeur existante.
  • Combiner les valeurs conflictuelles : rassemble toutes les valeurs texte en une seule, séparées par un délimiteur.
  • Ignorer les valeurs conflictuelles : ne conserve qu’une valeur issue de l’élément principal (master) et efface les doublons.
Auto Merge Algorithms
Auto Merge Algorithms

Les deux premières méthodes sont "sûres" : toutes les infos sont conservées. La troisième supprime tout sauf un champ par propriété.

Exemple :

Fusionner des leads non conflictuels

email            |     Prénom   |    Nom
james@gmail.com  |     James    |    
james@gmail.com  |              |   Bond

Fusion :

email            |     Prénom   |    Nom
james@gmail.com  |     James    |   Bond

Combinaison avec Phone (point-virgule)

email            |     Téléphone       |   Prénom   |    Nom
james@gmail.com  |  +33 1 34 65 23    |  James     |        
james@gmail.com  |  06 13 42 78 23    |            |   Bond  

Fusion :

email            |   Téléphone                        |   Prénom   |   Nom
james@gmail.com  |  +33 1 34 65 23;06 13 42 78 23     |  James     |  Bond

Drop sur AccountId

AccountId        |   email          |   Prénom   |   Nom   |  Poste
934DSFG39FGDS    | james@gmail.com  |   James    |         |
ODFJSDK123aSD    | james@gmail.com  |            |  Bond   |  CEO

Fusion :

AccountId        | email            | Prénom   | Nom   |   Poste
ODFJSDK123aSD    | james@gmail.com  | James    | Bond  |  CEO

Comment paramétrer le Auto Merge pour dédoublonner ?

Ces trois logiques couvrent la quasi-totalité des cas de déduplication.

  • Pour les champs texte (Notes, Téléphones, Emails), choisissez combiner les valeurs.
  • Pour les champs techniques (Account Id), les relations (Lead owner), ou les champs non combinables (dates, cases à cocher...), utilisez ignorer les doublons.

Important : Consultez la partie mise à jour CRM pour réintégrer facilement votre base propre à votre CRM.

Besoin d’aide ? Contactez-nous

Fusionner manuellement les doublons restants

Utilisez l'Assistant de Fusion de Datablist pour traiter les cas nuancés.

Descendez à la section "Or merge duplicate items manually" pour traiter les groupes restants. Le bouton "Merge Items" (à gauche de chaque doublon) ouvre l’assistant :

Fusionner les doublons
Fusionner les doublons

L’outil s’ouvre : à droite, Datablist sélectionne l’enregistrement principal, à gauche les secondaires. Les valeurs sélectionnées côté gauche seront fusionnées dans l’item principal.

Assistant fusion
Assistant fusion

Quand il y a conflit sur une propriété, c’est à vous de choisir laquelle garder. Validez une fois satisfait(e), les doublons secondaires sont alors supprimés, pour ne garder qu’un seul contact combiné.

Vous pouvez aussi modifier ou supprimer vos doublons directement depuis cette liste.

Mettre à jour votre CRM avec la liste de leads nettoyée

Gestion des valeurs multiples dans une cellule

Datablist regroupe parfois plusieurs valeurs dans une seule cellule (email, téléphone, etc).

Exemple après fusion :

email            |   Téléphone                        | Prénom   | Nom
james@gmail.com  |  +33 1 34 65 23;06 13 42 78 23     | James    | Bond

Mais certains CRM exigent plusieurs colonnes (Téléphone 1, Téléphone 2...). Solution :

  • Utilisez la fonction "Split Property"
  • Ou un script personnalisé sur Datablist
  • Ou exportez puis traitez sous Excel / Google Sheets

Utiliser "Split Property"

Ouvrez "Edit" > "Split Property". Sélectionnez la propriété multi-valeurs, puis le délimiteur (ex : point-virgule).

Ouvrir Split Property
Ouvrir Split Property

Choisissez le nombre de propriétés finales à générer. Vérifiez l’aperçu, validez pour créer vos nouvelles colonnes.

Choix du délimiteur Split
Choix du délimiteur Split
Définir le nombre de propriétés
Définir le nombre de propriétés
Prévisualisation Split Property
Prévisualisation Split Property

Après traitement, renommez vos nouvelles propriétés/finales selon le modèle CRM.

Résultat Split
Résultat Split

Split via script Javascript

Pour des splits avancés, créez d’abord les propriétés cibles (ex : Phone 2, Phone 3...), puis menu "Edit" > "Run Javascript".

Création propriétés
Création propriétés
Créer propriété
Créer propriété
Ouvrir éditeur script
Ouvrir éditeur script

Adaptez ce code :

function runOnItem(item){
  if(!item.phone) return null;
  var parts = item.phone.split(';');
  if(parts.length===1) return null;
  return {
    phone1: parts[0],
    phone2: parts[1]
  }
}

Note : si plusieurs propriétés à traiter, procédez successivement (une par script).

Code JS pour split sur ;
Code JS pour split sur ;

Besoin d’aide ? Contactez-nous

Exporter les groupes de doublons en Excel ou CSV

À tout moment, exportez les doublons restants en Excel ou CSV, pour traitement manuel ou sous-traitance.

Export des résultats de déduplication
Export des résultats de déduplication

FAQ

C’est quoi la déduplication de leads ?

La déduplication de leads consiste à identifier et fusionner les fiches en double pour n’en garder qu’une unique et propre. Un lead = une personne ou entreprise. Un doublon = plusieurs fiches pour le même. Cela vient du multi-sourcing (lead magnets, webinaires, newsletter, saisie manuelle…).

Pourquoi la déduplication CRM est-elle importante ?

  • Qualité des données : fiabilité et unicité du référentiel client.
  • Insights clients : les doublons faussent les analyses.
  • Coûts : chaque contact doublonné génère des coûts cachés.
  • Conformité RGPD : les doublons nuisent à la bonne gouvernance et au respect des régulations (accès/droit à l’oubli).

Différences avec Salesforce / Hubspot ?

Salesforce permet des "matching rules" pour identifier les doublons : les exacts sont fusionnés automatiquement, mais les autres doivent l’être à la main. Pour de gros volumes, un outil dédié comme Datablist est bien plus rapide.

Comment Datablist détecte les doublons ?

Deux modes :

  • Sur tous les champs
  • Sur un ou plusieurs identifiants choisis (conseillé : email, url...) Ignore la casse (maj/min).

Peut-on combiner toutes les propriétés lors de la fusion ?

Uniquement les propriétés texte (Text, LongText, Email, Url...). Les cases à cocher, nombres, dates... doivent être traités manuellement.

Comment gérer les valeurs conflictuelles non combinables ?

Utilisez l’option Drop conflicting values lors de la fusion.

Comment déplacer les valeurs multiples dans d’autres colonnes ?

Procédez en deux étapes : combinez dans une seule colonne avec un séparateur, puis splittez-la en plusieurs colonnes avec un délimiteur. Cf. Gestion des valeurs multiples dans une cellule.

Combien de leads puis-je traiter ?

Le Duplicates Finder de Datablist gère plusieurs centaines de milliers d’enregistrements. Utilisez un ordinateur récent et un navigateur moderne (Chrome, Safari, Firefox > Edge).

Combien de temps dure la déduplication ?

Quasi instantané sur la plupart des bases. Cloner vos collections avant test, vous pourrez recommencer si le résultat n’est pas idéal.

Dois-je tout fusionner à la main ?

Non. La déduplication est incrémentale : commencez par l’auto-merge sur les usages évidents, puis affinez.

Quels CRM sont compatibles ?

Tout CRM sachant exporter/importer un CSV (HubSpot, Salesforce, etc.)

Datablist peut-il se connecter directement à l’API du CRM ?

Pas encore, import/export CSV uniquement pour le moment.