Les doublons de noms d'entreprise, c'est un cauchemar. Ils encombrent votre CRM, faussent vos rapports et compliquent le suivi client.

Mais corriger tout ça à la main ? Encore pire. Bonne nouvelle : il existe bien plus simple.

Dans ce guide, découvrez comment trouver et fusionner rapidement les doublons de noms d'entreprise dans vos fichiers CSV/Excel ou votre CRM. Vous apprendrez à :

Mettez enfin de l'ordre dans vos données !

Étape 1 : Importez votre liste de noms d'entreprise

Commencez par importer votre liste de noms d'entreprise dans Datablist.

Créer une nouvelle collection
Créer une nouvelle collection

Une fois le fichier importé, vérifiez vos données pour vous assurer que les noms d'entreprise et les autres champs s'affichent correctement.

Aperçu des données de noms entreprise
Aperçu des données de noms entreprise

Étape 2 : Identifiez les doublons avec des algorithmes

Utilisez le Duplicate Finder de Datablist pour déceler les entreprises au nom similaire.

Ouvrir l’outil Duplicates Finder
Ouvrir l’outil Duplicates Finder

Sélectionnez la colonne contenant les noms d’entreprise comme champ cible.

Sélection du champ Nom de l’Entreprise
Sélection du champ Nom de l’Entreprise

Choisissez ensuite le meilleur algorithme pour dédoublonner :

  • Smart Algorithm : Idéal pour les doublons exacts (après normalisation).
Utiliser le Smart Matching Algorithm
Utiliser le Smart Matching Algorithm
  • Distance Algorithm : Détecte les noms très proches ou sujets à des fautes de frappe. Définissez un seuil de similarité (par défaut 80, minimum 50).
Régler le seuil Distance Matching
Régler le seuil Distance Matching

Lancez l'analyse pour identifier les entrées en doublon.

Le fonctionnement du Company Name Processor

Le Company Name Processor est une fonctionnalité spéciale qui normalise les noms d'entreprise avant la détection des doublons. C'est crucial, car on retrouve souvent plein de variantes d’un même nom dans les bases de données.

À quoi ça sert ?

  • Enlève les suffixes juridiques : LLC, Inc., Ltd, etc.
  • Ignore les termes géographiques : Europe, USA, UK, etc.
  • Retire les mots-clés business : Partners, Group, Technologies, etc.

Exemple :

Nom originalNom normalisé
Apple Inc.Apple
Apple USA LLCApple
Apple TechnologiesApple
Microsoft CorporationMicrosoft
Microsoft Ltd. UKMicrosoft

Ainsi, "Apple Inc." et "Apple Technologies" sont repérés comme doublons, même si leur nom n’est pas strictement identique.

Étape 3 : Fusionnez les fiches entreprise en double

Les doublons détectés sont regroupés ensemble.

Revue des groupes de doublons
Revue des groupes de doublons

Note : Si vous souhaitez simplement la liste des doublons, vous pouvez exporter les résultats correspondants. Pour fusionner effectivement les doublons, poursuivez ci-dessous.

Gérer les conflits

Un champ en conflit indique des valeurs différentes pour un même attribut dans les fiches en doublon.

Lorsque c'est le cas, il faut définir comment fusionner les données.

Datablist propose deux options de fusion :

  • Combiner les valeurs : Agrège toutes les valeurs issues des doublons dans un seul et même champ de la fiche principale (pratique pour les n° de téléphone par ex.).
  • En garder une seule et supprimer les autres : Choisissez simplement une valeur à conserver, les autres (issues des doublons) sont supprimées, utile pour l'adresse la plus complète par exemple.

Un raccourci permet d'appliquer le même comportement à tous les champs en conflit.

Définir les règles de fusion
Définir les règles de fusion

Choisir la fiche principale

Une fiche sera désignée comme "maître" et toutes les autres seront fusionnées à l’intérieur.

Plusieurs méthodes sont proposées :

  • La plus complète : Fiche avec le plus de champs renseignés.
  • La plus récente : Fiche modifiée en dernier.
  • La plus ancienne : Basée sur la date de création la plus basse.
  • La plus grande valeur : Pour un champ (nombre de contrats, CA...), priorise la valeur la plus élevée (en cas d’égalité : la plus récente l’emporte).
  • La plus petite valeur : Inverse du critère précédent.
  • Valeur correspondante : Une fiche contenant une valeur spécifique dans un champ donné est choisie. Les autres fiches ne seront pas fusionnées si elles ne contiennent pas cette valeur exacte.

Après avoir configuré les règles de fusion et la sélection du maître, rafraîchissez l’aperçu pour voir comment sera réalisée la fusion avant validation.

Rafraîchir l’aperçu de la fusion
Rafraîchir l’aperçu de la fusion

Vous voyez alors quelles valeurs seront supprimées, combinées, et laquelle deviendra la fiche principale.

Aperçu des résultats de la fusion
Aperçu des résultats de la fusion

Vous pouvez aussi fusionner manuellement certains groupes spécifiques si besoin.

Lancez la fusion automatique des doublons quand elle est possible (via le bouton adapté, par ex : "Auto-merge duplicates when possible").

Terminer la fusion
Terminer la fusion

Une fois la fusion terminée, vos données sont propres et prêtes à l’export.

Pour exporter la liste dédoublonnée, cliquez sur le bouton "Export" en haut de l’application. Export CSV ou Excel possible.

Exporter la liste nettoyée
Exporter la liste nettoyée

Conclusion

Nettoyer les doublons de noms d’entreprise, ce n’est plus mission impossible !

Avec de bons outils et la bonne méthode :

  • Vous évitez les incohérences de données
  • Vous améliorez la performance de votre CRM
  • Vous gagnez de précieuses heures de ressaisie

Lancez-vous dès aujourd’hui et gardez enfin votre base sociétés organisée !