Deduplicación de leads es parte de una buena rutina de higiene de datos. Tener duplicados afecta la calidad de los datos de sus leads. La productividad de ventas cae y el problema solo crece hasta que empieza a deduplicar leads con regularidad.

Si quiere limpiar su base de datos de leads antes de migrarla a un nuevo CRM o si quiere depurar su CRM actual, esta guía le ayudará a fusionar sus leads duplicados.

Los CRMs como Salesforce o HubSpot tienen funciones nativas de deduplicación, pero son limitadas. Detectan contactos redundantes, pero el proceso de fusión consume tiempo. Las coincidencias exactas se fusionan automáticamente, mientras que los valores en conflicto requieren una fusión manual uno a uno.

Datablist es perfecto para manipular datos en grandes listados. Duplicates Finder detecta registros duplicados y tiene una potente función de fusión automática para unir leads duplicados sin perder datos. Las coincidencias exactas se eliminan y los valores en conflicto se combinan. El algoritmo único de Datablist consolida sus Notes, Emails o Phone Numbers en conflicto en un único registro de lead.

En esta guía paso a paso, aprenderá:

Notas: Esta guía trata sobre Lead Deduplication. Pero el proceso es similar para cualquier lista de registros: Contacts, Companies, Products, etc. que quiera deduplicar.

Encontrar leads duplicados

Para empezar, importe su base de datos de leads en Datablist.

Con Datablist, los datos se organizan en collections. Una collection almacena una lista de registros que comparten el mismo modelo de datos. Debe importar sus leads desde archivos externos. Datablist admite archivos CSV y Excel. Haga clic en "Import CSV/Excel" y seleccione el archivo con su lista de leads.

Haga clic en + para crear una nueva collection. Póngale un nombre (y un icono 🚀). O haga clic en "Start with a CSV/Excel file" desde la pantalla de inicio.

Create collection shortcut
Create collection shortcut

Después, vaya a la pantalla "Properties". Este paso muestra las columnas detectadas al analizar el archivo CSV. Datablist revisa cada columna para identificar el tipo de dato adecuado. Por ejemplo, las direcciones de email y las URLs se detectan automáticamente.

Seleccione manualmente el tipo de dato cuando sea necesario. Desactive la importación si tiene columnas CSV que no deban importarse.

CSV Column Mapping
CSV Column Mapping

El siguiente paso de importación muestra una vista previa del contenido de su archivo. Haga clic en "Import {x} items" para lanzar el proceso de importación.

Si sus leads están repartidos en varios archivos, impórtelos todos en una única collection. Cuando su collection ya tiene datos, durante la importación verá un paso de mapeo para alinear sus columnas CSV con las properties existentes de la collection.


Ahora que su base de leads está cargada en una collection de Datablist, haga clic en "Duplicates Finder" en el encabezado para ejecutar un análisis de duplicados.

Start Duplicates Finder
Start Duplicates Finder

Seleccione cómo deben compararse sus leads para iniciar el proceso de deduplicación. Hay dos modos disponibles:

  • All Properties: dos registros se considerarán duplicados si coinciden exactamente en todas sus property values.
  • Selected Properties: los registros se comprobarán en properties específicas.

Notas: En Datablist, el término "Property" es sinónimo de Field o Column en otros sistemas.

Para deduplicar leads, seleccione "Selected Properties".

Select Merging Mode
Select Merging Mode

Ahora elija qué identificador(es) es único para un lead. Puede ser la dirección de email para personas o la URL de la empresa para negocios.

Select a unique identifier for your lead records
Select a unique identifier for your lead records

Luego haga clic en "Next". Verá una etapa de revisión. Haga clic en "Run duplicates check" para ejecutar el análisis.

Importante

  • El análisis es de solo lectura. No se modificará ningún dato hasta la siguiente fase, cuando se fusionen los leads.
  • Datablist compara textos con un algoritmo que no distingue mayúsculas/minúsculas. Si dos valores son similares pero con diferentes mayúsculas, se listarán como leads duplicados.

Deduplicar leads automáticamente

El Duplicates Finder de Datablist ofrece dos mecanismos para eliminar leads duplicados: automáticamente y manualmente. Para fusionar sus leads duplicados, empiece con Auto Merge y luego resuelva manualmente los registros restantes.

Auto Merge funciona con 3 algoritmos:

  • Merge non-conflicting leads: ejecuta un "smart merge". Fusiona registros con valores similares o complementarios.
  • Combine conflicting values: combina valores de texto de properties en conflicto usando un delimitador.
  • Drop conflicting values: conserva el valor del elemento maestro y elimina los demás valores en conflicto para unificar los leads en un único registro.
Auto Merge Algorithms
Auto Merge Algorithms

Los algoritmos de fusionado y combinación son seguros. Los datos de todos los leads duplicados se conservan durante la fusión. Pero drop conflicting values elimina todos los valores salvo uno para una property concreta.

Así es como funciona cada algoritmo:

Merging non-conflicting leads

email            |     First Name   |    Last Name
james@gmail.com  |     James
james@gmail.com  |                  |     Bond

Se fusionará en:

email            |     First Name   |    Last Name
james@gmail.com  |     James        |     Bond

Combining the Phone property with a semi-colon

email            |       Phone       |     First Name   |    Last Name    
james@gmail.com  |  +33 1 34 65 23   |      James       |                 
james@gmail.com  |  06 13 42 78 23   |                  |     Bond        

Se fusionará en:

email            |   Phone                         |     First Name   |    Last Name
james@gmail.com  |  +33 1 34 65 23;06 13 42 78 23  |     James        |     Bond    

Drop conflicting values on AccountId

AccountId        |       email          |     First Name   |    Last Name    |  Job Title
934DSFG39FGDS    |     james@gmail.com  |      James       |                 |
ODFJSDK123aSD    |     james@gmail.com  |                  |     Bond        |    CEO

Se fusionará en:

AccountId        | email            |     First Name   |    Last Name    |  Job Title
ODFJSDK123aSD    | james@gmail.com  |     James        |     Bond        |     CEO

Cómo configurar Auto Merge para fusionar leads

Los 3 algoritmos cubren la mayoría de casos de deduplicación de leads.

Para deduplicar su listado de leads:

  • Use la opción de combinar valores para properties de texto como Notes, Phone Number, Email Address.
  • Use drop conflicting values para:
    • Properties técnicas como Account Id que requieren un único valor.
    • Properties que son "Relation". Por ejemplo, Lead owner, Account.
    • Properties no textuales que no se pueden combinar. Por ejemplo, fechas como Last Activity, Contacted on, y checkboxes.

Importante: Consulte Actualizar su CRM con la lista de leads limpia para reimportar los datos en su CRM.

Por favor, contáctenos si tiene preguntas sobre la función Auto Merge.

Fusionar manualmente los leads duplicados restantes

Use el Merging Assistant de Datablist para fusionar manualmente los leads duplicados restantes.

Desplácese a la sección "Or merge duplicate items manually" para ver sus registros duplicados pendientes.

A la izquierda de cada grupo de leads duplicados, el botón "Merge Items" abre el Merging Assistant.

Merge duplicates
Merge duplicates

Se abre la herramienta de fusión. A la derecha, Datablist selecciona el registro con más datos como "Primary item". A la izquierda, los leads duplicados restantes se llaman "Secondary Items".

Merging Assistant
Merging Assistant

Cuando es posible, los valores de las properties de los secondary items se seleccionan automáticamente para fusionarse en el primary item. Si varios valores entran en conflicto, tendrá que decidir qué valor conservar.

Si el "Primary item" resultante le convence, haga clic en el botón Merge para confirmar la fusión. Todos los secondary leads se eliminarán para conservar un único registro combinado de lead.

También puede editar o eliminar sus leads duplicados directamente desde este listado.

Actualizar su CRM con la lista de leads limpia

Gestionar varios valores en una sola celda

Datablist combina valores en una sola celda. Puede terminar con un listado en el que varios valores estén unidos por un delimitador.

Por ejemplo, una property Phone fusionada:

email            |   Phone                         |     First Name   |    Last Name
james@gmail.com  |  +33 1 34 65 23;06 13 42 78 23  |     James        |     Bond    

Si su CRM usa varios campos para almacenar números de teléfono, querrá procesar sus leads para separar esos valores. Un mejor registro sería:

email            |   Phone 1          |   Phone 2          |     First Name   |    Last Name
james@gmail.com  |  +33 1 34 65 23    |   06 13 42 78 23   |     James        |     Bond    

Para gestionar esta transformación, puede:

  • Usar la función "Split Property" de Datablist para crear varias properties a partir de datos multivalor
  • O ejecutar un script directamente en Datablist para realizar esta división.
  • O exportar su listado de leads a un archivo Excel y posprocesarlo con Excel o Google Sheets.
Cómo usar Split Property para dividir datos multivalor en varias propiedades

Datablist incorpora una herramienta para dividir el texto de una property en nuevas properties. Es perfecta para tratar resultados combinados del algoritmo de deduplicación.

Abra la herramienta haciendo clic en "Split Property" en el menú "Edit".

Open Split Property tool
Open Split Property tool

Seleccione la property con valores múltiples. Y elija el mismo delimitador que usó al combinar.

Split Property - Select Delimiter
Split Property - Select Delimiter

El último ajuste define cuántas partes se crearán. Debe coincidir con el número máximo de valores que puede tener una sola celda. Para direcciones de email y números de teléfono, este número suele ser dos o tres.

Split Property - Number of properties
Split Property - Number of properties

Antes de procesar sus datos, Datablist muestra una vista previa del resultado. Compruebe que los datos divididos corresponden a lo esperado. Luego haga clic en "Split Property" para procesar todos sus datos.

Split Property - Preview
Split Property - Preview

Tras el procesamiento, su property inicial no cambia y se crean nuevas properties para almacenar los textos divididos. Cámbieles el nombre para que coincidan con las columnas de importación de su CRM.

Split Property - Results
Split Property - Results
Dividir valores por delimitador con un script JavaScript en Datablist

Para divisiones más complejas o si necesita manipulaciones adicionales, Datablist tiene una herramienta potente para ejecutar código JavaScript sobre sus datos. Esta herramienta se puede usar para dividir su texto en varias properties.

Primero, cree propiedades adicionales para almacenar sus valores múltiples si aún no existen. Cree Phone 2, Phone 3 o Email 2, Email 3, que almacenarán un solo valor tras la división.

Create Properties - Step 1
Create Properties - Step 1
Create Properties - Step 2
Create Properties - Step 2

Luego, haga clic en "Run Javascript" en el menú "Edit" para abrir el editor de scripts.

Run Javascript
Run Javascript

Adapte el siguiente script a sus properties:

function runOnItem(item){
  if(!item.phone) return null;

  var parts = item.phone.split(';');

  if(parts.length===1) return null;

  return {
    phone1: parts[0],
    phone2: parts[1]
  }
}

Nota: Procese cada property combinada por separado. Si tiene una property con números de teléfono y otra con direcciones de email, primero procese la de teléfono con un script y luego ejecute un segundo para los emails.

Aquí tiene un ejemplo de código que divide el contenido de una property con la clave phone1. La división se hace con un semicolon. Y los teléfonos resultantes se guardan en 2 properties: phone1 y extraphone.

Javascript code to split on semicolon
Javascript code to split on semicolon

Por favor, contáctenos si tiene preguntas sobre cómo escribir el script.

Exportar grupos duplicados a Excel o CSV

En cualquier momento de su proceso de deduplicación, puede exportar los duplicados restantes. Datablist exporta datos en Excel o archivos CSV.

Exporte los duplicados cuando quiera limpiarlos manualmente con Excel o subcontratar la tarea a un proveedor externo.

Export deduplication results
Export deduplication results

FAQ

¿Qué es la Lead Deduplication?

Lead Deduplication, o lead deduping, es el proceso de encontrar y fusionar registros duplicados para tener una lista limpia de entradas únicas.

Un lead representa a una persona o a una empresa. Un lead duplicado es cuando existen varios registros para la misma persona o empresa.

Los leads duplicados aparecen cuando tiene varias fuentes de leads que alimentan una sola lista. Ejemplos de fuentes: lead magnets, webinars, newsletters o entradas manuales.

¿Por qué es importante la deduplicación en el CRM?

La deduplicación en el CRM es vital para mantener datos de clientes precisos, fiables y completos. Es crucial por varias razones:

  • Precisión de datos: al fusionar duplicados, su equipo confía en una única fuente fiable de datos de cliente. Entradas múltiples para el mismo cliente generan tareas redundantes, como comunicaciones duplicadas, seguimientos o solicitudes de soporte.

  • Insights de cliente: los registros duplicados distorsionan el análisis y los informes. La deduplicación permite obtener insights precisos eliminando duplicados que sesgan métricas como adquisición, conversión o lifetime value.

  • Ahorro de costes: mantener registros duplicados en un CRM puede generar costes innecesarios.

  • Gobierno y cumplimiento: los registros duplicados pueden comprometer el gobierno del dato y el cumplimiento, especialmente con normativas como el RGPD. Al deduplicar, las empresas aseguran el cumplimiento, mantienen la privacidad y protegen la información frente a accesos no autorizados o uso indebido.

¿En qué se diferencia de la deduplicación en Salesforce y HubSpot?

En Salesforce, puede configurar matching rules para detectar duplicados. Cuando se encuentran duplicados, los leads idénticos se fusionan automáticamente. Pero Salesforce y HubSpot no pueden fusionar automáticamente leads con valores en conflicto. Un asistente de fusión manual le deja unir leads uno por uno. Para listados grandes, herramientas de deduplicación automática como Datablist le ahorrarán tiempo en su proceso de dedupe.

¿Cómo compara Datablist los valores para encontrar duplicados?

Antes de fusionar, Datablist ejecuta un algoritmo para detectar leads duplicados. Este algoritmo compara registros de dos formas: una comparación completa para encontrar leads que tienen los mismos valores en todos sus campos; y una comparación basada en uno o varios campos seleccionados.

Ejecutar el Duplicate Finder sobre un campo seleccionado es lo recomendado para la deduplicación de leads. Seleccione solo el campo que identifica a un lead. Una dirección de email o el sitio web de la empresa son buenos identificadores.

El algoritmo de deduplicación ignora las mayúsculas/minúsculas. No afectan al resultado.

¿Se pueden combinar todas las propiedades de un lead?

Solo puede combinar properties basadas en texto. El algoritmo de combinación usa un delimitador de cadena para unir varios valores. Todos los tipos que heredan de texto son compatibles: Text, LongText, Email, Url, etc. Pero Checkbox, Number y Datetime no son compatibles y se ignoran durante la combinación.

Use el asistente de fusión manual o la opción de drop conflicting values para unirlos.

¿Cómo tratar los valores en conflicto que no quiero combinar?

Use la opción Drop conflicting values para fusionar leads duplicados sin combinar valores. Es útil para properties Checkbox, Number y Datetime que no pueden combinarse.

¿Cómo mover valores en conflicto a otras propiedades?

Para mover valores en conflicto a otra property, divida el proceso en dos pasos:

  • Fusione los valores en conflicto en una sola property usando un delimitador.
  • Después, divida los valores múltiples con un delimitador en dos o más properties.

Vea gestionar varios valores en una sola celda para una guía paso a paso.

¿Cuántos leads puedo procesar?

El Duplicates Finder de Datablist funciona con listados grandes que contienen cientos de miles de registros. Para un mejor rendimiento, ejecute el algoritmo en un portátil u ordenador de escritorio. Navegadores modernos como Google Chrome, Apple Safari y Mozilla Firefox serán más rápidos que Microsoft Edge.

¿Cuánto tarda el proceso de deduplicación?

La deduplicación es casi instantánea. Para listas grandes con cientos de miles de registros, tardará unos segundos.

No tiene que esperar horas para ver los resultados. Una buena práctica es clonar su collection antes de ejecutar los algoritmos de fusión. Si el resultado no le convence, empiece de nuevo usando la collection clonada.

¿Debo resolver todos los conflictos de duplicados?

No. Los items de su collection se actualizan en cada operación de deduplicación. Puede deduplicar de forma incremental. Empiece con auto-merge para coincidencias exactas, visualice los duplicados restantes, configure reglas de combinación, etc., hasta eliminar todos los duplicados.

¿Qué CRMs son compatibles con Datablist Duplicate Finder?

Datablist trabaja con archivos CSV. Cualquier CRM que ofrezca exportación e importación en CSV es compatible. Puede deduplicar sus leads de HubSpot CRM o Salesforce CRM fácilmente, ya que ambos permiten exportar e importar CSV.

¿Puede Datablist conectarse directamente al API del CRM para deduplicar leads?

Aún no. Por ahora, los leads deben importarse a Datablist manualmente con archivos externos. Los archivos CSV y Excel son los métodos recomendados para importar sus leads en Datablist.