Deduplicación de leads es parte de una buena rutina de higiene de datos. Tener duplicados afecta la calidad de los datos de sus leads. La productividad de ventas cae y el problema solo crece hasta que empieza a deduplicar leads con regularidad.
Si quiere limpiar su base de datos de leads antes de migrarla a un nuevo CRM o si quiere depurar su CRM actual, esta guía le ayudará a fusionar sus leads duplicados.
Los CRMs como Salesforce o HubSpot tienen funciones nativas de deduplicación, pero son limitadas. Detectan contactos redundantes, pero el proceso de fusión consume tiempo. Las coincidencias exactas se fusionan automáticamente, mientras que los valores en conflicto requieren una fusión manual uno a uno.
Datablist es perfecto para manipular datos en grandes listados. Duplicates Finder detecta registros duplicados y tiene una potente función de fusión automática para unir leads duplicados sin perder datos. Las coincidencias exactas se eliminan y los valores en conflicto se combinan. El algoritmo único de Datablist consolida sus Notes, Emails o Phone Numbers en conflicto en un único registro de lead.
En esta guía paso a paso, aprenderá:
- Cómo encontrar leads duplicados automáticamente
- Cómo deduplicar leads automáticamente
- Cómo fusionar manualmente los leads duplicados restantes
- Cómo actualizar su CRM con la lista de leads limpia
- Cómo exportar grupos duplicados a un archivo Excel para procesamiento externo
Notas: Esta guía trata sobre Lead Deduplication. Pero el proceso es similar para cualquier lista de registros: Contacts, Companies, Products, etc. que quiera deduplicar.
Encontrar leads duplicados
Para empezar, importe su base de datos de leads en Datablist.
Con Datablist, los datos se organizan en collections. Una collection almacena una lista de registros que comparten el mismo modelo de datos. Debe importar sus leads desde archivos externos. Datablist admite archivos CSV y Excel. Haga clic en "Import CSV/Excel" y seleccione el archivo con su lista de leads.
Haga clic en + para crear una nueva collection. Póngale un nombre (y un icono 🚀). O haga clic en "Start with a CSV/Excel file" desde la pantalla de inicio.
Después, vaya a la pantalla "Properties". Este paso muestra las columnas detectadas al analizar el archivo CSV. Datablist revisa cada columna para identificar el tipo de dato adecuado. Por ejemplo, las direcciones de email y las URLs se detectan automáticamente.
Seleccione manualmente el tipo de dato cuando sea necesario. Desactive la importación si tiene columnas CSV que no deban importarse.
El siguiente paso de importación muestra una vista previa del contenido de su archivo. Haga clic en "Import {x} items" para lanzar el proceso de importación.
Si sus leads están repartidos en varios archivos, impórtelos todos en una única collection. Cuando su collection ya tiene datos, durante la importación verá un paso de mapeo para alinear sus columnas CSV con las properties existentes de la collection.
Ahora que su base de leads está cargada en una collection de Datablist, haga clic en "Duplicates Finder" en el encabezado para ejecutar un análisis de duplicados.
Seleccione cómo deben compararse sus leads para iniciar el proceso de deduplicación. Hay dos modos disponibles:
- All Properties: dos registros se considerarán duplicados si coinciden exactamente en todas sus property values.
- Selected Properties: los registros se comprobarán en properties específicas.
Notas: En Datablist, el término "Property" es sinónimo de Field o Column en otros sistemas.
Para deduplicar leads, seleccione "Selected Properties".
Ahora elija qué identificador(es) es único para un lead. Puede ser la dirección de email para personas o la URL de la empresa para negocios.
Luego haga clic en "Next". Verá una etapa de revisión. Haga clic en "Run duplicates check" para ejecutar el análisis.
Importante
- El análisis es de solo lectura. No se modificará ningún dato hasta la siguiente fase, cuando se fusionen los leads.
- Datablist compara textos con un algoritmo que no distingue mayúsculas/minúsculas. Si dos valores son similares pero con diferentes mayúsculas, se listarán como leads duplicados.
Deduplicar leads automáticamente
El Duplicates Finder de Datablist ofrece dos mecanismos para eliminar leads duplicados: automáticamente y manualmente. Para fusionar sus leads duplicados, empiece con Auto Merge y luego resuelva manualmente los registros restantes.
Auto Merge funciona con 3 algoritmos:
- Merge non-conflicting leads: ejecuta un "smart merge". Fusiona registros con valores similares o complementarios.
- Combine conflicting values: combina valores de texto de properties en conflicto usando un delimitador.
- Drop conflicting values: conserva el valor del elemento maestro y elimina los demás valores en conflicto para unificar los leads en un único registro.
Los algoritmos de fusionado y combinación son seguros. Los datos de todos los leads duplicados se conservan durante la fusión. Pero drop conflicting values elimina todos los valores salvo uno para una property concreta.
Así es como funciona cada algoritmo:
Merging non-conflicting leads
email | First Name | Last Name
james@gmail.com | James
james@gmail.com | | Bond
Se fusionará en:
email | First Name | Last Name
james@gmail.com | James | Bond
Combining the Phone
property with a semi-colon
email | Phone | First Name | Last Name
james@gmail.com | +33 1 34 65 23 | James |
james@gmail.com | 06 13 42 78 23 | | Bond
Se fusionará en:
email | Phone | First Name | Last Name
james@gmail.com | +33 1 34 65 23;06 13 42 78 23 | James | Bond
Drop conflicting values on AccountId
AccountId | email | First Name | Last Name | Job Title
934DSFG39FGDS | james@gmail.com | James | |
ODFJSDK123aSD | james@gmail.com | | Bond | CEO
Se fusionará en:
AccountId | email | First Name | Last Name | Job Title
ODFJSDK123aSD | james@gmail.com | James | Bond | CEO
Cómo configurar Auto Merge para fusionar leads
Los 3 algoritmos cubren la mayoría de casos de deduplicación de leads.
Para deduplicar su listado de leads:
- Use la opción de combinar valores para properties de texto como
Notes
,Phone Number
,Email Address
. - Use drop conflicting values para:
- Properties técnicas como
Account Id
que requieren un único valor. - Properties que son "Relation". Por ejemplo,
Lead owner
,Account
. - Properties no textuales que no se pueden combinar. Por ejemplo, fechas como
Last Activity
,Contacted on
, y checkboxes.
- Properties técnicas como
Importante: Consulte Actualizar su CRM con la lista de leads limpia para reimportar los datos en su CRM.
Por favor, contáctenos si tiene preguntas sobre la función Auto Merge.
Fusionar manualmente los leads duplicados restantes
Use el Merging Assistant de Datablist para fusionar manualmente los leads duplicados restantes.
Desplácese a la sección "Or merge duplicate items manually" para ver sus registros duplicados pendientes.
A la izquierda de cada grupo de leads duplicados, el botón "Merge Items" abre el Merging Assistant.
Se abre la herramienta de fusión. A la derecha, Datablist selecciona el registro con más datos como "Primary item". A la izquierda, los leads duplicados restantes se llaman "Secondary Items".
Cuando es posible, los valores de las properties de los secondary items se seleccionan automáticamente para fusionarse en el primary item. Si varios valores entran en conflicto, tendrá que decidir qué valor conservar.
Si el "Primary item" resultante le convence, haga clic en el botón Merge para confirmar la fusión. Todos los secondary leads se eliminarán para conservar un único registro combinado de lead.
También puede editar o eliminar sus leads duplicados directamente desde este listado.
Actualizar su CRM con la lista de leads limpia
Gestionar varios valores en una sola celda
Datablist combina valores en una sola celda. Puede terminar con un listado en el que varios valores estén unidos por un delimitador.
Por ejemplo, una property Phone
fusionada:
email | Phone | First Name | Last Name
james@gmail.com | +33 1 34 65 23;06 13 42 78 23 | James | Bond
Si su CRM usa varios campos para almacenar números de teléfono, querrá procesar sus leads para separar esos valores. Un mejor registro sería:
email | Phone 1 | Phone 2 | First Name | Last Name
james@gmail.com | +33 1 34 65 23 | 06 13 42 78 23 | James | Bond
Para gestionar esta transformación, puede:
- Usar la función "Split Property" de Datablist para crear varias properties a partir de datos multivalor
- O ejecutar un script directamente en Datablist para realizar esta división.
- O exportar su listado de leads a un archivo Excel y posprocesarlo con Excel o Google Sheets.
Cómo usar Split Property para dividir datos multivalor en varias propiedades
Datablist incorpora una herramienta para dividir el texto de una property en nuevas properties. Es perfecta para tratar resultados combinados del algoritmo de deduplicación.
Abra la herramienta haciendo clic en "Split Property" en el menú "Edit".
Seleccione la property con valores múltiples. Y elija el mismo delimitador que usó al combinar.
El último ajuste define cuántas partes se crearán. Debe coincidir con el número máximo de valores que puede tener una sola celda. Para direcciones de email y números de teléfono, este número suele ser dos o tres.
Antes de procesar sus datos, Datablist muestra una vista previa del resultado. Compruebe que los datos divididos corresponden a lo esperado. Luego haga clic en "Split Property" para procesar todos sus datos.
Tras el procesamiento, su property inicial no cambia y se crean nuevas properties para almacenar los textos divididos. Cámbieles el nombre para que coincidan con las columnas de importación de su CRM.
Dividir valores por delimitador con un script JavaScript en Datablist
Para divisiones más complejas o si necesita manipulaciones adicionales, Datablist tiene una herramienta potente para ejecutar código JavaScript sobre sus datos. Esta herramienta se puede usar para dividir su texto en varias properties.
Primero, cree propiedades adicionales para almacenar sus valores múltiples si aún no existen. Cree Phone 2
, Phone 3
o Email 2
, Email 3
, que almacenarán un solo valor tras la división.
Luego, haga clic en "Run Javascript" en el menú "Edit" para abrir el editor de scripts.
Adapte el siguiente script a sus properties:
function runOnItem(item){
if(!item.phone) return null;
var parts = item.phone.split(';');
if(parts.length===1) return null;
return {
phone1: parts[0],
phone2: parts[1]
}
}
Nota: Procese cada property combinada por separado. Si tiene una property con números de teléfono y otra con direcciones de email, primero procese la de teléfono con un script y luego ejecute un segundo para los emails.
Aquí tiene un ejemplo de código que divide el contenido de una property con la clave phone1
. La división se hace con un semicolon
. Y los teléfonos resultantes se guardan en 2 properties: phone1
y extraphone
.
Por favor, contáctenos si tiene preguntas sobre cómo escribir el script.
Exportar grupos duplicados a Excel o CSV
En cualquier momento de su proceso de deduplicación, puede exportar los duplicados restantes. Datablist exporta datos en Excel o archivos CSV.
Exporte los duplicados cuando quiera limpiarlos manualmente con Excel o subcontratar la tarea a un proveedor externo.
FAQ
¿Qué es la Lead Deduplication?
Lead Deduplication, o lead deduping, es el proceso de encontrar y fusionar registros duplicados para tener una lista limpia de entradas únicas.
Un lead representa a una persona o a una empresa. Un lead duplicado es cuando existen varios registros para la misma persona o empresa.
Los leads duplicados aparecen cuando tiene varias fuentes de leads que alimentan una sola lista. Ejemplos de fuentes: lead magnets, webinars, newsletters o entradas manuales.
¿Por qué es importante la deduplicación en el CRM?
La deduplicación en el CRM es vital para mantener datos de clientes precisos, fiables y completos. Es crucial por varias razones:
-
Precisión de datos: al fusionar duplicados, su equipo confía en una única fuente fiable de datos de cliente. Entradas múltiples para el mismo cliente generan tareas redundantes, como comunicaciones duplicadas, seguimientos o solicitudes de soporte.
-
Insights de cliente: los registros duplicados distorsionan el análisis y los informes. La deduplicación permite obtener insights precisos eliminando duplicados que sesgan métricas como adquisición, conversión o lifetime value.
-
Ahorro de costes: mantener registros duplicados en un CRM puede generar costes innecesarios.
-
Gobierno y cumplimiento: los registros duplicados pueden comprometer el gobierno del dato y el cumplimiento, especialmente con normativas como el RGPD. Al deduplicar, las empresas aseguran el cumplimiento, mantienen la privacidad y protegen la información frente a accesos no autorizados o uso indebido.
¿En qué se diferencia de la deduplicación en Salesforce y HubSpot?
En Salesforce, puede configurar matching rules para detectar duplicados. Cuando se encuentran duplicados, los leads idénticos se fusionan automáticamente. Pero Salesforce y HubSpot no pueden fusionar automáticamente leads con valores en conflicto. Un asistente de fusión manual le deja unir leads uno por uno. Para listados grandes, herramientas de deduplicación automática como Datablist le ahorrarán tiempo en su proceso de dedupe.
¿Cómo compara Datablist los valores para encontrar duplicados?
Antes de fusionar, Datablist ejecuta un algoritmo para detectar leads duplicados. Este algoritmo compara registros de dos formas: una comparación completa para encontrar leads que tienen los mismos valores en todos sus campos; y una comparación basada en uno o varios campos seleccionados.
Ejecutar el Duplicate Finder sobre un campo seleccionado es lo recomendado para la deduplicación de leads. Seleccione solo el campo que identifica a un lead. Una dirección de email o el sitio web de la empresa son buenos identificadores.
El algoritmo de deduplicación ignora las mayúsculas/minúsculas. No afectan al resultado.
¿Se pueden combinar todas las propiedades de un lead?
Solo puede combinar properties basadas en texto. El algoritmo de combinación usa un delimitador de cadena para unir varios valores. Todos los tipos que heredan de texto son compatibles: Text
, LongText
, Email
, Url
, etc. Pero Checkbox
, Number
y Datetime
no son compatibles y se ignoran durante la combinación.
Use el asistente de fusión manual o la opción de drop conflicting values para unirlos.
¿Cómo tratar los valores en conflicto que no quiero combinar?
Use la opción Drop conflicting values para fusionar leads duplicados sin combinar valores. Es útil para properties Checkbox
, Number
y Datetime
que no pueden combinarse.
¿Cómo mover valores en conflicto a otras propiedades?
Para mover valores en conflicto a otra property, divida el proceso en dos pasos:
- Fusione los valores en conflicto en una sola property usando un delimitador.
- Después, divida los valores múltiples con un delimitador en dos o más properties.
Vea gestionar varios valores en una sola celda para una guía paso a paso.
¿Cuántos leads puedo procesar?
El Duplicates Finder de Datablist funciona con listados grandes que contienen cientos de miles de registros. Para un mejor rendimiento, ejecute el algoritmo en un portátil u ordenador de escritorio. Navegadores modernos como Google Chrome, Apple Safari y Mozilla Firefox serán más rápidos que Microsoft Edge.
¿Cuánto tarda el proceso de deduplicación?
La deduplicación es casi instantánea. Para listas grandes con cientos de miles de registros, tardará unos segundos.
No tiene que esperar horas para ver los resultados. Una buena práctica es clonar su collection antes de ejecutar los algoritmos de fusión. Si el resultado no le convence, empiece de nuevo usando la collection clonada.
¿Debo resolver todos los conflictos de duplicados?
No. Los items de su collection se actualizan en cada operación de deduplicación. Puede deduplicar de forma incremental. Empiece con auto-merge para coincidencias exactas, visualice los duplicados restantes, configure reglas de combinación, etc., hasta eliminar todos los duplicados.
¿Qué CRMs son compatibles con Datablist Duplicate Finder?
Datablist trabaja con archivos CSV. Cualquier CRM que ofrezca exportación e importación en CSV es compatible. Puede deduplicar sus leads de HubSpot CRM o Salesforce CRM fácilmente, ya que ambos permiten exportar e importar CSV.
¿Puede Datablist conectarse directamente al API del CRM para deduplicar leads?
Aún no. Por ahora, los leads deben importarse a Datablist manualmente con archivos externos. Los archivos CSV y Excel son los métodos recomendados para importar sus leads en Datablist.