Los datos duplicados son un dolor de cabeza. Exporta desde su CRM o recibe listados de productos de distintos proveedores y, zas: los mismos ítems aparecen varias veces. Quiere limpiar el desorden, pero borrar duplicados no basta. ¿Y si algunas filas tienen existencias o importes de ventas? No quiere perder esos números. Quiere fusionarlos y sumarlos.
Ahí es donde entra Datablist Duplicates Finder. Puede fusionar duplicados y sumar sus números. Como por arte de magia.
Imagine fusionar varias fichas de producto y obtener automáticamente el stock total, ¡todo con una simple instrucción!
Esta guía le muestra, paso a paso, cómo sumar valores numéricos al fusionar duplicados:
Cómo preparar sus datos
Antes de fusionar y sumar valores, necesita sus datos en Datablist. Empecemos creando una colección e importando su archivo.
Paso 1: Cree una Collection
En Datablist, las collections son donde organiza sus datos. Piénselas como hojas de cálculo inteligentes. Haga clic en el botón "+" de la barra lateral o en el acceso directo "Start with a CSV/Excel file" en la pantalla de inicio para crear una nueva.
Paso 2: Importe su archivo
Puede importar datos desde varias fuentes, pero para este ejemplo usemos un archivo CSV o Excel. Haga clic en "Import CSV/Excel" y suba su archivo.
Datablist admite archivos grandes, así que no se preocupe si tiene cientos de miles de filas.
Datablist detecta automáticamente los tipos de columna (como Text, Number, Date, Email).
⚠️ Importante: Asegúrese de que la columna que desea sumar (por ejemplo,
/Stock
) esté identificada como tipoNumber
. Si no, puede cambiarla manualmente durante la importación.
Paso 3: Revise sus datos importados
Una vez que termine la importación, eche un vistazo rápido a su collection para verificar que todo esté correcto. Debería ver sus filas y columnas listas para limpiar.
Cómo encontrar duplicados
Ahora que sus datos están cargados, encontremos esos duplicados.
Paso 4: Inicie Duplicates Finder
Vaya al menú "Clean" en el header y seleccione "Duplicates Finder".
Paso 5: Seleccione su identificador de deduplicación
Debe indicar a Datablist cómo identificar los elementos duplicados.
Elija la propiedad que identifica de forma única un ítem en su lista. Puede ser un Email
, un Product SKU
, un Company Name
, o una combinación de campos.
Para este ejemplo, supongamos que usamos Product Name
o SKU
para encontrar productos duplicados.
Paso 6: Elija algoritmo de coincidencia y Processor
A continuación, seleccione el algoritmo de comparación.
Para identificadores como SKUs o Emails, 'Exact' o 'Smart' suelen funcionar bien. El algoritmo 'Smart' tolera pequeñas variaciones, como diferentes protocolos en URLs u orden de palabras.
También puede elegir un 'Processor' para normalizar datos antes de comparar (p. ej., limpiar direcciones de email o URLs).
Haga clic en "Run duplicates check".
Paso 7: Previsualice los grupos duplicados
Datablist analizará sus datos y mostrará grupos de posibles duplicados. Revise estos grupos para confirmar que realmente son duplicados antes de pasar a la fusión.
Sumar valores con AI Processing
Aquí es donde ocurre la magia. En lugar de usar las opciones estándar de "Auto Merge", utilizaremos el modo "AI Processing" para dar instrucciones específicas, incluida la suma del campo numérico.
Paso 8: Seleccione el modo AI Processing
En la página de resultados de duplicados, haga clic en el botón "AI Editing".
Este modo le permite definir lógica de fusión personalizada con prompts en lenguaje natural.
Paso 9: Escriba su AI prompt
Este es el corazón del proceso. Va a redactar un prompt que explique cómo debe fusionar Datablist los grupos duplicados.
Su prompt necesita dos partes clave:
- Selección del registro maestro: Indique a la IA cómo elegir el registro principal (el "master") que se conservará tras la fusión. Puede usar criterios como "el registro con la fecha más reciente en
/Property
", "el más completo" o "el creado primero". - Suma de valores: Indique a la IA que sume los valores de un campo numérico específico en todos los registros del grupo (incluido el master) y coloque el total en ese mismo campo del registro master.
Use /PropertyName
o {{PropertyName}}
para referirse a columnas de su collection.
Este es un ejemplo de prompt para sumar la propiedad /Stock
eligiendo el master por la última fecha en /Date
:
Select the record with the latest date in /Date as master record.
And sum all /Stock values from all records into the /Stock property of the master record.
También puede añadir variaciones para tratar el resto de propiedades. Por ejemplo:
Select the record with the latest date in /Date as master record.
And sum all /Stock values from all records into the /Stock property of the master record.
Merge other properties using the most frequent value.
Paso 10: Finalice y genere el script
Revise su prompt. Asegúrese de haber referenciado correctamente los nombres de las columnas (como /Date
y /Stock
). Cuando esté conforme, haga clic en "Generate and preview changes".
Revisar y ejecutar el script de AI
La IA de Datablist no ejecuta su orden a ciegas. Primero genera un script en JavaScript a partir de su prompt y le muestra una vista previa.
Paso 11: Espere el procesamiento
La IA tardará un momento en interpretar su prompt y escribir el script correspondiente.
Paso 12: Revise la explicación del script
Datablist le mostrará una explicación de lo que hace el script generado. Verifique que el sistema entiende su intención.
Paso 13: Compruebe la previsualización del resultado
Más importante aún, Datablist ofrece una vista previa de cómo el script afectará a sus datos antes de ejecutarlo.
Mire el listado "Preview".
Verá el estado propuesto del registro master tras la fusión y la suma. Verifique que el campo numérico (p. ej., /Stock
) muestre la suma correcta basada en los miembros del grupo duplicado.
Paso 14: Ejemplo de vista previa con ítem master
Aquí tiene un vistazo más de cerca a la vista previa de un grupo específico. Verá que el registro master es el que tiene la fecha más reciente, tal como definimos en el prompt.
Paso 15: Ejecute el script
Si la vista previa es correcta y las sumas son las esperadas, haga clic en "Run Script". Datablist aplicará ahora la lógica de fusión y suma a todos los grupos duplicados identificados en su collection.
Paso 16: Verifique los resultados
Cuando el script termine, sus registros duplicados se habrán fusionado según sus instrucciones.
Vuelva a la vista principal de su collection. Las filas duplicadas deberían haber desaparecido y estar reemplazadas por los registros master fusionados.
Revise la columna que sumó (por ejemplo, /Stock
). Ahora debería contener los totales agregados de los ítems que antes estaban duplicados.
¡Sus datos están limpios, deduplicados y reflejan correctamente los valores sumados! 🚀
Ha usado con éxito AI Processing para no solo fusionar duplicados, sino también realizar cálculos como sumas durante el proceso, ahorrando mucho trabajo manual y asegurando la precisión de los datos.
Casos de uso
Esta función de suma con IA es muy versátil. Algunos escenarios donde brilla:
- Gestión de inventario: Importa listas de productos de varios proveedores o almacenes, lo que genera entradas duplicadas del mismo producto. Use AI Processing para fusionarlas, seleccionar como master el registro con la actualización más reciente y sumar los valores de
/QuantityOnHand
de todos los duplicados para obtener un stock total preciso. - Consolidación de ventas: Los datos de ventas llegan de distintas regiones o plataformas, creando registros duplicados del mismo cliente o producto vendido en un período. Fusione por
CustomerID
yProductID
, elija el registro conSaleDate
más antiguo y sume los campos/UnitsSold
y/Revenue
para cifras consolidadas. - Agregación financiera: Fusión de movimientos que representan el mismo gasto o ingreso procedentes de diferentes cuentas o extractos. Deduplicate por
TransactionDescription
yDate
, seleccione el registro con la descripción más detallada y sume el campo/Amount
para totales por categoría precisos. - Gestión de proyectos: Combine tareas del mismo hito provenientes de actualizaciones de distintos miembros. Fusione por
ProjectID
yMilestoneName
, conserve el registro conStatusUpdateDate
más reciente y sume/HoursLogged
para medir el esfuerzo total. - Pedidos en e‑commerce: Combine líneas del mismo producto dentro de un pedido que se hayan registrado por separado. Deduplicate por
OrderID
yProductID
, conserve una línea y sume/Quantity
y/ItemTotal
.
FAQ
Q1: ¿Qué pasa si mi columna numérica no se reconoce como tipo 'Number'?
Durante la importación, asegúrese de establecer la columna como tipo Number
. Si ya se importó como Text
, puede usar la herramienta "Convert Text to..." en el menú "Clean" para convertirla a Number
antes de ejecutar Duplicates Finder. La función de suma de AI requiere que el campo sea numérico.
Q2: ¿Puedo sumar varias columnas numéricas en un solo prompt? ¡Sí! Puede extender el prompt para incluir instrucciones de suma para varios campos. Por ejemplo:
Select the record with the latest date in /Date as master record.
Sum all /Stock values from all records into the /Stock property of the master record.
Sum all /SalesCount values from all records into the /SalesCount property of the master record.
Merge other properties using the most frequent value.
Q3: ¿Qué ocurre si algunos registros tienen valores vacíos en la columna numérica? El proceso de suma con IA suele tratar los valores vacíos o no numéricos como cero durante el cálculo. Suma todos los números válidos encontrados en los registros duplicados del campo especificado.
Q4: ¿Puede la IA realizar otros cálculos además de sumar? Sí, AI Processing es bastante flexible. Aunque sumar es el caso más común, también puede pedir promedios, valores máximo/mínimo o cálculos basados en múltiples campos. Tenga en cuenta que la complejidad del prompt aumentará.
Q5: ¿Usar AI Processing es más caro que la fusión estándar? "AI Processing" está incluido y es ilimitado en todos los planes de pago.
Q6: ¿Qué hago si la IA no entiende bien mi prompt? Revise siempre la vista previa antes de ejecutar el script. Si no coincide con lo esperado, refine su prompt. Sea más específico, verifique los nombres de las columnas y defina claramente el criterio de selección del registro master y la instrucción de suma. Si es necesario, divida la lógica en pasos más simples. Puede regenerar el script varias veces hasta que la vista previa sea correcta.