I dati duplicati sono una seccatura. Esporti dal tuo CRM o ricevi listini da fornitori diversi e… boom: stessi articoli ripetuti più volte. Vuoi ripulire, ma eliminare i duplicati non basta. E se alcune righe hanno numeri di stock o importi di vendita? Non vuoi perderli. Vuoi unire e sommare.

Qui entra in gioco il Duplicates Finder di Datablist. Unisce i duplicati e somma i tuoi numeri. Come per magia.

Immagina di unire più schede prodotto e ottenere automaticamente il totale dello stock, con una semplice istruzione!

In questa guida trovi i passaggi per sommare i valori numerici mentre unisci i duplicati:

Preparare i dati

Prima di unire e sommare i valori, importa i tuoi dati su Datablist. Partiamo creando una Collection e importando il file.

Passaggio 1: Crea una Collection

Su Datablist, le Collection sono lo spazio in cui organizzi i dati. Pensale come fogli di calcolo intelligenti. Clicca il pulsante "+" nella sidebar o la scorciatoia "Start with a CSV/Excel file" nella home per crearne una nuova.

Create a new collection in Datablist
Create a new collection in Datablist

Passaggio 2: Importa il file

Puoi importare dati da varie fonti, ma per questo esempio usiamo un file CSV o Excel. Clicca "Import CSV/Excel" e carica il tuo file.

Datablist supporta file di grandi dimensioni, quindi nessun problema anche con centinaia di migliaia di righe.

Import CSV or Excel file
Import CSV or Excel file

Datablist rileva automaticamente i tipi di colonna (come Text, Number, Date, Email).

⚠️ Importante: Assicurati che la colonna che vuoi sommare (es. /Stock) sia riconosciuta come tipo Number. In caso contrario, puoi modificarla manualmente durante l’import.

Passaggio 3: Controlla i dati importati

Quando l’import termina, dai un’occhiata veloce alla Collection per verificare che tutto sia corretto. Dovresti vedere righe e colonne pronte per il cleaning.

Check imported data in the collection
Check imported data in the collection

Come trovare i duplicati

Ora che i dati sono caricati, troviamo i duplicati.

Passaggio 4: Avvia il Duplicates Finder

Vai al menu "Clean" nell’header e seleziona "Duplicates Finder".

Start the Duplicates Finder tool
Start the Duplicates Finder tool

Passaggio 5: Seleziona gli identificatori di deduplica

Devi dire a Datablist come identificare gli elementi duplicati.

Scegli la proprietà che identifica univocamente un elemento nella tua lista. Potrebbe essere un Email, un Product SKU, un Company Name o una combinazione di campi.

In questo esempio, useremo Product Name o SKU per trovare i prodotti duplicati.

Select the properties to identify duplicates
Select the properties to identify duplicates

Passaggio 6: Scegli algoritmo di matching e Processor

Seleziona l’algoritmo di confronto.

Per identificatori come SKU o Email, "Exact" o "Smart" funzionano molto bene. L’algoritmo "Smart" gestisce piccole variazioni come protocolli diversi nelle URL o l’ordine delle parole.

Puoi anche scegliere un "Processor" per normalizzare i dati prima del confronto (es. pulizia di email o URL).

Select matching algorithm and processor
Select matching algorithm and processor

Clicca "Run duplicates check".

Passaggio 7: Anteprima dei gruppi duplicati

Datablist analizzerà i dati e mostrerà gruppi di potenziali duplicati. Rivedi i gruppi per confermare che siano effettivamente duplicati prima di procedere con l’unione.

Preview the detected duplicate groups
Preview the detected duplicate groups

Usare AI Processing per sommare i valori

Qui succede la magia. Invece delle opzioni di "Auto Merge" standard, useremo la modalità "AI Processing" per dare istruzioni precise, incluso sommare un campo numerico.

Passaggio 8: Seleziona la modalità AI Processing

Nella pagina dei risultati dei duplicati, clicca il pulsante "AI Editing".

Questa modalità ti permette di definire una logica di merging personalizzata con prompt in linguaggio naturale.

Select the AI Processing mode
Select the AI Processing mode

Passaggio 9: Scrivi il tuo AI prompt

Questo è il cuore del processo. Scrivi un prompt che spieghi come Datablist deve unire i gruppi di duplicati.

Il prompt deve includere due parti chiave:

  1. Selezione del master record: indica come scegliere il record principale (il "master") che verrà mantenuto dopo l’unione. Puoi usare criteri come "il record con la data più recente in /Property", "il record più completo" o "il primo creato".
  2. Somma dei valori: istruisci l’AI a sommare i valori di uno specifico campo numerico su tutti i record del gruppo (incluso il master) e a mettere il totale nello stesso campo sul record master.

Usa /PropertyName o {{PropertyName}} per riferirti alle colonne della tua Collection.

Ecco un prompt di esempio per sommare la proprietà /Stock scegliendo come master la data più recente nella proprietà /Date:

Select the record with the latest date in /Date as master record.
And sum all /Stock values from all records into the /Stock property of the master record.

Puoi aggiungere ulteriori regole per le altre proprietà. Ad esempio:

Select the record with the latest date in /Date as master record.
And sum all /Stock values from all records into the /Stock property of the master record.
Merge other properties using the most frequent value.

Passaggio 10: Finalizza e genera lo script

Rivedi il prompt. Assicurati di aver scritto correttamente i nomi delle colonne (come /Date e /Stock). Quando sei soddisfatto, clicca "Generate and preview changes".

Final prompt ready for script generation
Final prompt ready for script generation

Verificare ed eseguire lo script AI

L’AI di Datablist non esegue alla cieca. Prima genera uno script JavaScript basato sul tuo prompt e ti mostra un’anteprima.

Passaggio 11: Attendi l’elaborazione

L’AI impiegherà qualche istante per interpretare il prompt e scrivere lo script corrispondente.

Wait for AI script generation
Wait for AI script generation

Passaggio 12: Rivedi la spiegazione dello script

Datablist ti mostrerà una spiegazione di cosa fa lo script generato. Controlla che il sistema abbia compreso correttamente la tua intenzione.

Review the generated JavaScript
Review the generated JavaScript

Passaggio 13: Controlla l’anteprima dei risultati

Ancora più importante, Datablist fornisce un’anteprima di come lo script influenzerà i dati prima di eseguirlo.

Guarda la sezione "Preview".

Vedrai lo stato proposto del master record dopo merge e somma. Verifica che il campo numerico (es. /Stock) mostri la somma corretta in base ai membri del gruppo duplicato.

Check the preview of the script results
Check the preview of the script results

Passaggio 14: Esempio di anteprima con master

Ecco un’anteprima dettagliata per un gruppo specifico. Il master record è quello con la data più recente, come richiesto nel prompt.

Example preview showing the summed value in the master item
Example preview showing the summed value in the master item

Passaggio 15: Esegui lo script

Se l’anteprima è corretta e le somme sono calcolate come previsto, clicca "Run Script". Datablist applicherà la logica di merge e somma a tutti i gruppi di duplicati identificati nella Collection.

Run the generated script
Run the generated script

Passaggio 16: Verifica i risultati

Una volta terminato, i record duplicati saranno uniti secondo le tue istruzioni.

Torna alla vista principale della Collection. Le righe duplicate dovrebbero essere scomparse, sostituite dai master record uniti.

Controlla la colonna che hai sommato (es. /Stock). Ora dovrebbe contenere i totali aggregati per gli elementi che prima erano duplicati.

I tuoi dati sono puliti, deduplicati e con valori numerici sommati correttamente! 🚀

View the final cleaned data with summed values
View the final cleaned data with summed values

Hai usato con successo l’AI Processing non solo per unire i duplicati, ma anche per calcolare somme durante il processo, risparmiando tempo e garantendo l’accuratezza.

Casi d’uso

Questa funzione di somma guidata dall’AI è estremamente versatile. Ecco alcuni scenari in cui brilla:

  • Inventory Management: importi listini da più fornitori o magazzini e ottieni voci duplicate per lo stesso prodotto. Usa AI Processing per unirle, seleziona come master il record con la data di ultimo aggiornamento e somma i valori di /QuantityOnHand per ottenere lo stock totale corretto.
  • Sales Data Consolidation: i dati vendita arrivano da regioni o piattaforme diverse, creando record duplicati per lo stesso cliente o prodotto nello stesso periodo. Unisci i duplicati basandoti su CustomerID e ProductID, scegli il record con SaleDate più vecchia e somma i campi /UnitsSold e /Revenue per cifre consolidate.
  • Financial Data Aggregation: unisci movimenti provenienti da conti o estratti diversi che rappresentano la stessa spesa o entrata. Deduplica su TransactionDescription e Date, mantieni il record con la descrizione più dettagliata e somma il campo /Amount per totali di categoria accurati.
  • Project Management: combina task relativi alla stessa milestone del progetto provenienti dagli update di membri diversi. Unisci per ProjectID e MilestoneName, mantieni il record con StatusUpdateDate più recente e somma /HoursLogged per tracciare l’effort totale.
  • E-commerce Order Merging: combina più righe per lo stesso prodotto all’interno di un ordine cliente inserite separatamente. Deduplica su OrderID e ProductID, mantieni una riga e somma i campi /Quantity e /ItemTotal.

FAQ

Q1: E se la mia colonna numerica non è riconosciuta come tipo 'Number'? Durante l’import, imposta la colonna come tipo Number. Se l’hai già importata come Text, usa lo strumento "Convert Text to..." nel menu "Clean" per convertirla in Number prima di eseguire il Duplicates Finder. La somma con l’AI richiede un campo numerico.

Q2: Posso sommare più colonne numeriche in un unico prompt? Sì! Puoi estendere il prompt includendo le istruzioni per più campi. Ad esempio:

Select the record with the latest date in /Date as master record.
Sum all /Stock values from all records into the /Stock property of the master record.
Sum all /SalesCount values from all records into the /SalesCount property of the master record.
Merge other properties using the most frequent value.

Q3: Cosa succede se alcuni record hanno valori vuoti nella colonna numerica? Il processo di somma dell’AI in genere considera i valori vuoti o non numerici come zero. Somma tutti i numeri validi trovati tra i record duplicati nella colonna specificata.

Q4: L’AI può fare altri calcoli oltre alla somma? Sì, AI Processing è molto flessibile. Oltre alla somma, puoi richiedere medie, valore massimo/minimo o calcoli basati su più campi, anche se la complessità del prompt aumenta.

Q5: Usare AI Processing è più costoso rispetto al merge standard? "AI Processing" è incluso ed è illimitato in tutti i piani a pagamento.

Q6: E se l’AI non interpreta correttamente il mio prompt? Controlla sempre con attenzione l’anteprima prima di eseguire lo script. Se non è ciò che ti aspetti, affina il prompt. Sii più specifico, verifica i nomi delle colonne e indica chiaramente i criteri per il master e l’istruzione di somma. Scomponi la logica complessa in passi più semplici se necessario. Puoi rigenerare lo script più volte finché l’anteprima non è corretta.