Divida ficheiros CSV pelo significado, não apenas pelo tamanho dos blocos

Muitas ferramentas de CSV splitter ficam-se pelo “a cada 1.000 linhas”. As exportações reais são mais desorganizadas. Às vezes precisa de um ficheiro por país, um ficheiro por mês, um ficheiro para contas enterprise, ou um ficheiro de fallback para as linhas que não corresponderam a nada. Esta ferramenta foi criada para essa realidade.

Envie um CSV ou cole-o abaixo

O delimitador CSV, quebras de linha entre aspas, cabeçalhos duplicados e a codificação são tratados automaticamente.

Cole ou largue um ficheiro

Colar CSV

Útil para testes rápidos ou quando o ficheiro já está na sua área de transferência.

Pré-visualizar e baixar

Revise a contagem de ficheiros, os avisos e a pré-visualização de cada saída antes de fazer o download.

A pré-visualização vem depois de configurar a divisão

Escolha um modo de divisão, ajuste as definições e pré-visualize os ficheiros de saída antes de fazer o download.

Divida ficheiros CSV pelo significado, não apenas pelo tamanho dos blocos

Análise inteligente antes da divisão

A ferramenta deteta automaticamente codificação, delimitador, cabeçalhos duplicados, colunas vazias, campos de texto longos e colunas de agrupamento com baixa cardinalidade. Isso facilita escolher uma divisão prática em vez de adivinhar.

Também recebe avisos quando uma divisão é arriscada: demasiados ficheiros de saída, demasiados ficheiros minúsculos, ou um grupo gigante muito maior do que os restantes.

Criado para grandes exportações CSV do mundo real

Os ficheiros grandes permanecem no lado do cliente. Pode pré-visualizar o resultado antes de descarregar, manter apenas as colunas de que precisa e exportar um ficheiro ou vários ficheiros num arquivo ZIP.

Isto funciona muito bem para lotes de outreach, entregas por país, limpeza de CRM, revisões de conformidade e recortes históricos mensais.

Guia de definições para as partes mais complicadas

Algumas definições de divisão são poderosas, mas não são óbvias à primeira vista. Os ícones de ajuda na ferramenta levam diretamente às explicações correspondentes abaixo, para que possa compreender o que uma definição realmente altera antes de pré-visualizar a divisão.

Linhas, sobreposição e blocos por tamanho

Estes são os modos de divisão mais rápidos e, normalmente, os mais seguros quando só precisa de ficheiros mais pequenos.

Linhas por ficheiro dá a cada saída aproximadamente o mesmo número de linhas. Isto é ideal quando as ferramentas downstream se preocupam com o tamanho do lote, não com a categoria ou o significado.

Linhas sobrepostas repete algumas linhas na fronteira entre ficheiros. Use apenas quando o lote seguinte precisa de algum contexto do anterior.

Manter linhas agrupadas juntas impede a ferramenta de dividir a mesma conta, empresa ou encomenda por vários ficheiros. É importante quando as linhas pertencentes à mesma entidade devem permanecer juntas.

Tamanho máximo por ficheiro serve para limites de upload. Tenta ficar abaixo de um alvo em bytes, mas como o tamanho das linhas pode variar, o último ficheiro ou alguns ficheiros podem parecer menos uniformes do que nos blocos por linhas.

Saídas agrupadas e valores raros

As divisões por valor são ideais quando ter um CSV por país, owner, estado ou source torna o resultado mais fácil de rever ou entregar.

Dividir por coluna(s) cria uma saída por cada valor distinto ou combinação de valores. Uma coluna produz saídas mais simples; duas ou mais colunas criam ficheiros mais granulares.

Tratamento de valores raros ajuda quando valores únicos criariam demasiados ficheiros minúsculos. Pode manter apenas os grupos maiores e juntar o resto num grupo “other”.

Também dividir grupos grandes por tamanho do ficheiro é útil quando uma categoria é muito maior do que as restantes. Mantém a lógica de agrupamento, mas evita que um único ficheiro gigante domine a exportação.

Regras, primeira correspondência e linhas sem correspondência

A divisão baseada em regras é útil quando o destino dos ficheiros depende de lógica de negócio em vez de uma simples coluna de agrupamento.

Apenas a primeira correspondência significa que uma linha pára na primeira regra com que corresponde. Desative apenas quando quiser intencionalmente copiar a mesma linha para vários ficheiros de saída.

Manter linhas sem correspondência num ficheiro separado garante que as linhas que não satisfazem nenhuma das suas regras continuam preservadas na sua própria exportação.

Nome do ficheiro de linhas sem correspondência é simplesmente o nome desse ficheiro geral. Ajuda quando quer uma saída clara como needs-review.csv ou no-rule-match.csv.

Datas, definições de exportação e ficheiros de saída mais limpos

Estas definições são importantes quando a origem está desorganizada ou quando os nomes dos ficheiros exportados precisam de encaixar num workflow existente.

Formato de data existe para colunas de data ambíguas. Se o detetor adivinhar mal, force o formato esperado antes de agrupar por mês, ano ou semana.

Datas inválidas permite decidir se valores incorretos devem ser ignorados ou movidos para um ficheiro separado. Isto é mais seguro do que perder linhas silenciosamente.

Padrão do nome do ficheiro controla os nomes finais de saída. Use variáveis como {index} e {label} quando os seus lotes precisam de numeração previsível.

Colunas a manter na saída remove colunas desnecessárias antes da divisão. Isso mantém as exportações mais leves e limpas, especialmente quando o CSV original tem colunas auxiliares que não quer downstream.

Casos limite que esta ferramenta consegue gerir

As exportações CSV reais raramente estão limpas. Esta ferramenta foi feita para lidar com os casos irritantes que normalmente quebram splitters mais simples.

Células entre aspas, vírgulas incorporadas e quebras de linha

As linhas não são divididas só porque uma célula entre aspas contém uma vírgula ou uma quebra de linha.

O parser mantém os valores CSV entre aspas intactos, para que moradas, notas ou campos de texto longos não sejam partidos em linhas falsas durante a divisão.

Cabeçalhos duplicados, colunas vazias e saída projetada

Cabeçalhos desorganizados e exportações oversized são comuns em exportações de CRM, finanças e suporte.

Os cabeçalhos duplicados são normalizados para que as comparações continuem a funcionar. As colunas vazias podem ser identificadas, e a projeção permite remover colunas antes de gerar as saídas.

Ficheiros grandes e pré-visualização lazy

A pré-visualização deve ajudar a decidir, não bloqueá-lo ao processar ficheiros grandes.

Para grandes divisões baseadas em linhas, a ferramenta pode manter a pré-visualização leve e pré-carregar apenas o primeiro ficheiro de saída. As pré-visualizações secundárias e os downloads são materializados sob pedido.

Datas inválidas, regras sem correspondência e grupos irregulares

O splitter mantém as linhas de casos limite visíveis em vez de as descartar discretamente.

As linhas com datas inválidas podem ir para um ficheiro separado, as linhas que não correspondem a nenhuma regra podem ser mantidas na sua própria exportação, e as divisões agrupadas podem avisá-lo quando um segmento é muito maior do que os restantes.

Dividir por país ou estado

Use divisões por valores agrupados quando quiser um CSV por país, owner, estado, source ou qualquer campo de baixa cardinalidade.

Input

id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive
3,Carol,US,active
4,Dan,DE,lead

Output

split-fr.csv
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive

split-us.csv
id,name,country,status
3,Carol,US,active

Criar ficheiros de saída baseados em regras

As regras condicionais permitem definir destinos práticos, como contas enterprise, endereços Gmail ou linhas de fallback que não correspondem a nada.

Input

company_size,country,email
120,US,alice@gmail.com
25,FR,bob@startup.test
300,DE,ops@datablist.com

Output

enterprise.csv
company_size,country,email
120,US,alice@gmail.com
300,DE,ops@datablist.com

gmail.csv
company_size,country,email
120,US,alice@gmail.com

Posso dividir um CSV pelo valor de uma coluna?

Sim. Escolha uma ou várias colunas, pré-visualize o número de grupos, limite opcionalmente o número de ficheiros de saída e agrupe valores raros num ficheiro “other”.

Posso dividir um CSV por tamanho do ficheiro?

Sim. Defina um alvo em bytes por ficheiro. Isto é útil quando outra ferramenta tem limites de upload. A pré-visualização avisa quando o tamanho das linhas é demasiado variável para estimativas fiáveis.

Posso dividir um CSV por mês ou ano?

Sim. Escolha uma coluna de data, selecione mês, ano ou semana ISO, e decida se datas inválidas devem ir para o seu próprio ficheiro ou ser ignoradas.

A ferramenta cria um arquivo ZIP?

Sim. Divisões com uma única saída são descarregadas como CSV. Divisões com vários ficheiros são descarregadas como ZIP para que exportações segmentadas grandes continuem fáceis de gerir.

Ferramentas relacionadas

Divisor de Linhas CSV

Divida células com múltiplos valores em linhas separadas. Envie um CSV, escolha a coluna e o delimitador, e expanda tags, emails ou números de telefone em um valor por linha.

Abrir ferramenta

Ferramenta de Diff de CSV

Compare dois arquivos CSV online, relacione linhas por id ou email, detecte linhas adicionadas, removidas, alteradas e inalteradas, e baixe um CSV de diff estruturado.

Abrir ferramenta