Opdel CSV-filer efter betydning, ikke kun efter chunk-størrelse

Mange CSV splitter-værktøjer stopper ved “hver 1.000 rækker”. Virkelige exports er mere rodede. Nogle gange har du brug for én fil pr. land, én fil pr. måned, én fil til enterprise accounts eller en fallback-fil til de rækker, der ikke matchede noget. Dette værktøj er bygget til den virkelighed.

Upload en CSV eller indsæt den nedenfor

CSV-separator, linjeskift i anførselstegn, dublerede headers og kodning håndteres automatisk.

Indsæt eller slip en fil
Indsæt CSV
Nyttigt til hurtige tests, eller når filen allerede er i din udklipsholder.

Forhåndsvis og download

Gennemgå antal filer, advarsler og forhåndsvisningen af hvert output før download.

Forhåndsvisning kommer efter, at du har bygget opdelingen

Vælg en split mode, justér indstillingerne, og forhåndsvis outputfilerne før download.

Opdel CSV-filer efter betydning, ikke kun efter chunk-størrelse

Mange CSV splitter-værktøjer stopper ved “hver 1.000 rækker”. Virkelige exports er mere rodede. Nogle gange har du brug for én fil pr. land, én fil pr. måned, én fil til enterprise accounts eller en fallback-fil til de rækker, der ikke matchede noget. Dette værktøj er bygget til den virkelighed.

Smart analyse før opdelingen

Værktøjet auto-detekterer encoding, delimiter, duplikerede headers, tomme kolonner, large-text fields og grouping columns med lav kardinalitet. Det gør det lettere at vælge en praktisk opdeling i stedet for at gætte.

Du får også advarsler, når en opdeling er risikabel: for mange outputfiler, for mange bittesmå filer eller én kæmpestor bucket, der er meget større end resten.

Bygget til store CSV-exports fra den virkelige verden

Store filer bliver på klientsiden. Du kan preview resultatet før download, beholde kun de kolonner du har brug for og eksportere én fil eller mange filer i et ZIP-arkiv.

Det fungerer godt til outreach-batches, handoff pr. land, CRM cleanup, compliance reviews og månedlige historiske udsnit.

Guide til indstillinger for de svære dele

Nogle split-indstillinger er kraftfulde, men ikke oplagte ved første øjekast. Hjælpeikonerne i værktøjet hopper til de matchende forklaringer nedenfor, så du kan forstå, hvad en indstilling faktisk ændrer, før du previewer opdelingen.

Rækker, overlap og størrelsesbaserede chunks

Det er de hurtigste split-modes og som regel de sikreste, når du bare har brug for mindre filer.

Rækker pr. fil giver hvert output omtrent samme antal rækker. Det er bedst, når downstream-værktøjer går op i batch-størrelse, ikke kategori eller betydning.

Overlap-rækker gentager nogle få rækker ved grænsen mellem filer. Brug det kun, når næste batch har brug for lidt kontekst fra den forrige.

Hold grupperede rækker samlet forhindrer værktøjet i at splitte den samme account, virksomhed eller ordre på tværs af flere filer. Det er vigtigt, når rækker, der tilhører samme enhed, skal holdes samlet.

Maks. størrelse pr. fil er til upload-grænser. Den forsøger at holde sig under et byte-mål, men rækkelængder kan variere, så den sidste fil eller nogle filer kan stadig føles mindre jævne end række-baserede chunks.

Grupperede outputs og sjældne værdier

Værdibaserede opdelinger er bedst, når én CSV pr. land, ejer, status eller kilde gør resultatet lettere at gennemgå eller overdrage.

Opdel efter kolonne(r) opretter ét output pr. unik værdi eller værdikombination. Én kolonne giver enklere outputs; to eller flere kolonner skaber mere granulære filer.

Håndtering af sjældne værdier hjælper, når enkeltstående værdier ville skabe for mange bittesmå filer. Du kan beholde kun de største grupper og samle resten i en “other”-bucket.

Opdel også store grupper efter filstørrelse er nyttigt, når én kategori er meget større end resten. Det bevarer grouping-logikken, men forhindrer, at én kæmpefil dominerer exporten.

Regler, første match og unmatched rows

Regelbaseret opdeling er nyttig, når filernes destination afhænger af business logic i stedet for én simpel grouping column.

Kun første match betyder, at en række stopper ved den første regel, den matcher. Slå det kun fra, hvis du bevidst vil have den samme række kopieret til flere outputfiler.

Behold unmatched rows i en separat fil sikrer, at rækker, som ikke opfylder nogen af dine regler, stadig bliver bevaret i deres egen export.

Filnavn til unmatched rows er ganske enkelt navnet på den catch-all-fil. Det hjælper, når du vil have et tydeligt output som needs-review.csv eller no-rule-match.csv.

Datoer, export-indstillinger og renere outputfiler

Disse indstillinger er vigtige, når input er rodet, eller når de eksporterede filnavne skal passe ind i et eksisterende workflow.

Datoformat er der til tvetydige datokolonner. Hvis detektoren gætter forkert, så tving det forventede format før grouping efter måned, år eller uge.

Ugyldige datoer lader dig beslutte, om dårlige værdier skal springes over eller flyttes til en separat fil. Det er mere sikkert end at miste rækker i stilhed.

Filnavnsmønster styrer de endelige outputnavne. Brug variabler som {index} og {label}, når dine batches har brug for forudsigelig nummerering.

Kolonner, der skal beholdes i outputtet fjerner unødvendige kolonner før opdelingen. Det gør exports lettere og renere, især når den oprindelige CSV har hjælpekolonner, du ikke vil have downstream.

Edge cases dette værktøj håndterer

Virkelige CSV-exports er sjældent rene. Dette værktøj er bygget til at håndtere de irriterende tilfælde, som normalt ødelægger simplere splitters.

Quoted cells, indlejrede kommaer og linjeskift

Rækker bliver ikke splittet, bare fordi en quoted cell indeholder et komma eller et linjeskift.

Parseren holder quoted CSV-værdier intakte, så adresser, noter eller lange tekstfelter ikke bliver brudt op i falske rækker under opdelingen.

Duplikerede headers, tomme kolonner og projiceret output

Rodede headers og overdimensionerede exports er almindelige i CRM-, finance- og support-exports.

Duplikerede headers normaliseres, så sammenligninger stadig virker. Tomme kolonner kan identificeres, og projection lader dig fjerne kolonner før generering af outputs.

Store filer og lazy preview

Preview skal hjælpe dig med at beslutte, ikke blokere dig fra at behandle store filer.

Ved store række-baserede opdelinger kan værktøjet holde preview let og kun preloade den første outputfil. Sekundære previews og downloads materialiseres on demand.

Ugyldige datoer, unmatched rules og ujævne grupper

Splitteren holder edge-case-rækker synlige i stedet for stille og roligt at kassere dem.

Rækker med ugyldige datoer kan komme i en separat fil, rækker der ikke matcher nogen regel kan beholdes i deres egen export, og grupperede opdelinger kan advare dig, når ét segment er meget større end resten.

Opdel efter land eller status

Brug opdeling efter grupperede værdier, når du vil have én CSV pr. land, ejer, status, kilde eller ethvert felt med lav kardinalitet.

Input
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive
3,Carol,US,active
4,Dan,DE,lead
Output
split-fr.csv
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive

split-us.csv
id,name,country,status
3,Carol,US,active

Byg regelbaserede outputfiler

Betingede regler lader dig definere praktiske destinationer såsom enterprise accounts, Gmail-adresser eller fallback-rækker, der ikke matcher noget.

Input
company_size,country,email
120,US,alice@gmail.com
25,FR,bob@startup.test
300,DE,ops@datablist.com
Output
enterprise.csv
company_size,country,email
120,US,alice@gmail.com
300,DE,ops@datablist.com

gmail.csv
company_size,country,email
120,US,alice@gmail.com

Kan jeg opdele en CSV efter kolonneværdi?

Ja. Vælg én eller flere kolonner, preview antallet af grupper, sæt eventuelt et loft over antallet af outputfiler, og saml sjældne værdier i en “other”-fil.

Kan jeg opdele en CSV efter filstørrelse?

Ja. Angiv et byte-mål pr. fil. Det er nyttigt, når et andet værktøj har upload-grænser. Preview advarer, når rækkelængder varierer for meget til pålidelige estimater.

Kan jeg opdele en CSV efter måned eller år?

Ja. Vælg en datokolonne, vælg måned, år eller ISO-uge, og beslut, om ugyldige datoer skal i deres egen fil eller springes over.

Laver værktøjet et ZIP-arkiv?

Ja. Opdelinger med ét output downloades som en CSV. Opdelinger med flere filer downloades som en ZIP, så store segmenterede exports forbliver håndterbare.

Relaterede værktøjer