단순한 chunk 크기가 아니라 의미를 기준으로 CSV 파일 분할

많은 CSV splitter 도구는 “1,000행마다 분할” 수준에서 멈춥니다. 하지만 실제 export 데이터는 훨씬 더 복잡합니다. 국가별로 파일 하나씩, 월별로 파일 하나씩, enterprise 계정용 파일 하나, 또는 아무 규칙에도 매칭되지 않은 행을 위한 fallback 파일이 필요할 때가 있습니다. 이 도구는 바로 그런 현실을 위해 만들어졌습니다.

CSV를 업로드하거나 아래에 붙여넣으세요

CSV 구분자, 따옴표로 감싼 줄바꿈, 중복 헤더, 인코딩은 자동으로 처리됩니다.

붙여넣거나 파일을 드롭하세요
CSV 붙여넣기
빠른 테스트를 하거나 파일이 이미 클립보드에 있을 때 유용합니다.

미리보기 및 다운로드

다운로드 전에 파일 수, 경고, 각 출력 결과의 미리보기를 검토하세요.

분할을 구성한 후 미리보기가 제공됩니다

분할 모드를 선택하고 설정을 조정한 뒤, 다운로드 전에 출력 파일을 미리보세요.

단순한 chunk 크기가 아니라 의미를 기준으로 CSV 파일 분할

많은 CSV splitter 도구는 “1,000행마다 분할” 수준에서 멈춥니다. 하지만 실제 export 데이터는 훨씬 더 복잡합니다. 국가별로 파일 하나씩, 월별로 파일 하나씩, enterprise 계정용 파일 하나, 또는 아무 규칙에도 매칭되지 않은 행을 위한 fallback 파일이 필요할 때가 있습니다. 이 도구는 바로 그런 현실을 위해 만들어졌습니다.

분할 전에 수행되는 스마트 분석

이 도구는 인코딩, 구분자, 중복 헤더, 빈 컬럼, 대용량 텍스트 필드, 그리고 카디널리티가 낮은 그룹화용 컬럼을 자동으로 감지합니다. 덕분에 추측에 의존하지 않고, 실무에 맞는 분할 방식을 더 쉽게 선택할 수 있습니다.

또한 분할이 위험할 때 경고를 제공합니다. 예를 들어 출력 파일이 너무 많아지는 경우, 너무 작은 파일이 과도하게 생성되는 경우, 또는 하나의 거대한 bucket이 나머지를 압도하는 경우입니다.

대규모 실제 CSV export를 위해 설계

대용량 파일은 클라이언트 측에 그대로 유지됩니다. 다운로드 전에 결과를 미리보고, 필요한 컬럼만 남기고, 단일 파일 또는 여러 파일을 ZIP 아카이브로 export할 수 있습니다.

이 방식은 outreach 배치 처리, 국가별 handoff, CRM 정리, 컴플라이언스 검토, 월별 이력 데이터 분리에 특히 적합합니다.

헷갈리기 쉬운 설정을 위한 가이드

일부 분할 설정은 강력하지만, 처음 보면 바로 이해하기 어렵습니다. 도구 안의 도움말 아이콘을 클릭하면 아래의 해당 설명으로 바로 이동하므로, 분할을 미리보기 전에 각 설정이 실제로 무엇을 바꾸는지 이해할 수 있습니다.

행 수, overlap, 그리고 크기 기반 chunk

이 방식들은 가장 빠른 분할 모드이며, 단지 더 작은 파일이 필요한 경우 보통 가장 안전합니다.

파일당 행 수는 각 출력 파일의 행 수를 대략 비슷하게 맞춥니다. downstream 도구가 카테고리나 의미보다 batch 크기를 더 중요하게 여길 때 가장 적합합니다.

Overlap rows는 파일 경계에서 몇 개의 행을 반복합니다. 다음 batch가 이전 batch의 약간의 문맥을 필요로 할 때만 사용하십시오.

그룹화된 행 함께 유지는 동일한 account, company 또는 order가 여러 파일로 나뉘지 않도록 합니다. 하나의 엔터티에 속한 행이 함께 유지되어야 할 때 중요합니다.

파일당 최대 크기는 업로드 제한이 있을 때 유용합니다. 바이트 기준 목표 이하로 맞추도록 시도하지만, 행 길이는 서로 다를 수 있으므로 마지막 파일이나 일부 파일은 행 수 기준 chunk보다 균등하지 않을 수 있습니다.

그룹화된 출력과 드문 값 처리

값 기반 분할은 국가, 담당자, 상태, source별로 CSV를 나누어 검토하거나 handoff하기 쉽게 만들고 싶을 때 가장 적합합니다.

컬럼 기준 분할은 고유한 값 또는 값 조합마다 하나의 출력 파일을 생성합니다. 컬럼 하나를 사용하면 더 단순한 출력이 만들어지고, 두 개 이상을 사용하면 더 세분화된 파일이 생성됩니다.

드문 값 처리는 일회성 값 때문에 너무 많은 작은 파일이 생기는 상황에 유용합니다. 가장 큰 그룹만 유지하고 나머지는 “other” bucket으로 합칠 수 있습니다.

큰 그룹도 파일 크기 기준으로 추가 분할은 특정 카테고리 하나가 나머지보다 훨씬 클 때 유용합니다. 그룹화 로직은 유지하면서도, 하나의 거대한 파일이 전체 export를 지배하지 않도록 방지합니다.

규칙, first match, 그리고 미매칭 행

규칙 기반 분할은 파일의 목적지가 단순한 하나의 그룹화 컬럼이 아니라 비즈니스 로직에 따라 결정될 때 유용합니다.

First match only는 한 행이 처음으로 매칭된 규칙에서 처리가 끝난다는 의미입니다. 동일한 행을 의도적으로 여러 출력 파일에 복사하려는 경우가 아니라면 비활성화하지 마십시오.

미매칭 행을 별도 파일에 유지는 어떤 규칙도 만족하지 않는 행도 전용 export 파일로 보존되도록 합니다.

미매칭 행 파일 이름은 그 catch-all 파일의 이름입니다. needs-review.csv 또는 no-rule-match.csv처럼 명확한 출력 이름을 원할 때 유용합니다.

날짜, export 설정, 그리고 더 깔끔한 출력 파일

이 설정들은 입력 데이터가 지저분하거나, export되는 파일 이름이 기존 workflow에 맞아야 할 때 중요합니다.

날짜 형식은 해석이 모호한 날짜 컬럼을 위한 설정입니다. 감지기가 잘못 추정한 경우, 월·연도·주 단위 그룹화를 하기 전에 기대하는 형식을 강제로 지정하십시오.

잘못된 날짜는 유효하지 않은 값을 건너뛸지, 별도 파일로 이동할지를 결정할 수 있게 합니다. 이는 행이 조용히 사라지는 것보다 더 안전합니다.

파일명 패턴은 최종 출력 이름을 제어합니다. batch에 예측 가능한 번호가 필요할 때 {index}, {label} 같은 변수를 사용하십시오.

출력에 유지할 컬럼은 분할 전에 불필요한 컬럼을 제거합니다. 특히 원본 CSV에 downstream에서 필요하지 않은 보조 컬럼이 있을 때 export를 더 가볍고 깔끔하게 유지할 수 있습니다.

이 도구가 처리하는 edge case

실제 CSV export는 깔끔한 경우가 드뭅니다. 이 도구는 보통 더 단순한 splitter를 망가뜨리는 성가신 케이스를 처리할 수 있도록 설계되었습니다.

따옴표로 감싼 셀, 내장된 쉼표, 줄바꿈

따옴표로 감싼 셀 안에 쉼표나 줄바꿈이 있다고 해서 행이 분할되지는 않습니다.

파서는 따옴표로 감싼 CSV 값을 온전히 유지하므로, 주소, 메모 또는 긴 텍스트 필드가 분할 과정에서 가짜 행으로 깨지지 않습니다.

중복 헤더, 빈 컬럼, 그리고 projection된 출력

지저분한 헤더와 지나치게 큰 export는 CRM, 재무, 지원 데이터 export에서 흔하게 발생합니다.

중복 헤더는 비교가 계속 가능하도록 정규화됩니다. 빈 컬럼을 식별할 수 있으며, projection을 통해 출력 생성 전에 컬럼을 제거할 수 있습니다.

대용량 파일과 lazy preview

미리보기는 판단을 돕기 위한 것이어야지, 큰 파일 처리를 막아서는 안 됩니다.

대용량 행 기반 분할의 경우, 도구는 미리보기를 가볍게 유지하고 첫 번째 출력 파일만 사전 로드할 수 있습니다. 추가 미리보기와 다운로드는 필요할 때 생성됩니다.

잘못된 날짜, 미매칭 규칙, 불균형한 그룹

이 splitter는 edge case에 해당하는 행을 조용히 버리지 않고 계속 보이도록 유지합니다.

유효하지 않은 날짜가 있는 행은 별도 파일로 보낼 수 있고, 어떤 규칙과도 매칭되지 않는 행은 자체 export로 유지할 수 있으며, 그룹 기반 분할에서는 특정 세그먼트가 나머지보다 훨씬 큰 경우 경고를 표시할 수 있습니다.

국가 또는 상태 기준 분할

국가, 담당자, 상태, source 또는 카디널리티가 낮은 필드별로 CSV를 하나씩 만들고 싶다면 그룹화된 값 분할을 사용하십시오.

Input
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive
3,Carol,US,active
4,Dan,DE,lead
Output
split-fr.csv
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive

split-us.csv
id,name,country,status
3,Carol,US,active

규칙 기반 출력 파일 구성

조건부 규칙을 사용하면 enterprise 계정, Gmail 주소, 또는 아무것도 매칭되지 않는 fallback 행과 같은 실용적인 목적지를 정의할 수 있습니다.

Input
company_size,country,email
120,US,alice@gmail.com
25,FR,bob@startup.test
300,DE,ops@datablist.com
Output
enterprise.csv
company_size,country,email
120,US,alice@gmail.com
300,DE,ops@datablist.com

gmail.csv
company_size,country,email
120,US,alice@gmail.com

컬럼 값 기준으로 CSV를 분할할 수 있습니까?

예. 하나 또는 여러 컬럼을 선택하고, 그룹 수를 미리본 뒤, 필요하면 출력 파일 수에 상한을 두고, 드문 값은 “other” 파일로 묶을 수 있습니다.

파일 크기 기준으로 CSV를 분할할 수 있습니까?

예. 파일당 바이트 목표값을 설정할 수 있습니다. 다른 도구에 업로드 제한이 있을 때 유용합니다. 미리보기는 행 길이 편차가 너무 커서 신뢰할 수 있는 추정이 어려운 경우 경고를 표시합니다.

월별 또는 연도별로 CSV를 분할할 수 있습니까?

예. 날짜 컬럼을 선택하고, 월, 연도 또는 ISO 주를 지정한 뒤, 잘못된 날짜를 별도 파일로 보낼지 또는 건너뛸지를 결정할 수 있습니다.

이 도구는 ZIP 아카이브를 생성합니까?

예. 단일 출력 분할은 CSV로 다운로드되며, 여러 파일 분할은 ZIP으로 다운로드되므로 큰 세그먼트형 export도 관리하기 쉽습니다.

관련 도구