CSVファイルを、単なるチャンクサイズではなく意味に基づいて分割
多くのCSV splitterツールは「1,000行ごと」といった分割で止まります。しかし、実際のエクスポートはもっと複雑です。国ごとに1ファイル、月ごとに1ファイル、enterprise accounts用に1ファイル、あるいはどの条件にも一致しなかった行のためのフォールバックファイルが必要な場合があります。このツールは、そのような実務上の現実に対応するために設計されています。
CSVの区切り文字、引用符付きの改行、重複ヘッダー、エンコーディングは自動的に処理されます。
プレビューとダウンロード
ダウンロード前に、ファイル数、警告、および各出力のプレビューをご確認ください。
プレビューは分割の作成後に表示されます
分割モードを選択し、設定を調整してから、ダウンロード前に出力ファイルをプレビューしてください。
CSVファイルを、単なるチャンクサイズではなく意味に基づいて分割
多くのCSV splitterツールは「1,000行ごと」といった分割で止まります。しかし、実際のエクスポートはもっと複雑です。国ごとに1ファイル、月ごとに1ファイル、enterprise accounts用に1ファイル、あるいはどの条件にも一致しなかった行のためのフォールバックファイルが必要な場合があります。このツールは、そのような実務上の現実に対応するために設計されています。
分割前のスマートな分析
このツールは、encoding、delimiter、重複ヘッダー、空の列、大きなテキストフィールド、低cardinalityのグルーピング列を自動検出します。推測に頼るのではなく、実用的な分割方法を選びやすくなります。
また、分割にリスクがある場合は警告も表示されます。たとえば、出力ファイル数が多すぎる、非常に小さいファイルが多すぎる、あるいは1つの巨大なバケットが他を大きく上回る場合などです。
大規模な実データのCSVエクスポート向けに設計
大きなファイルもクライアント側に保持されます。ダウンロード前に結果をプレビューし、必要な列だけを残して、単一ファイルまたは複数ファイルをZIPアーカイブでエクスポートできます。
これは、outreachバッチ、国別の引き渡し、CRMクリーンアップ、コンプライアンスレビュー、月次の履歴データ分割に適しています。
迷いやすい設定のガイド
一部の分割設定は強力ですが、初見では分かりにくいことがあります。ツール内のヘルプアイコンから以下の該当説明へ移動できるため、分割をプレビューする前に、各設定が実際に何を変更するのかをご理解いただけます。
行数、overlap、サイズベースのチャンク
これらは最も高速な分割モードであり、単にファイルを小さくしたい場合には通常もっとも安全です。
Rows per file は、各出力の行数をおおむね同じにします。後続ツールがカテゴリや意味ではなくバッチサイズを重視する場合に最適です。
Overlap rows は、ファイルの境界で数行を重複させます。次のバッチが前のバッチの文脈を少し必要とする場合にのみご利用ください。
Keep grouped rows together は、同じaccount、company、またはorderが複数ファイルに分断されるのを防ぎます。1つのエンティティに属する行をまとめて保持したい場合に重要です。
Max size per file は、アップロード上限への対応に便利です。バイト数の目標値以下に収めることを目指しますが、行ごとの長さは異なるため、最後のファイルや一部のファイルは行数ベースのチャンクほど均一にならない場合があります。
グループ化された出力とレアな値
値ベースの分割は、国、owner、status、またはsourceごとに1つのCSVを作成したい場合に適しており、レビューや引き渡しがしやすくなります。
Split by column(s) は、一意の値または値の組み合わせごとに1つの出力を作成します。1列ならシンプルな出力になり、2列以上ではより細かなファイルに分かれます。
Rare-value handling は、単発の値によって非常に小さなファイルが大量に作成される場合に役立ちます。大きなグループだけを残し、それ以外を「other」バケットにまとめることができます。
Also split large groups by file size は、1つのカテゴリだけが他より大幅に大きい場合に便利です。グルーピングのロジックは維持しつつ、単一の巨大ファイルがエクスポート全体を支配するのを防ぎます。
ルール、最初の一致、未一致の行
ルールベースの分割は、ファイルの振り分け先が単純なグルーピング列ではなく、ビジネスロジックに依存する場合に有効です。
First match only は、行が最初に一致したルールで処理を止める設定です。同じ行を意図的に複数の出力ファイルへコピーしたい場合を除き、オフにしないことをおすすめします。
Keep unmatched rows in a separate file は、どのルールも満たさない行も専用のエクスポートとして保持できるようにします。
Unmatched rows file name は、その受け皿となるファイル名です。たとえば needs-review.csv や no-rule-match.csv のように、分かりやすい出力名にしたい場合に役立ちます。
日付、エクスポート設定、より整理された出力ファイル
これらの設定は、入力データが煩雑な場合や、エクスポート後のファイル名を既存のworkflowに合わせる必要がある場合に重要です。
Date format は、解釈が曖昧な日付列のための設定です。検出結果が誤っている場合は、月、年、または週ごとにグループ化する前に想定する形式を明示的に指定してください。
Invalid dates では、不正な値をスキップするか、別ファイルに移すかを選べます。行が気づかないうちに失われるのを防ぐ、より安全な方法です。
Filename pattern は、最終的な出力名を制御します。バッチに予測可能な番号付けが必要な場合は、{index} や {label} のような変数をご利用ください。
Columns to keep in the output は、分割前に不要な列を除去します。特に、元のCSVに下流工程では不要な補助列が含まれている場合、エクスポートを軽量かつ整理された状態に保てます。
このツールが対応するエッジケース
実際のCSVエクスポートがきれいに整っていることはほとんどありません。このツールは、一般的なsplitterでは壊れやすい厄介なケースにも対応できるよう設計されています。
引用付きセル、埋め込みカンマ、改行
引用符付きセルにカンマや改行が含まれていても、それだけで行が分割されることはありません。
パーサーは引用付きのCSV値をそのまま保持するため、住所、メモ、長文テキストフィールドなどが、分割中に誤って別の行として扱われることはありません。
重複ヘッダー、空の列、出力projection
煩雑なヘッダーや過大なエクスポートは、CRM、財務、サポートのエクスポートでよく見られます。
重複ヘッダーは比較処理が機能するよう正規化されます。空の列も特定でき、projectionを使えば出力生成前に列を削除できます。
大容量ファイルとlazy preview
プレビューは判断を助けるものであり、大きなファイルの処理を妨げるべきではありません。
大規模な行ベース分割では、ツールはプレビューを軽量に保ち、最初の出力ファイルのみを事前読み込みできます。追加のプレビューやダウンロードは、必要になった時点で生成されます。
不正な日付、未一致ルール、不均一なグループ
このsplitterは、エッジケースの行を静かに破棄するのではなく、見える形で保持します。
不正な日付を含む行は別ファイルに送ることができ、どのルールにも一致しない行も専用のエクスポートとして保持できます。また、グループ分割では、1つのセグメントだけが他より極端に大きい場合に警告を表示できます。
国またはstatusで分割
国、owner、status、source、またはその他の低cardinalityフィールドごとに1つのCSVが必要な場合は、グループ化された値による分割をご利用ください。
id,name,country,status 1,Alice,FR,active 2,Bob,FR,inactive 3,Carol,US,active 4,Dan,DE,lead
split-fr.csv id,name,country,status 1,Alice,FR,active 2,Bob,FR,inactive split-us.csv id,name,country,status 3,Carol,US,active
ルールベースの出力ファイルを作成
条件付きルールにより、enterprise accounts、Gmailアドレス、または何にも一致しないフォールバック行など、実務的な振り分け先を定義できます。
company_size,country,email 120,US,alice@gmail.com 25,FR,bob@startup.test 300,DE,ops@datablist.com
enterprise.csv company_size,country,email 120,US,alice@gmail.com 300,DE,ops@datablist.com gmail.csv company_size,country,email 120,US,alice@gmail.com
CSVを列の値で分割できますか?
はい。1つまたは複数の列を選択し、グループ数をプレビューし、必要に応じて出力ファイル数の上限を設定し、レアな値を「other」ファイルにまとめることができます。
CSVをファイルサイズで分割できますか?
はい。ファイルごとの目標バイト数を設定できます。別のツールにアップロード制限がある場合に便利です。プレビューでは、行の長さのばらつきが大きく、見積もりの信頼性が低い場合に警告が表示されます。
CSVを月または年ごとに分割できますか?
はい。日付列を選択し、月・年・ISO週を指定し、不正な日付を専用ファイルに入れるかスキップするかを決められます。
このツールはZIPアーカイブを作成しますか?
はい。出力が1つの場合はCSVとしてダウンロードされます。複数ファイルに分割する場合は、大規模なセグメント化エクスポートも扱いやすいよう、ZIPとしてダウンロードされます。