Разделяйте CSV-файлы по смыслу, а не только по размеру частей

Многие инструменты для разделения CSV останавливаются на варианте «каждые 1 000 строк». Но реальные экспорты сложнее. Иногда нужен один файл на каждую страну, один файл на каждый месяц, один файл для enterprise-аккаунтов или отдельный fallback-файл для строк, которые ни с чем не совпали. Этот инструмент создан именно для таких сценариев.

Загрузите CSV или вставьте его ниже

Разделитель CSV, переносы строк в кавычках, дублирующиеся заголовки и кодировка обрабатываются автоматически.

Вставьте или перетащите файл

Вставить CSV

Полезно для быстрых тестов или когда файл уже находится в буфере обмена.

Предпросмотр и скачивание

Проверьте количество файлов, предупреждения и предпросмотр каждого результата перед скачиванием.

Предпросмотр доступен после настройки разделения

Выберите режим разделения, настройте параметры и просмотрите выходные файлы перед скачиванием.

Разделяйте CSV-файлы по смыслу, а не только по размеру частей

Умный анализ перед разделением

Инструмент автоматически определяет кодировку, разделитель, дублирующиеся заголовки, пустые колонки, поля с большим объёмом текста и колонки для группировки с низкой кардинальностью. Это упрощает выбор практичного способа разделения вместо догадок.

Вы также получаете предупреждения, если разделение рискованно: слишком много выходных файлов, слишком много очень маленьких файлов или один огромный сегмент, который значительно больше остальных.

Создан для больших реальных CSV-экспортов

Большие файлы остаются на стороне клиента. Вы можете просмотреть результат перед скачиванием, оставить только нужные колонки и экспортировать один файл или несколько файлов в ZIP-архиве.

Это особенно удобно для outreach-пакетов, передачи данных по странам, очистки CRM, compliance-проверок и ежемесячных исторических срезов.

Руководство по настройкам для сложных случаев

Некоторые настройки разделения очень мощные, но не всегда очевидны с первого взгляда. Иконки помощи в инструменте ведут к соответствующим объяснениям ниже, чтобы вы понимали, что именно меняет каждая настройка, ещё до предварительного просмотра результата.

Строки, overlap и части по размеру

Это самые быстрые режимы разделения и обычно самые безопасные, если вам просто нужны файлы меньшего размера.

Строк на файл — каждый выходной файл получает примерно одинаковое количество строк. Это лучший вариант, когда downstream-инструменты ориентируются на размер batch, а не на категорию или смысл данных.

Overlap строк — повторяет несколько строк на границе между файлами. Используйте только тогда, когда следующему batch нужен небольшой контекст из предыдущего.

Сохранять сгруппированные строки вместе — не позволяет инструменту разделять один и тот же аккаунт, компанию или заказ между несколькими файлами. Это важно, когда строки, относящиеся к одной сущности, должны оставаться вместе.

Максимальный размер файла — подходит для ограничений на загрузку. Инструмент старается не превышать заданный размер в байтах, но длина строк может различаться, поэтому последний файл или некоторые файлы могут быть менее равномерными, чем при разделении по строкам.

Сгруппированные выходные файлы и редкие значения

Разделение по значениям лучше всего подходит, когда один CSV на страну, владельца, статус или источник упрощает проверку или передачу результатов.

Разделять по колонке(ам) — создаёт один выходной файл для каждого уникального значения или комбинации значений. Одна колонка даёт более простые результаты; две и более колонки создают более детализированные файлы.

Обработка редких значений — помогает, когда разовые значения создают слишком много маленьких файлов. Можно оставить только самые большие группы, а остальные объединить в файл «other».

Также разделять большие группы по размеру файла — полезно, когда одна категория значительно больше остальных. Это сохраняет логику группировки, но не даёт одному огромному файлу доминировать в экспорте.

Правила, первое совпадение и несовпавшие строки

Разделение на основе правил полезно, когда назначение файлов зависит от бизнес-логики, а не от одной простой колонки группировки.

Только первое совпадение — означает, что строка останавливается на первом правиле, которому соответствует. Отключайте это только тогда, когда вы намеренно хотите скопировать одну и ту же строку в несколько выходных файлов.

Сохранять несовпавшие строки в отдельном файле — гарантирует, что строки, не удовлетворяющие ни одному правилу, всё равно будут сохранены в отдельном экспорте.

Имя файла для несовпавших строк — это просто название такого файла-накопителя. Полезно, если вам нужен понятный результат вроде needs-review.csv или no-rule-match.csv.

Даты, настройки экспорта и более чистые выходные файлы

Эти настройки особенно важны, когда входные данные неаккуратны или когда имена экспортируемых файлов должны соответствовать существующему workflow.

Формат даты — нужен для неоднозначных колонок с датами. Если детектор ошибся, принудительно задайте ожидаемый формат перед группировкой по месяцу, году или неделе.

Некорректные даты — позволяет решить, нужно ли пропускать ошибочные значения или переносить их в отдельный файл. Это безопаснее, чем незаметно терять строки.

Шаблон имени файла — управляет итоговыми именами выходных файлов. Используйте переменные вроде {index} и {label}, когда вашим batch нужны предсказуемые номера.

Колонки, которые нужно сохранить в выходном файле — удаляет ненужные колонки до разделения. Это делает экспорт легче и чище, особенно если исходный CSV содержит служебные колонки, которые не нужны downstream-инструментам.

Пограничные случаи, с которыми справляется этот инструмент

Реальные CSV-экспорты редко бывают идеально чистыми. Этот инструмент создан, чтобы справляться с раздражающими случаями, на которых обычно ломаются более простые splitter-инструменты.

Ячейки в кавычках, встроенные запятые и переносы строк

Строки не разделяются только потому, что ячейка в кавычках содержит запятую или перенос строки.

Парсер сохраняет значения CSV в кавычках целыми, поэтому адреса, заметки или длинные текстовые поля не превращаются в ложные строки при разделении.

Дублирующиеся заголовки, пустые колонки и проекция выходных данных

Неаккуратные заголовки и слишком большие экспорты часто встречаются в экспортируемых данных из CRM, финансовых систем и support-систем.

Дублирующиеся заголовки нормализуются, поэтому сравнения продолжают работать корректно. Пустые колонки можно выявить, а проекция позволяет удалить колонки до генерации выходных файлов.

Большие файлы и отложенный preview

Предварительный просмотр должен помогать принять решение, а не мешать обработке больших файлов.

Для больших разделений по строкам инструмент может оставлять preview лёгким и предварительно загружать только первый выходной файл. Дополнительные preview и скачивания формируются по запросу.

Некорректные даты, несовпавшие правила и неравномерные группы

Splitter сохраняет видимость строк из пограничных случаев вместо того, чтобы незаметно их отбрасывать.

Строки с некорректными датами можно отправить в отдельный файл, строки, не совпавшие ни с одним правилом, можно сохранить в собственном экспорте, а при группировке инструмент предупредит, если один сегмент значительно больше остальных.

Разделение по стране или статусу

Используйте разделение по сгруппированным значениям, когда нужен один CSV на страну, владельца, статус, источник или любое другое поле с низкой кардинальностью.

Input

id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive
3,Carol,US,active
4,Dan,DE,lead

Output

split-fr.csv
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive

split-us.csv
id,name,country,status
3,Carol,US,active

Создавайте выходные файлы на основе правил

Условные правила позволяют задавать практичные назначения, например для enterprise-аккаунтов, адресов Gmail или fallback-строк, которые ни с чем не совпали.

Input

company_size,country,email
120,US,alice@gmail.com
25,FR,bob@startup.test
300,DE,ops@datablist.com

Output

enterprise.csv
company_size,country,email
120,US,alice@gmail.com
300,DE,ops@datablist.com

gmail.csv
company_size,country,email
120,US,alice@gmail.com

Можно ли разделить CSV по значению колонки?

Да. Выберите одну или несколько колонок, просмотрите количество групп, при необходимости ограничьте число выходных файлов и объедините редкие значения в файл «other».

Можно ли разделить CSV по размеру файла?

Да. Задайте целевой размер в байтах для каждого файла. Это полезно, когда у другого инструмента есть ограничения на загрузку. Preview предупредит, если длина строк слишком различается для надёжной оценки.

Можно ли разделить CSV по месяцам или годам?

Да. Выберите колонку с датой, укажите месяц, год или неделю ISO и решите, нужно ли отправлять некорректные даты в отдельный файл или пропускать их.

Создаёт ли инструмент ZIP-архив?

Да. Разделения с одним результатом скачиваются как CSV. Разделения на несколько файлов скачиваются как ZIP, чтобы с большими сегментированными экспортами было удобнее работать.

Разделяйте CSV-файлы по смыслу, а не только по размеру частей

Предпросмотр и скачивание

Предпросмотр доступен после настройки разделения

Разделяйте CSV-файлы по смыслу, а не только по размеру частей

Умный анализ перед разделением

Создан для больших реальных CSV-экспортов

Руководство по настройкам для сложных случаев

Строки, overlap и части по размеру

Сгруппированные выходные файлы и редкие значения

Правила, первое совпадение и несовпавшие строки

Даты, настройки экспорта и более чистые выходные файлы

Пограничные случаи, с которыми справляется этот инструмент

Ячейки в кавычках, встроенные запятые и переносы строк

Дублирующиеся заголовки, пустые колонки и проекция выходных данных

Большие файлы и отложенный preview

Некорректные даты, несовпавшие правила и неравномерные группы

Разделение по стране или статусу

Создавайте выходные файлы на основе правил

Можно ли разделить CSV по значению колонки?

Можно ли разделить CSV по размеру файла?

Можно ли разделить CSV по месяцам или годам?

Создаёт ли инструмент ZIP-архив?

Похожие инструменты

Разделитель строк CSV

Инструмент сравнения CSV