Dziel pliki CSV według znaczenia, a nie tylko według rozmiaru fragmentów

Wiele narzędzi typu CSV splitter kończy możliwości na opcji „co 1 000 wierszy”. Rzeczywiste eksporty są bardziej złożone. Czasem potrzebujesz jednego pliku na kraj, jednego pliku na miesiąc, jednego pliku dla kont enterprise albo pliku zapasowego dla wierszy, które nie pasowały do niczego. To narzędzie zostało stworzone właśnie z myślą o takich sytuacjach.

Prześlij plik CSV lub wklej go poniżej

Separator CSV, łamania linii w cudzysłowach, zduplikowane nagłówki i kodowanie są obsługiwane automatycznie.

Wklej lub upuść plik

Wklej CSV

Przydatne do szybkich testów lub gdy plik jest już w schowku.

Podgląd i pobieranie

Sprawdź liczbę plików, ostrzeżenia i podgląd każdego wyniku przed pobraniem.

Podgląd jest dostępny po skonfigurowaniu podziału

Wybierz tryb podziału, dostosuj ustawienia i sprawdź podgląd plików wyjściowych przed pobraniem.

Dziel pliki CSV według znaczenia, a nie tylko według rozmiaru fragmentów

Inteligentna analiza przed podziałem

Narzędzie automatycznie wykrywa kodowanie, separator, zduplikowane nagłówki, puste kolumny, pola z dużą ilością tekstu oraz kolumny grupujące o niskiej liczbie unikalnych wartości. Dzięki temu łatwiej wybrać praktyczny sposób podziału zamiast zgadywać.

Otrzymujesz też ostrzeżenia, gdy podział jest ryzykowny: zbyt wiele plików wyjściowych, zbyt wiele bardzo małych plików albo jeden ogromny segment, który znacząco przewyższa pozostałe.

Stworzone do dużych, rzeczywistych eksportów CSV

Duże pliki pozostają po stronie klienta. Przed pobraniem możesz podejrzeć wynik, zachować tylko potrzebne kolumny i wyeksportować jeden plik lub wiele plików w archiwum ZIP.

To rozwiązanie sprawdza się przy batchach do outreach, przekazywaniu danych per kraj, czyszczeniu CRM, przeglądach compliance i miesięcznych wycinkach historycznych.

Przewodnik po ustawieniach dla trudniejszych przypadków

Niektóre ustawienia podziału są bardzo przydatne, ale na pierwszy rzut oka nie zawsze oczywiste. Ikony pomocy w narzędziu prowadzą do odpowiadających im wyjaśnień poniżej, abyś mógł zrozumieć, co dane ustawienie rzeczywiście zmienia, zanim podejrzysz podział.

Wiersze, nakładanie i fragmenty według rozmiaru

To najszybsze tryby podziału i zazwyczaj najbezpieczniejsze, gdy potrzebujesz po prostu mniejszych plików.

Liczba wierszy na plik daje każdemu wynikowi zbliżoną liczbę wierszy. To najlepsza opcja, gdy narzędzia downstream zwracają uwagę na rozmiar batcha, a nie na kategorię czy znaczenie.

Nakładające się wiersze powielają kilka wierszy na granicy między plikami. Używaj tego tylko wtedy, gdy kolejny batch potrzebuje niewielkiego kontekstu z poprzedniego.

Zachowaj zgrupowane wiersze razem sprawia, że narzędzie nie rozdziela tego samego konta, firmy lub zamówienia między kilka plików. To ważne, gdy wiersze należące do jednego obiektu powinny pozostać razem.

Maksymalny rozmiar na plik służy do ograniczeń uploadu. Narzędzie stara się pozostać poniżej docelowego limitu bajtów, ale długość wierszy może się różnić, więc ostatni plik lub niektóre pliki mogą być mniej równe niż przy podziale według liczby wierszy.

Pliki wyjściowe według grup i rzadkie wartości

Podział według wartości sprawdza się najlepiej, gdy jeden CSV na kraj, ownera, status lub źródło ułatwia przeglądanie albo przekazanie wyniku dalej.

Podziel według kolumn(y) tworzy jeden wynik dla każdej unikalnej wartości lub kombinacji wartości. Jedna kolumna daje prostsze wyniki; dwie lub więcej kolumn tworzą bardziej szczegółowe pliki.

Obsługa rzadkich wartości pomaga, gdy jednorazowe wartości tworzyłyby zbyt wiele bardzo małych plików. Możesz zachować tylko największe grupy, a resztę scalić do segmentu „inne”.

Dodatkowo dziel duże grupy według rozmiaru pliku jest przydatne, gdy jedna kategoria jest znacznie większa od pozostałych. Zachowuje logikę grupowania, ale zapobiega temu, by pojedynczy ogromny plik dominował cały eksport.

Reguły, pierwsze dopasowanie i niedopasowane wiersze

Podział oparty na regułach jest przydatny, gdy miejsce docelowe pliku zależy od logiki biznesowej, a nie od jednej prostej kolumny grupującej.

Tylko pierwsze dopasowanie oznacza, że wiersz zatrzymuje się na pierwszej pasującej regule. Wyłączaj tę opcję tylko wtedy, gdy celowo chcesz skopiować ten sam wiersz do kilku plików wyjściowych.

Zachowaj niedopasowane wiersze w osobnym pliku zapewnia, że wiersze niespełniające żadnej z reguł nadal zostaną zachowane we własnym eksporcie.

Nazwa pliku dla niedopasowanych wierszy to po prostu nazwa tego pliku zbiorczego. Przydaje się, gdy chcesz uzyskać czytelny wynik, taki jak needs-review.csv lub no-rule-match.csv.

Daty, ustawienia eksportu i czystsze pliki wyjściowe

Te ustawienia mają znaczenie, gdy dane wejściowe są nieuporządkowane lub gdy nazwy eksportowanych plików muszą pasować do istniejącego workflow.

Format daty jest przeznaczony dla niejednoznacznych kolumn z datami. Jeśli detektor zgadnie błędnie, wymuś oczekiwany format przed grupowaniem według miesiąca, roku lub tygodnia.

Nieprawidłowe daty pozwalają zdecydować, czy błędne wartości powinny zostać pominięte, czy przeniesione do osobnego pliku. To bezpieczniejsze niż cicha utrata wierszy.

Wzorzec nazwy pliku kontroluje końcowe nazwy wyników. Używaj zmiennych takich jak {index} i {label}, gdy Twoje batche wymagają przewidywalnej numeracji.

Kolumny do zachowania w wyniku usuwają niepotrzebne kolumny przed podziałem. Dzięki temu eksporty są lżejsze i czystsze, szczególnie gdy oryginalny CSV zawiera kolumny pomocnicze, których nie chcesz przekazywać dalej.

Przypadki brzegowe, które to narzędzie obsługuje

Rzeczywiste eksporty CSV rzadko są idealnie czyste. To narzędzie zostało stworzone tak, aby radzić sobie z irytującymi przypadkami, które zwykle psują prostsze splittery.

Cytowane komórki, osadzone przecinki i podziały linii

Wiersze nie są dzielone tylko dlatego, że cytowana komórka zawiera przecinek albo podział linii.

Parser zachowuje cytowane wartości CSV w całości, dzięki czemu adresy, notatki lub długie pola tekstowe nie są rozbijane na fałszywe wiersze podczas podziału.

Zduplikowane nagłówki, puste kolumny i projekcja wyniku

Nieuporządkowane nagłówki i zbyt duże eksporty są częste w eksportach z CRM, finansów i supportu.

Zduplikowane nagłówki są normalizowane, więc porównania nadal działają. Puste kolumny można zidentyfikować, a projekcja pozwala usunąć kolumny przed wygenerowaniem wyników.

Duże pliki i lekki podgląd

Podgląd ma pomagać w podjęciu decyzji, a nie blokować przetwarzanie dużych plików.

W przypadku dużych podziałów opartych na wierszach narzędzie może utrzymać lekki podgląd i wstępnie załadować tylko pierwszy plik wyjściowy. Dodatkowe podglądy i pobrania są generowane na żądanie.

Nieprawidłowe daty, niedopasowane reguły i nierówne grupy

Splitter utrzymuje widoczność wierszy z przypadków brzegowych zamiast po cichu je odrzucać.

Wiersze z nieprawidłowymi datami mogą trafić do osobnego pliku, wiersze niepasujące do żadnej reguły mogą zostać zachowane we własnym eksporcie, a podziały grupowane mogą ostrzegać, gdy jeden segment jest znacznie większy od pozostałych.

Podziel według kraju lub statusu

Użyj podziału według grupowanych wartości, gdy chcesz mieć jeden CSV na kraj, ownera, status, źródło lub dowolne pole o niskiej liczbie unikalnych wartości.

Input

id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive
3,Carol,US,active
4,Dan,DE,lead

Output

split-fr.csv
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive

split-us.csv
id,name,country,status
3,Carol,US,active

Buduj pliki wyjściowe oparte na regułach

Reguły warunkowe pozwalają definiować praktyczne miejsca docelowe, takie jak konta enterprise, adresy Gmail lub wiersze zapasowe, które nie pasują do niczego.

Input

company_size,country,email
120,US,alice@gmail.com
25,FR,bob@startup.test
300,DE,ops@datablist.com

Output

enterprise.csv
company_size,country,email
120,US,alice@gmail.com
300,DE,ops@datablist.com

gmail.csv
company_size,country,email
120,US,alice@gmail.com

Czy mogę podzielić CSV według wartości w kolumnie?

Tak. Wybierz jedną lub kilka kolumn, podejrzyj liczbę grup, opcjonalnie ogranicz liczbę plików wyjściowych i zgrupuj rzadkie wartości w pliku „inne”.

Czy mogę podzielić CSV według rozmiaru pliku?

Tak. Ustaw docelową liczbę bajtów na plik. To przydatne, gdy inne narzędzie ma limity uploadu. Podgląd ostrzega, gdy długości wierszy są zbyt zmienne, by dało się uzyskać wiarygodne oszacowania.

Czy mogę podzielić CSV według miesiąca lub roku?

Tak. Wybierz kolumnę z datą, wskaż miesiąc, rok lub tydzień ISO i zdecyduj, czy nieprawidłowe daty mają trafić do osobnego pliku, czy zostać pominięte.

Czy narzędzie tworzy archiwum ZIP?

Tak. Podziały z jednym wynikiem są pobierane jako CSV. Podziały wieloplikowe są pobierane jako ZIP, dzięki czemu duże segmentowane eksporty pozostają łatwe do zarządzania.

Powiązane narzędzia

Splitter wierszy CSV

Rozdzielaj komórki z wieloma wartościami na osobne wiersze. Prześlij plik CSV, wybierz kolumnę i separator, a następnie rozwiń tagi, emaile lub numery telefonów do jednej wartości na wiersz.

Otwórz narzędzie

Narzędzie CSV Diff

Porównuj online dwa pliki CSV, dopasowuj wiersze po id lub email, wykrywaj wiersze dodane, usunięte, zmienione i niezmienione oraz pobieraj uporządkowany plik CSV z różnicami.

Otwórz narzędzie