Archivo CSV se ha convertido en un formato estándar para almacenar datos estructurados. El formato CSV usa archivos de texto y la mayoría de las aplicaciones exportan datos en CSV.

Las hojas de cálculo abren archivos CSV pero se bloquean con archivos grandes. Google Sheets muestra un error al subir un CSV grande y la experiencia de uso se vuelve terrible cuando supera unos cientos de miles de líneas.

Google Sheets Error on big CSV file
Google Sheets Error on big CSV file

Entonces, ¿cómo editar archivos CSV grandes cuando usted no es una persona técnica? Los data scientists y desarrolladores usan bases de datos o lenguajes de programación para interactuar con grandes conjuntos de datos. Pero eso queda lejos y es complejo para tareas diarias con CSV.

En esta guía, aprenderá:

Ver vs editar archivos CSV

Esta guía se centra en editar archivos CSV. Si solo quiere abrir y visualizar (o filtrar) su archivo CSV, use soluciones de big data (como Microsoft PowerBi).

Una alternativa gratuita a las herramientas de big data es usar la Terminal en Linux y macOS. Vea nuestra guía: Cómo buscar en un archivo CSV grande usando la Terminal de Linux o macOS.

Hasta 1,5 millones de filas: edite CSV online con Datablist

Datablist es un editor de datos online. Abre archivos CSV directamente en su navegador sin software de terceros. Datablist funciona usando la base de datos integrada en los navegadores modernos (revise nuestra documentación para saber más).

En el plan gratuito, Datablist permite cargar archivos CSV de hasta 1 millón de líneas. El límite es de 1,5 millones de líneas con el Plan Standard. Consulte la página de precios para comparar planes.

Paso 1: Cree una colección e importe su archivo CSV

Nota
El CSV editor de Datablist requiere registrarse para abrir archivos CSV grandes. Cree una cuenta antes de continuar.

Para importar su archivo CSV en Datablist, cree una colección vacía y use el asistente "Import CSV/Excel" para cargar su archivo.

Create new collection
Create new collection
Select CSV file
Select CSV file

Seleccione las columnas del CSV que desea importar y confirme los tipos de datos detectados. Datablist lee las primeras líneas de su archivo y detecta el tipo de dato para cada columna. Los tipos de datos son importantes para ordenar y filtrar su colección más adelante.

Check column CSV column data type
Check column CSV column data type

Revise la vista previa de los datos y haga clic en "Import" para iniciar el proceso.

Import CSV progress
Import CSV progress

Notas
Cargar un CSV grande lleva tiempo. Espere unos 5 minutos para un archivo de 1 millón de líneas. Para cancelar la carga antes de que termine, haga clic en el botón "Stop Import". Detendrá el proceso.

Paso 2: Edite su archivo CSV grande online

Durante la importación, su archivo CSV se analiza. Y los datos se guardan en una base de datos local dentro de su navegador. Los datos persisten al recargar la página y no se borrarán hasta que usted lo indique (o si alcanza el límite de su disco).

Con Datablist, puede filtrar su archivo CSV con una o varias condiciones y usar búsqueda de "texto completo".

Notas
Los tiempos de respuesta al filtrar y buscar dependen del número de elementos y del número de resultados disponibles. Cuantos más elementos coincidan, más rápido verá los resultados. Si Datablist debe leer todos los elementos para encontrar uno o ninguno, el tiempo de respuesta será mayor.

Filter and search your CSV data
Filter and search your CSV data

Editar elementos

Edite sus elementos con una interfaz tipo hoja de cálculo. Presione "Enter" sobre una celda para editar su contenido. Para valores de fecha y hora, hay un calendario disponible. Y los textos largos se editan en un área de texto amplia.

Edite celdas de su CSV directamente en su navegador

Un panel lateral con el detalle del elemento se abre al hacer clic en el botón de expandir a la izquierda de la fila.

Filter and search your CSV data
Filter and search your CSV data

Combinar elementos duplicados

Datablist incluye funciones avanzadas de edición para gestionar sus datos. Una de ellas es el Duplicates Finder.

Find and remove duplicate values
Find and remove duplicate values

El algoritmo de deduplicación compara los valores de una o varias propiedades y lista todos los elementos duplicados. En el listado de duplicados, puede combinar automáticamente todos los elementos no conflictivos. Un asistente de combinación está disponible para resolver los duplicados con conflictos. Lea nuestras guías para aprender cómo deduplicar un archivo CSV o cómo combinar filas duplicadas en un archivo Excel.

Combinar elementos

La combinación de elementos está disponible directamente en la vista de listado de datos. Seleccione los elementos que desea combinar y haga clic en el botón "Merge Items".

Select and merge items from listing
Select and merge items from listing

Todos los elementos seleccionados se comparan y el elemento con más datos se elige como "Primary Item". Luego, los valores no conflictivos de los otros elementos se copian en las propiedades vacías del elemento principal. Al confirmar la combinación, todos los elementos excepto el principal se eliminan. El elemento principal se conserva con los valores combinados.

Manual merging assistant
Manual merging assistant

Paso 3: Exporte sus datos CSV editados

Cuando termine sus modificaciones, puede mantener los datos en Datablist o exportarlos a un archivo CSV o Excel.

Export your data
Export your data

Hay opciones para configurar su exportación:

  • Properties to export - Las propiedades de la colección pueden ocultarse del listado de datos. Cuando al menos una propiedad está oculta, el exportador le permite decidir si la exportación debe incluir todas las propiedades o solo las visibles.
  • The export format - CSV o Excel.
  • Column Delimiter - Para CSV, puede elegir el delimitador de columnas entre "Comma" o "Semicolon".
Exporter options
Exporter options

Importante
Excel no permite más de 32.000 caracteres por celda. Y Excel no podrá importar archivos Excel muy grandes (vea límites de Excel). Recomendamos usar formato CSV para colecciones grandes.

Para archivos CSV más grandes

Divida sus archivos CSV y una los resultados

Datablist tiene un límite de importación de 1,5 millones de líneas para CSV (1 millón de líneas en el plan gratuito). Superado ese límite, su archivo CSV se trunca. Para archivos más grandes, con varios millones de elementos, divida su CSV en varios CSV pequeños. Edítelos con Datablist, expórtelos como CSV y únalos de nuevo en un único archivo CSV grande.

Para dividir un CSV grande, busque en Google "Online CSV splitter". Yo uso el CSV splitter gratuito de ExtendsClass.

Importante
Para importar sus CSV pequeños en Datablist, deben tener una fila de encabezado. Es importante configurar su divisor de CSV para copiar la fila de encabezado en cada archivo resultante.

Split your big CSV file online
Split your big CSV file online

Siga el tutorial anterior para editar sus CSV pequeños.

Luego use otra herramienta online para unir todos sus CSV en uno. ExtendsClass ofrece una buena herramienta para unir CSV online.

Merge CSV files online
Merge CSV files online

Para usuarios de Mac y Linux

La última opción para usuarios de Mac y Linux es Visidata.

Visidata es una herramienta gratuita que usa la terminal para mostrar e interactuar con su archivo CSV. Puede asustar a usuarios no técnicos... Pero si quiere ponerse a prueba, ¡dele una oportunidad!

Visidata Screenshot
Visidata Screenshot

FAQ

¿Cuál es el límite de filas de Google Sheets?

En marzo de 2022, Google Sheets aumentó su límite a 10 millones de celdas (desde el límite anterior de 5 millones). Se traduce en un límite de filas al dividir ese máximo por el número de columnas de su CSV.

En teoría, Google Sheets podría usarse para abrir y editar archivos CSV grandes (cerca de un millón de filas).

Pero Google Sheets descarga toda la hoja desde su servidor a la memoria del navegador cada vez que abre la página. Para casos contables, permite crear fórmulas que usan datos de cualquier celda. Pero para listar y manipular datos, ¡esto es ineficiente! No recomiendo Google Sheets para manipulación de datos cuando supera unos cientos de miles de filas.

¿Cuál es el límite de filas de Airtable?

Según la página de soporte de Airtable, los límites son:

  • Free Plan - 1,200 records per base
  • Plus Plan - 5,000 records per base
  • Pro Plan - 50,000 records per base
  • Enterprise Plan - 100k records per table (250,000 records per base)

En Airtable, una fila/línea es un registro. Y una base se compone de varias tablas que pueden enlazarse entre sí (similar a un libro con varias hojas en una hoja de cálculo).

Con estos límites, Airtable no es una herramienta para abrir CSV grandes.

¿Cuál es el límite de filas de Microsoft Excel?

Según Microsoft Support, el límite de filas de Excel es 1,048,576 (a 2022).

Además, cada celda no puede contener más de 32,767 caracteres.

¿Cuál es el límite de filas de Apple Numbers?

Como otras hojas de cálculo, Apple Numbers no está pensado para manejar CSV grandes. Apple Numbers tiene un límite de 1,000,000 de filas por hoja. Esto aplica a CSV importados.

Pero la interfaz es inutilizable con tantas filas y editar una celda congela la aplicación durante varios segundos.

Apple Numbers rows limit
Apple Numbers rows limit

¿Tiene archivos CSV de ejemplo para probar Datablist?

¡Claro! Visite nuestra página de archivos CSV de ejemplo para descargar CSV con datos de hasta 2 millones de registros.