Archivo CSV se ha convertido en un formato estándar para almacenar datos estructurados. El formato CSV usa archivos de texto y la mayoría de las aplicaciones exportan datos en CSV.
Las hojas de cálculo abren archivos CSV pero se bloquean con archivos grandes. Google Sheets muestra un error al subir un CSV grande y la experiencia de uso se vuelve terrible cuando supera unos cientos de miles de líneas.
Entonces, ¿cómo editar archivos CSV grandes cuando usted no es una persona técnica? Los data scientists y desarrolladores usan bases de datos o lenguajes de programación para interactuar con grandes conjuntos de datos. Pero eso queda lejos y es complejo para tareas diarias con CSV.
En esta guía, aprenderá:
- Cómo editar CSV de hasta 1,5 millones de filas online con una herramienta NoCode
- Cómo editar archivos aún más grandes
Ver vs editar archivos CSV
Esta guía se centra en editar archivos CSV. Si solo quiere abrir y visualizar (o filtrar) su archivo CSV, use soluciones de big data (como Microsoft PowerBi).
Una alternativa gratuita a las herramientas de big data es usar la Terminal en Linux y macOS. Vea nuestra guía: Cómo buscar en un archivo CSV grande usando la Terminal de Linux o macOS.
Hasta 1,5 millones de filas: edite CSV online con Datablist
Datablist es un editor de datos online. Abre archivos CSV directamente en su navegador sin software de terceros. Datablist funciona usando la base de datos integrada en los navegadores modernos (revise nuestra documentación para saber más).
En el plan gratuito, Datablist permite cargar archivos CSV de hasta 1 millón de líneas. El límite es de 1,5 millones de líneas con el Plan Standard. Consulte la página de precios para comparar planes.
Paso 1: Cree una colección e importe su archivo CSV
Nota
El CSV editor de Datablist requiere registrarse para abrir archivos CSV grandes. Cree una cuenta antes de continuar.
Para importar su archivo CSV en Datablist, cree una colección vacía y use el asistente "Import CSV/Excel" para cargar su archivo.
Seleccione las columnas del CSV que desea importar y confirme los tipos de datos detectados. Datablist lee las primeras líneas de su archivo y detecta el tipo de dato para cada columna. Los tipos de datos son importantes para ordenar y filtrar su colección más adelante.
Revise la vista previa de los datos y haga clic en "Import" para iniciar el proceso.
Notas
Cargar un CSV grande lleva tiempo. Espere unos 5 minutos para un archivo de 1 millón de líneas. Para cancelar la carga antes de que termine, haga clic en el botón "Stop Import". Detendrá el proceso.
Paso 2: Edite su archivo CSV grande online
Durante la importación, su archivo CSV se analiza. Y los datos se guardan en una base de datos local dentro de su navegador. Los datos persisten al recargar la página y no se borrarán hasta que usted lo indique (o si alcanza el límite de su disco).
Con Datablist, puede filtrar su archivo CSV con una o varias condiciones y usar búsqueda de "texto completo".
Notas
Los tiempos de respuesta al filtrar y buscar dependen del número de elementos y del número de resultados disponibles. Cuantos más elementos coincidan, más rápido verá los resultados. Si Datablist debe leer todos los elementos para encontrar uno o ninguno, el tiempo de respuesta será mayor.
Editar elementos
Edite sus elementos con una interfaz tipo hoja de cálculo. Presione "Enter" sobre una celda para editar su contenido. Para valores de fecha y hora, hay un calendario disponible. Y los textos largos se editan en un área de texto amplia.
Un panel lateral con el detalle del elemento se abre al hacer clic en el botón de expandir a la izquierda de la fila.
Combinar elementos duplicados
Datablist incluye funciones avanzadas de edición para gestionar sus datos. Una de ellas es el Duplicates Finder.
El algoritmo de deduplicación compara los valores de una o varias propiedades y lista todos los elementos duplicados. En el listado de duplicados, puede combinar automáticamente todos los elementos no conflictivos. Un asistente de combinación está disponible para resolver los duplicados con conflictos. Lea nuestras guías para aprender cómo deduplicar un archivo CSV o cómo combinar filas duplicadas en un archivo Excel.
Combinar elementos
La combinación de elementos está disponible directamente en la vista de listado de datos. Seleccione los elementos que desea combinar y haga clic en el botón "Merge Items".
Todos los elementos seleccionados se comparan y el elemento con más datos se elige como "Primary Item". Luego, los valores no conflictivos de los otros elementos se copian en las propiedades vacías del elemento principal. Al confirmar la combinación, todos los elementos excepto el principal se eliminan. El elemento principal se conserva con los valores combinados.
Paso 3: Exporte sus datos CSV editados
Cuando termine sus modificaciones, puede mantener los datos en Datablist o exportarlos a un archivo CSV o Excel.
Hay opciones para configurar su exportación:
- Properties to export - Las propiedades de la colección pueden ocultarse del listado de datos. Cuando al menos una propiedad está oculta, el exportador le permite decidir si la exportación debe incluir todas las propiedades o solo las visibles.
- The export format - CSV o Excel.
- Column Delimiter - Para CSV, puede elegir el delimitador de columnas entre "Comma" o "Semicolon".
Importante
Excel no permite más de 32.000 caracteres por celda. Y Excel no podrá importar archivos Excel muy grandes (vea límites de Excel). Recomendamos usar formato CSV para colecciones grandes.
Para archivos CSV más grandes
Divida sus archivos CSV y una los resultados
Datablist tiene un límite de importación de 1,5 millones de líneas para CSV (1 millón de líneas en el plan gratuito). Superado ese límite, su archivo CSV se trunca. Para archivos más grandes, con varios millones de elementos, divida su CSV en varios CSV pequeños. Edítelos con Datablist, expórtelos como CSV y únalos de nuevo en un único archivo CSV grande.
Para dividir un CSV grande, busque en Google "Online CSV splitter". Yo uso el CSV splitter gratuito de ExtendsClass.
Importante
Para importar sus CSV pequeños en Datablist, deben tener una fila de encabezado. Es importante configurar su divisor de CSV para copiar la fila de encabezado en cada archivo resultante.
Siga el tutorial anterior para editar sus CSV pequeños.
Luego use otra herramienta online para unir todos sus CSV en uno. ExtendsClass ofrece una buena herramienta para unir CSV online.
Para usuarios de Mac y Linux
La última opción para usuarios de Mac y Linux es Visidata.
Visidata es una herramienta gratuita que usa la terminal para mostrar e interactuar con su archivo CSV. Puede asustar a usuarios no técnicos... Pero si quiere ponerse a prueba, ¡dele una oportunidad!
FAQ
¿Cuál es el límite de filas de Google Sheets?
En marzo de 2022, Google Sheets aumentó su límite a 10 millones de celdas (desde el límite anterior de 5 millones). Se traduce en un límite de filas al dividir ese máximo por el número de columnas de su CSV.
En teoría, Google Sheets podría usarse para abrir y editar archivos CSV grandes (cerca de un millón de filas).
Pero Google Sheets descarga toda la hoja desde su servidor a la memoria del navegador cada vez que abre la página. Para casos contables, permite crear fórmulas que usan datos de cualquier celda. Pero para listar y manipular datos, ¡esto es ineficiente! No recomiendo Google Sheets para manipulación de datos cuando supera unos cientos de miles de filas.
¿Cuál es el límite de filas de Airtable?
Según la página de soporte de Airtable, los límites son:
- Free Plan - 1,200 records per base
- Plus Plan - 5,000 records per base
- Pro Plan - 50,000 records per base
- Enterprise Plan - 100k records per table (250,000 records per base)
En Airtable, una fila/línea es un registro. Y una base se compone de varias tablas que pueden enlazarse entre sí (similar a un libro con varias hojas en una hoja de cálculo).
Con estos límites, Airtable no es una herramienta para abrir CSV grandes.
¿Cuál es el límite de filas de Microsoft Excel?
Según Microsoft Support, el límite de filas de Excel es 1,048,576 (a 2022).
Además, cada celda no puede contener más de 32,767 caracteres.
¿Cuál es el límite de filas de Apple Numbers?
Como otras hojas de cálculo, Apple Numbers no está pensado para manejar CSV grandes. Apple Numbers tiene un límite de 1,000,000 de filas por hoja. Esto aplica a CSV importados.
Pero la interfaz es inutilizable con tantas filas y editar una celda congela la aplicación durante varios segundos.
¿Tiene archivos CSV de ejemplo para probar Datablist?
¡Claro! Visite nuestra página de archivos CSV de ejemplo para descargar CSV con datos de hasta 2 millones de registros.