Comparar archivos CSV online.
Suelta dos archivos CSV y ve al instante qué filas faltan, cuáles están duplicadas, cambiadas o casi coincidentes. Sin fórmulas, sin scripts — todo se ejecuta en tu navegador.
¿Cuándo necesitas comparar dos archivos CSV?
Dos CSVs que deberían coincidir casi nunca lo hacen. Un export que se ejecutó dos veces y duplicó una fila. Un trabajo de sincronización que perdió un puñado de registros y nadie se dio cuenta. Un archivo salió de una consulta SQL y el otro de una hoja de cálculo que alguien editó a mano el fin de semana. El trabajo es averiguar el diff real entre los dos y actuar — sin escribir un script y sin pasarse media tarde en Excel con BUSCARV y formato condicional.
- Reconciliar dos exports del mismo dataset desde sistemas distintos
- Verificar que una migración de datos movió todas las filas
- Encontrar pedidos en el almacén que no aparecen en el CRM
- Comparar un albarán de un proveedor contra una lista interna de pedidos
- Validar un sync diario — qué ha cambiado desde ayer
- Deduplicar y comparar antes de importar a un CRM o ERP
Por qué comparar CSVs es más difícil de lo que parece
Dos CSVs que deberían coincidir a menudo no lo hacen — porque uno tiene espacios al final, el otro tiene las tildes quitadas, un tercero tiene las filas en distinto orden, o hay claves duplicadas de un export que se ejecutó dos veces. Un diff ingenuo (sort + diff en la terminal) te dirá que casi todas las filas son distintas, porque la comparación byte a byte trata 'José', 'JOSE ' y 'jose' como tres valores diferentes. El trabajo es comparar significado, no bytes.
MessyMatch normaliza los valores antes de comparar: quita espacios, colapsa espacios internos, ignora tildes, colapsa mayúsculas, quita puntuación, elimina caracteres invisibles. Las cadenas originales nunca se modifican — la forma normalizada se usa sólo para emparejar, así que el panel de resultados sigue mostrándote exactamente lo que había en tu archivo.
Cómo funciona la comparación de CSVs
Suelta el archivo A y el archivo B. MessyMatch parsea los dos en tu navegador, autodetecta el delimitador (coma, punto y coma, tabulador, barra vertical) y la fila de cabeceras incluso cuando los datos contienen fechas, teléfonos o tildes. Tú eliges el modo de comparación (fila completa o columna clave), activas las reglas de limpieza que quieras y pulsas comparar. El motor indexa ambos archivos en un mapa hash usando los valores normalizados como clave y produce un diff indexado en segundos — incluso para archivos que Excel no puede abrir.
El resultado se desglosa en siete secciones: filas sólo en A, filas sólo en B, filas en ambos, duplicados dentro de A, duplicados dentro de B, filas cambiadas (misma clave, valores distintos en otras columnas) y coincidencias aproximadas (filas que parecen similares tras el scoring difuso). Cada sección tiene su propio botón de exportar — CSV, XLSX o copiar como TSV — así puedes actuar sobre cualquier parte por separado.
Fila completa vs columna clave
El modo fila completa trata cada celda como parte de la identidad de la fila. Es el modo adecuado cuando los dos archivos deberían ser idénticos byte a byte fila por fila tras la normalización. El modo columna clave empareja filas por una o más columnas que tú eliges — customer_id, email, order_number, SKU — y es el adecuado cuando los dos archivos comparten un identificador pero listan las demás columnas en orden distinto o con formato distinto. El motor construye un índice hash sobre la columna clave para que la comparación siga siendo rápida incluso con cientos de miles de filas.
Lo que obtienes en el panel de resultados
- Filas sólo en el archivo A — faltan en B
- Filas sólo en el archivo B — nuevas desde el último export
- Filas en ambos archivos — coincidencias confirmadas
- Filas duplicadas dentro de cada archivo (dedupe intra-archivo)
- Coincidencias aproximadas: valores que parecen iguales pero difieren ligeramente
- Filas cambiadas: misma clave, valores distintos en otras columnas
Browser-first por diseño
El contenido de tu CSV se procesa en tu navegador con un Web Worker y no se transmite a nuestros servidores. No existe un endpoint de subida para los datos del archivo — el Web Worker lee el archivo desde el disco, ejecuta la comparación localmente y devuelve el resultado al navegador para mostrarlo y exportarlo. Sólo registramos metadatos de la operación (número de filas, tamaño, formato, tiempo) para los límites antiabuso y los tramos de precio. Mira la política de privacidad para la lista completa de lo que recogemos y lo que no.
Herramientas relacionadas
Preguntas frecuentes
¿Se suben mis archivos CSV a algún sitio?+
No. El parseo y la comparación ocurren en tu navegador mediante un Web Worker. nuestros servidores no reciben el contenido de tus archivos durante el procesamiento normal en el navegador.
¿Puedo comparar CSVs con columnas en distinto orden?+
Sí. Usa el modo de columna clave para emparejar filas por una columna concreta, independientemente del orden de las demás columnas.
¿Qué es una coincidencia aproximada?+
Dos filas que comparten la misma clave pero difieren ligeramente — por ejemplo, diferencias de tildes o mayúsculas en un nombre. Las coincidencias aproximadas se marcan aparte de las exactas e incluyen el motivo.
¿Funciona con archivos CSV grandes?+
Sí, hasta los límites de filas y tamaño de tu plan. Los usuarios anónimos pueden comparar archivos de hasta 2.000 filas gratis; archivos más grandes usan los tramos de pago por operación.
¿Puedo comparar archivos con cabeceras distintas?+
Sí. Puedes mapear columnas entre los dos archivos explícitamente cuando elijes modo de columna clave o multi-clave.
¿Encuentra duplicados dentro de cada archivo?+
Sí. Las claves repetidas dentro del archivo A y dentro del archivo B se reportan por separado de la comparación cruzada.