Elimina las líneas duplicadas, online
Pega cualquier lista. Activa cuatro reglas. Obtén un resultado limpio que conserva el orden, las mayúsculas y los espacios que de verdad querías. Hecha para equipos de datos en producción.
O pulsa Ctrl+Enter
Lo que la gente limpia aquí
04 — casos de usoLimpia exportaciones de CRM, Mailchimp o HubSpot antes de importar — sin destrozar el orden de tus columnas.
Audita hojas enormes de palabras clave, encuentra duplicados entre campañas antes del lanzamiento.
Quita duplicados de CSV / TSV antes del INSERT — sin distinguir mayúsculas, con detección de espacios, hasta 80 MB.
Colapsa rastros de pila repetidos y líneas de log ruidosas en una lista limpia que puedas escanear.
Cómo funciona
tres pasos-
01
Pega tu lista o sube un .txt
Vista previa en vivo hasta 100.000 líneas en escritorio / 5.000 en móvil. Entradas mayores pasan a modo de archivos grandes automáticamente — mismo motor, la página sigue receptiva y entrega un .txt.
-
02
Activa las cuatro reglas
Mayúsculas/minúsculas: tratar ABC y abc como iguales o no. Recortar: ignorar espacios al inicio/final en la comparación. Vacías: descartar líneas vacías. Mezclar: aleatorizar la salida tras eliminar duplicados.
-
03
Haz clic en Ejecutar
Los duplicados se agrupan en una sola línea; se conserva la primera aparición. La tarjeta de salida muestra la lista limpia en su orden original.
Bajo el capó
notas técnicas- Algoritmo
- Dedup O(n) con tabla hash · Object.create(null) sin prototipo
- Reparto por umbral
- Escritorio: 2 MB / 100.000 líneas · Móvil: 300 KB / 5.000 líneas · Tope duro: 80 MB
- Conservación del orden
- Índice de primera aparición registrado durante el dedupe
Complejidad total O(n + u log u + s log s) donde n = líneas de entrada, u = líneas únicas, s = longitud de salida. La versión previa llamaba Object.keys(freqMap).length dentro del bucle por línea — O(n²), 156.000 líneas tardaban 5 minutos. La implementación actual procesa el mismo input en ~500 ms.
Por encima del umbral en vivo, el input nunca entra al textarea (el word-wrap nativo del navegador es O(n) al insertar) — el procesamiento se mueve a un Web Worker, la página sigue interactiva y recibes un .txt.
"Eliminar duplicados" de Excel y UNIQUE() de Google Sheets re-ordenan columnas por dentro — nosotros conservamos el orden original por defecto. Activa Mezclar si prefieres una salida aleatorizada con Fisher-Yates.
Privacidad y límites
qué se queda dóndeTodo se ejecuta en tu navegador. La lista que pegas nunca se sube — la página no hace ninguna petición fetch con tus datos, y la capa de analíticas no puede ver lo que escribiste. Tras la carga puedes desconectarte de la red y la herramienta sigue funcionando. El tope duro de 80 MB por ejecución evita que bloquees la pestaña con un log de varios gigabytes.
Preguntas frecuentes
respondidas¿El dedupe insensible a mayúsculas también pasa la salida a minúsculas?
No. El interruptor de mayúsculas/minúsculas solo afecta a la comparación — "Apple" y "APPLE" se tratan como duplicados y solo se conserva el primero, pero la línea conservada mantiene su capitalización original. La salida nunca se pasa a minúsculas.
¿Puedo conservar la ÚLTIMA aparición de cada duplicado en vez de la primera?
Sí — encadena dos herramientas. Pasa la entrada primero por la herramienta de Invertir líneas, luego pega la lista invertida en el eliminador de duplicados. Puedes invertir la salida final una vez más si necesitas la dirección original. Ambos pasos son locales, sin subida.
¿En qué se diferencia de Excel "Eliminar duplicados"?
Tres diferencias: (1) corremos en el navegador — pega desde cualquier lugar sin abrir Excel, (2) conservamos las mayúsculas y los espacios exactamente, mientras Excel a veces "normaliza" celdas automáticamente, (3) Excel "Eliminar duplicados" suele re-ordenar la columna por dentro; nosotros mantenemos el orden original por defecto.
¿Maneja CSV con campos entrecomillados que contienen comas?
Trata cada línea como una sola cadena para la comparación — los campos entre comillas con comas se comparan como parte de la línea completa. Si necesitas eliminar duplicados por columna ("borrar filas donde la columna B coincida"), esta no es la herramienta adecuada; usa UNIQUE() de Google Sheets o un paso de Power Query en su lugar.
¿Cuál es el límite de tamaño?
Tope duro de 80 MB por ejecución. Por encima de 2 MB en escritorio (300 KB en móvil) la herramienta cambia a modo de archivos grandes — el texto no pasa por el textarea, el procesamiento se hace en un Web Worker, y el resultado se descarga como .txt en vez de renderizarse.
¿Se envía mi información a algún sitio?
No. Todo el pipeline — pegar, eliminar duplicados, mostrar — vive en esta pestaña del navegador. No hay paso de subida, y la capa de telemetría nunca ve lo que pegas. Desconecta el WiFi tras cargar la página y la herramienta sigue funcionando.