¡Los valores duplicados en sus datos de Microsoft Excel pueden ser un gran problema! Esto puede provocar errores sustanciales y sobrestimar sus resultados.
Pero encontrar y eliminar duplicados es bastante fácil en Excel.
En este tutorial, veremos varios métodos para localizar y eliminar valores duplicados de sus datos.
¿Qué es un valor duplicado?
Los valores duplicados ocurren cuando el mismo valor o el mismo conjunto de valores aparece en sus datos.
Para un conjunto de datos, puede encontrar duplicados de diferentes formas.
En el ejemplo anterior, hay un conjunto de datos simple con 3 columnas para marca, modelo y año para una lista de automóviles.
- La primera tabla resalta todos los duplicados basándose únicamente en la marca del automóvil.
- La segunda tabla destaca todos los duplicados según la marca y el modelo del automóvil. Esto da como resultado un duplicado menos.
- La tercera tabla resalta todos los duplicados en función de todas las columnas. Como resultado, se consideran duplicados menos valores.
Los resultados de los duplicados basados en una sola columna en comparación con la tabla completa pueden ser muy diferentes. Siempre debe saber qué versión desea y qué hace Excel.
Busque y elimine valores duplicados con el comando Eliminar duplicados
Eliminar duplicados en los datos es una tarea muy común. Es tan común que hay un comando dedicado para hacerlo en la cinta.
Seleccione una celda dentro de los datos de los que desea eliminar los duplicados y vaya a la pestaña Datos y haga clic en el comando Eliminar duplicados .
Excel luego seleccionará todos los datos y abrirá la ventana Eliminar duplicados.
- Luego, debe indicarle a Excel si los datos contienen encabezados de columna en la primera fila. Si esta casilla está marcada, la primera fila de datos se excluirá al buscar y eliminar valores duplicados.
- A continuación, puede seleccionar las columnas que se utilizarán para determinar los duplicados. También hay prácticos botones Seleccionar todo y Deseleccionar todo que puede usar si tiene una lista larga de columnas en sus datos.
Cuando presiona Aceptar , Excel eliminará los valores duplicados que encuentre y le dará un resumen de la cantidad de valores eliminados y la cantidad de valores restantes.
Este comando modificará sus datos, por lo que es mejor ejecutar el comando en una copia de sus datos para mantener los datos originales.
Busque y elimine valores duplicados con filtros avanzados
También hay otra forma de eliminar valores duplicados en sus datos de la cinta. Esto es posible desde los filtros avanzados.
Seleccione una celda en los datos y vaya a la pestaña Datos y haga clic en el comando Filtro avanzado.
Esto abrirá la ventana Filtro avanzado.
- Puede elegir filtrar la lista en su lugar o copiarla en otra ubicación . El filtrado de la lista en su lugar ocultará las filas que contienen los duplicados, mientras que la copia en otra ubicación creará una copia de los datos .
- Excel adivinará el rango de datos, pero puede ajustarlo en el rango de la lista . El área de criterios puede dejarse vacía y el campo Copiar a debe completarse si se ha elegido la opción Copiar a otra ubicación .
- Marque la casilla de verificación Extraer sin duplicado.
Presiona OK y eliminas los valores duplicados.
Los filtros avanzados pueden ser una opción útil para deshacerse de sus valores duplicados y crear una copia de sus datos al mismo tiempo. Pero los filtros avanzados solo podrán hacer esto en toda la mesa .
Busque y elimine duplicados con Power Query
Power Query solo se trata de transformar datos, por lo que puede estar seguro de que tiene la capacidad de buscar y eliminar valores duplicados.
Seleccione la tabla de la que desea eliminar los duplicados ➜ vaya a la pestaña Datos ➜ elija una consulta de una tabla / rango .
Eliminar duplicados basados en una o más columnas
Con Power Query, puede eliminar duplicados basados en una o más columnas de la tabla.
Debe seleccionar las columnas en las que eliminar los duplicados. Puede mantener presionada la tecla Ctrl para seleccionar varias columnas.
Haga clic con el botón derecho en el encabezado de la columna seleccionada y elija Eliminar duplicados en el menú.
También puede acceder a este comando desde la pestaña Inicio ➜ Contraer filas ➜ Eliminar filas ➜ Eliminar duplicados.
Si examina la fórmula creada, usa la función Table.Distinct con el segundo parámetro que hace referencia a las columnas a usar.
Eliminar duplicados basados en toda la tabla
Para eliminar duplicados basados en toda la tabla, puede seleccionar todas las columnas de la tabla y luego eliminar los duplicados. Pero hay un método más rápido que no requiere que seleccione todas las columnas.
Hay un botón en la esquina superior izquierda de la vista previa de datos con una selección de comandos que se pueden aplicar a toda la tabla.
Haga clic en el botón de la tabla en la esquina superior izquierda ➜ luego elija Eliminar duplicados .
Si observa la fórmula creada, usa la misma función Table.Distinct sin un segundo parámetro. Sin el segundo parámetro, la función actuará sobre toda la mesa.
Mantenga duplicados basados en una sola columna o en toda la tabla
En Power Query, también hay comandos para mantener duplicados para columnas seleccionadas o para toda la tabla.
Siga los mismos pasos que para eliminar duplicados, pero use el comando Mantener filas ➜ Mantener duplicados en su lugar . Esto le mostrará todos los datos que tienen un valor duplicado.
Eliminar duplicados usando una fórmula
Puede utilizar una fórmula que le ayude a encontrar valores duplicados en sus datos.
Primero deberá agregar una columna que combine datos de todas las columnas en las que desea basar su definición duplicada.
= [Marca] y [Modelo] y [Año]
La fórmula anterior concatenará las tres columnas en una sola columna.
Luego deberá agregar otra columna para contar los valores duplicados. Esto se utilizará más adelante para filtrar filas de datos que aparecen varias veces.
= NB.SI ($ D $ 7: D7; D7)
Copie la fórmula anterior en la columna y contará el número de veces que el valor actual aparece en la lista de valores anterior.
Si el número es 1, esta es la primera vez que el valor aparece en los datos y lo mantendrá en su conjunto de valores únicos. Si el número es igual o mayor que 2, el valor ya ha aparecido en los datos y es un valor duplicado que se puede eliminar.
Agregue filtros a su lista de datos.
- Vaya a la pestaña Datos y seleccione el comando Filtro .
- Use el atajo de teclado Ctrl + Shift + L.
Ahora puede filtrar en la columna del contador. Filtrar por 1 producirá todos los valores únicos y eliminará todos los duplicados.
A continuación, puede seleccionar las celdas visibles del filtro resultante para copiarlas y pegarlas en otro lugar. Use el atajo de teclado Alt +; para seleccionar solo celdas visibles.
Conclusiones
Los valores duplicados en sus datos pueden ser un gran obstáculo para un conjunto de datos limpio.
Afortunadamente, hay muchas opciones en Excel para eliminar fácilmente estos valores duplicados.
Entonces, ¿cuál es su método para eliminar duplicados?