Saltar al contenido principal Saltar al contenido complementario

Cardinalidad

La cardinalidad es la singularidad de los valores de datos en una columna. Las columnas con demasiados valores únicos o sin valores únicos tienen poca variación. Un modelo de aprendizaje automático no puede identificar ningún tipo de patrón en esos datos.

Una alta cardinalidad significa una gran cantidad de valores únicos. Para evitar una alta cardinalidad, puede clasificar o agrupar valores similares. También puede crear nuevas columnas de características, por ejemplo, las direcciones de las casas se pueden convertir en distancias hacia o desde una ubicación específica.

Una columna con un solo valor único (constante) no es útil para identificar patrones.

APRENDIZAJE RELACIONADO:

Más información

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.