Kardynalność
Kardynalność to unikatowość wartości danych w kolumnie. Kolumny ze zbyt dużą liczbą unikatowych wartości lub bez unikatowych wartości mają niewielką wariancję. Model uczenia maszynowego nie może zidentyfikować żadnego wzorca w takich danych.
Wysoka kardynalność oznacza dużą liczbę unikatowych wartości. Aby zapobiec wysokiej kardynalności, możesz pogrupować podobne wartości. Możesz także tworzyć nowe kolumny cech, na przykład adresy domowe można zamienić na odległości do lub z określonej lokalizacji.
Kolumna z tylko jedną unikatową wartością (stałą) nie jest przydatna do identyfikacji wzorców.
POWIĄZANE MATERIAŁY EDUKACYJNE: