Przeskocz do zawartości głównej Przejdź do treści uzupełniającej

Kardynalność

Kardynalność to unikatowość wartości danych w kolumnie. Kolumny ze zbyt dużą liczbą unikatowych wartości lub bez unikatowych wartości mają niewielką wariancję. Model uczenia maszynowego nie może zidentyfikować żadnego wzorca w takich danych.

Wysoka kardynalność oznacza dużą liczbę unikatowych wartości. Aby zapobiec wysokiej kardynalności, możesz pogrupować podobne wartości. Możesz także tworzyć nowe kolumny cech, na przykład adresy domowe można zamienić na odległości do lub z określonej lokalizacji.

Kolumna z tylko jedną unikatową wartością (stałą) nie jest przydatna do identyfikacji wzorców.

POWIĄZANE MATERIAŁY EDUKACYJNE:

Dowiedz się więcej

Czy ta strona była pomocna?

Jeżeli natkniesz się na problemy z tą stroną lub jej zawartością — literówkę, brakujący krok lub błąd techniczny — daj nam znać, co możemy poprawić!