Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Kardinalität

Die Kardinalität ist die Eindeutigkeit von Datenwerten in einer Spalte. Spalten mit zu vielen eindeutigen Werten oder keinen eindeutigen Werten haben eine geringe Varianz. Ein Modell für maschinelles Lernen kann in diesen Daten keine Muster identifizieren.

Eine hohe Kardinalität bedeutet eine hohe Anzahl eindeutiger Werte. Um hohe Kardinalität zu vermeiden, können Sie ähnliche Werte in Klassen einteilen oder gruppieren. Sie können auch neue Featurespalten erstellen. Beispielsweise können Wohnadressen in Entfernungen von oder zu einem spezifischen Standort umgewandelt werden.

Eine Spalte mit nur einem eindeutigen Wert (Konstante) ist beim Identifizieren von Mustern nicht hilfreich.

VERWANDTE LERNINHALTE:

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!