Kardinalite
Kardinalite, bir sütundaki veri değerlerinin benzersizliğidir. Çok fazla benzersiz değere sahip olan veya hiç benzersiz değeri olmayan sütunların varyansı düşüktür. Bir makine öğrenimi modeli bu verilerde herhangi bir örüntü tanımlayamaz.
Yüksek kardinalite, yüksek sayıda benzersiz değer anlamına gelir. Yüksek kardinaliteyi önlemek için benzer değerleri gruplandırabilir veya kümeleyebilirsiniz. Ayrıca yeni özellik sütunları oluşturabilirsiniz; örneğin, ev adresleri belirli bir konuma olan mesafelere dönüştürülebilir.
Yalnızca tek bir benzersiz değere (sabit) sahip bir sütun, örüntüleri tanımlamada yararlı değildir.