Alan düzeyinde meta verileri yönetme ve veri profili oluşturma
Alan düzeyinde meta veriler kullanıcıların alanlara takma adlar, açıklamalar ve sınıflandırmalar uygulamasına izin verir; bu özellikler belirli verileri ve hassas alanları tanımlamaya yardımcı olur.
Veri yöneticileri, profil oluşturarak veri kümeleri hakkında zengin teknik bilgilere erişir. Uygulama geliştiriciler, uygulama oluşturmak ve görselleştirmeleri planlamak için fikir ve yönlendirme elde etmek amacıyla profil istatistiklerini ve veri örneği oluşturmayı kullanır. Saha profili oluşturma, veri analistlerinin ve iş kullanıcılarının daha hızlı içgörüler elde etmesine yardımcı olabilir. Saha profili oluşturma, veri analistlerinin ve iş kullanıcılarının daha hızlı içgörüler elde etmesine yardımcı olabilir. Değerli alan profili metriklerini, önce bir uygulama oluşturmalarına gerek kalmadan bir bakışta görüntüleyebilir ve görselleştirebilirler.
İzinler
Veri profili ve örneği oluşturmak için izinler gereklidir. Veri kümesinin alanında veri kaynaklarının profilini oluşturmanıza olanak tanıyan bir role sahip olmanız gerekir. Daha fazla bilgi için bk. Paylaşılan alanlarda izinleri yönetme veya Yönetilen alanlarda izinleri yönetme.
Alan düzeyinde meta verileri yönetme
Veri setinizdeki tüm alanın meta verilerini Profil sekmesinden erişip düzenleyebilirsiniz. Belirli bir alanın Ayrıntılar panelini kılavuzun sağında açmak için Kutucuk görünümünden bir kart,
Liste görünümünden bir satır veya
Veri görünümünüzden bir sütun seçin. Alan düzeyinde meta veri alanları: Alan takma ismi, Açıklama, Etiketler ve Sınıflandırma isteğe bağlıdır ve bu panelde tanımlanabilir ve düzenlenebilir.
Ayrıntı | Açıklama |
---|---|
Alan takma ismi | Profil analizinde alan adlarını daha anlamlı yapmak için isteğe bağlı farklı bir ad girin. Takma alan adları yalnızca profil analizinde görüntülenir ve teknik sütun adlarını etkilemez. |
Açıklama |
Alanın meta verilerini ve profilini görüntüleyen kullanıcılara yardımcı olabilecek bilgileri girin. |
Etiketler | Bu alanı ve verilerini tanımlamak ve kategorize etmek için metin parçacıkları girin. |
Sınıflandırma | Kişisel bilgiler veya Hassas bilgiler onay kutusunu işaretleyin. |
Birden fazla sayfası olan XLSX dosyasının alan düzeyinde meta verisi

Tüm veri türleri varsayılan olarak profillenmez. Bunun yerine aşağıdakiler, siz profillerini oluşturana kadar sınırlı bir profil görüntüler:
-
QVD
-
Parquet
Sınırlı profil hakkında daha fazla bilgi için bkz. Sınırlı profil görünümü
Veri profili oluşturma
Profil istatistikleri, veri kümelerinde meydana gelen sıklığı, aralıkları ve değerleri hesaplayan sütun analizleri sağlar. Bu metrikler, şunlar gibi alan değerleri arasındaki ilişkileri tanımlar:
- benzersiz değerlerin sayısı (nicelik)
- Örnek değerler, en yaygın değerler ve değer sıklığı
- Varsayılan veya olası yinelenen değerleri tanımlamada faydalı fazlalıklar
- Null, dize ve sayısal değerlerin sayısı
- Değer aralıkları ile ilgili minimum, maksimum, ortalama, toplam ve standart sapma gibi bilgiler
Katalog, alan profil verilerinin üç görünümünü sağlar:
-
Kutucuk görünümü, alanların ızgara olarak yerleştirilen kart tabanlı, görsel bir gösterimidir.
-
Liste görünümü, yapılandırılabilir profil istatistiklerinin tablo biçiminde bir özetidir.
-
Tablo görünümü, veri kümesinin alan sütun adlarını ve en fazla ilk yirmi kaydını listeler.
Profil görünümleri arasında geçiş yapmak için Tile, List
veya Veri
simgesini seçin.
Kutucuk görünümü
Profil kutucuğu görünümü, o alan türü için en bilgilendirici içeriği görüntülemek üzere tasarlanmış bir görsel alan profilidir. Gösterilen varsayılan görünüm kartı türü, bu alan için sayısal veya metin değerlerinin sayısının daha yüksek olmasına göre belirlenir. Örneğin, hem metin hem de sayısal değerler içeren alanlar için alanda daha fazla metin değeri varsa varsayılan olarak En Yaygın Değerler kart türü, daha fazla sayısal değer varsa Gruplama Sıklığı sayısal dağılım kart türü görüntülenir. seçildiğinde benzersiz olmayan değerlere sahip herhangi bir alan için En Yaygın Değerler kart türüne geçebilmeniz için bir aşağı açılır geçiş düğmesi sağlanır veya Gruplama Sıklığı
seçilirse sayısal dağılım kartına geri dönebilirsiniz. Tüm kart türlerinin, alanda null değerler varsa null değerlerin sayısını içerdiğini unutmayın.
Kutucuk görünümü: Alanların profilleri, ilgili alanda bulunan veri türü için anlamlı olan metriklere göre oluşturulur (örneğin, metne karşılık sayısal değerler)

Örnek değerler kartı
Örnek değerler kartı, tüm değerler benzersiz ve yalnızca metin olduğunda gösterilir. İlk üç değer (en fazla) ve ek benzersiz değerlerin toplam sayısı listelenir.

Örnek değerler profil kriteri: Nicelik yüksek olduğunda (birçok farklı değer) alan değerlerinin profili bu kartla oluşturulur. Hemen hemen her değerin metin tabanlı ve benzersiz olduğu bir durumda, birkaç örnek değer bu alanın verilerine ilişkin en iyi ilk görünümü sağlar.
Her Örnek değerler profil kartı şunları sağlar:
- Alan adı
- Nicelik (benzersiz değerler)
- En fazla üç örnek değer (alanlar üçten az değere sahip olabilir)
En yaygın değerler sıklığı kart
En yaygın değerler sıklığı (Most common values frequency) kartı, en yaygın beş değeri ve sıklıklarını gösterir. Beş farklı değerden daha fazla değer varsa bunlar bir araya getirilip Diğer (Other) olarak görüntülenir. Eksik değerler olan alanlar varsa toplam Sıfır (Null) olarak görüntülenir. Bu profil kartı metin, sayısal veya karışık veri değerlerine uygulanabilir.

En yaygın değerler sıklığı kriterleri: Az sayıda değere veya çarpık bir değer dağılımına sahip alanların profili en yaygın değerler sıklığı kartıyla oluşturulur. Bu profil oluşturma işlemi yalnızca aynı değerlerin birden çok örneği olduğunda uygulanır. Kullanıcılar, alan değerlerinin dağılımıyla ilgili bilgileri hızlı şekilde edinebilir. Alan verileri hem metin hem de sayısal değerler içeriyorsa ve sayısal değerlerden daha fazla metin varsa Most common values frequency (En yaygın değerler sıklığı) kartı gösterilir. Binned Frequency (Gruplama Sıklığı) düğmesi, alanda üçten fazla sayısal değer olduğunda sağlanır.
Her En yaygın değerler sıklığı profil kartı şunları sağlar:
- Alan adı
- Nicelik (benzersiz değerler)
- Most common values (En yaygın değerler) ve sıklıkları
- Kalan değerlerin Diğer birleşik toplamı
Gruplama sıklığı kartı
Binned Frequency (Gruplama Sıklığı) kartı, sayısal alanlarla ilgili dağılım ve profil bilgilerini (minimum, ortalama ve maksimum veri değerleri dahil) gösterir. Alan verileri hem metin hem de sayısal değerler içeriyorsa ve metin değerlerinden daha fazla sayı varsa Binned Frequency (Gruplama sıklığı) kartı gösterilir. En Yaygın Değerler Sıklığı kart türü, benzersiz olmayan değerlere sahip tüm alanlar için kullanılabilir.
Kutucuk görünümü kartı: Gruplama Sıklığı sayısal dağılımı

Her Gruplama Sıklığı profil kartı şunları sağlar:
- Alan adı
- Nicelik (benzersiz değerler)
- Sayısal veri dağılımını gösteren histogram
- En küçük boyut değeri
- Ortalama değer (sayıların toplamının veri kümesindeki toplam değer sayısına bölümü)
- En büyük boyut değeri
Liste görünümü
Profil listesi görünümü, profil istatistik seçeneklerini içeren bir tablo sağlar. Kullanıcılar veri kümesi için en anlamlı olarak ilgilendikleri metrikleri, tablonun en sağına kaydırılarak bulunabilecek sütun seçici altında işaretler. İlk dokuz istatistik varsayılan olarak önceden seçilmiştir.
Liste görünümü: İlgilendiğiniz profil istatistiklerini, tabloda sağa kayılarak bulunabilecek aşağı açılan sütun seçiciden seçin

Veri görünümü
Profil verileri görünümü veri kümenizi alan sütun adları ve (en fazla) yirmi değerle düz bir veri tablosu olarak görüntüler.
Data view: Veri kümesi sütun adları ve ilk yirmi kayıt görüntülenir

Sınırlı profil görünümü
Bazı veri kümeleri varsayılan olarak profillenmez. Bunun yerine Profil, verilerin sınırlı bir profilini görüntüler. Veri kümesi profili seçeneğine tıklayarak verilerin profilini oluşturabilirsiniz.
Aşağıdaki veri türleri profil oluşturulana kadar sınırlı bir profil görünümü gösterir:
-
QVD
-
Parquet
QVD veri kümesinin sınırlı bir profili
