管理欄位層級中繼資料和資料剖析
資料管理員透過剖析存取關於資料集的豐富技術資訊。應用程式開發人員使用剖析統計資料和資料取樣來取得建立應用程式和規畫視覺化的想法和方向。欄位剖析可協助資料分析師和商業使用者更快獲得深入資訊。他們可以大致檢視和視覺化欄位剖析指標,不需要先建立應用程式。欄位層級中繼資料可讓使用者將別名、描述和分類套用至欄位;這些功能有助於識別特定資料和敏感欄位。
管理欄位層級中繼資料
您可以從欄位索引標籤為資料集中的每個欄位存取並編輯中繼資料。從 圖格檢視畫面中選取任何卡片,並從 清單檢視畫面中選取任何列,或從 資料檢視畫面中選取任何欄,以在格線右側開啟該欄位的詳細資訊面板。 欄位層級中繼資料欄位 — 欄位別名、描述、標記和分類— 是選用性質,可以從此面板定義和編輯。
詳細資料 | 描述 |
---|---|
欄位別名 | 輸入選用替代名稱以讓欄位名稱在剖析分析中更有意義。別名欄位名稱僅顯示在剖析分析中,並且不影響技術欄名稱。 |
描述 | 輸入可能對檢視欄位中繼資料和剖析欄位的使用者有幫助的任何資訊。 |
標記 | 輸入文字片段以定義並分類此欄位及其資料。 |
分類 | 選取個人資訊或敏感資訊的核取方塊。 |
剖析資料
剖析統計資料提供欄分析,可測量資料集內發生的發生率、範圍和值。這些指標描述欄位值之間的關係,例如:
- 相異值計數 (基數)
- 樣本值、最常用的值和值頻率
- 識別預設或潛在重複值時實用的冗餘
- Null、字串和數值的計數
- 關於值範圍的資訊,包括最小值、最大值、平均值、總和與標準差
目錄提供三種欄位剖析資料檢視:Tile view、List view 和 Data view。
Tile view 是作為格線顯示之欄位的卡片式視覺呈現。
List view 是可設定剖析統計資料的表格摘要。
Table view 列出欄位欄名稱,最多顯示資料集的前二十個記錄。
選取 Tile、List 或資料 圖示以在剖析檢視畫面之間切換。
剖析圖格檢視
剖析圖格檢視是一種視覺欄位剖析,其設計用來顯示該欄位類型的大部分資訊內容。依據該欄位中數值或文字值的數量哪個較高,來判定顯示的預設檢視卡片類型。例如,對於具有文字和數值的欄位,若文字值較多,依照預設會顯示 Most Common Values (最常用的值) 卡片類型,若欄位中的數值較多,則會顯示 Binned Frequency (分級頻率) 數字分佈卡片類型。會提供下拉式切換,讓您可以在選取 時為具有非唯一值的任何欄位切換至最常用的值卡片類型;或者若選取分級頻率 ,您可以切換回數字分佈卡片。請注意,若欄位具有 Null 值,則所有卡片類型都包括 Null 值的數量。
樣本值卡片
若所有值為唯一且只有文字,就會顯示樣本值卡片。這 (最多) 將會列出前三個值和其他唯一值的總數。
樣本值剖析標準:若基數很高 (所有相異值),則透過此卡片剖析欄位值。若每個值都基於文字而且是唯一值,則幾個樣本值可對此類型的欄位資料提供最佳初始檢視。
每個樣本值剖析卡片提供:
- 欄位名稱
- 基數 (相異值)
- 最多三個樣本值 (欄位的值可能少於三個)
最常用的值頻率卡片
最常用的值頻率卡片顯示五個最常用的值及其頻率。若有超過五個相異值,會合併並顯示為其他。若欄位是遺失的值,總計會顯示為 Null。此剖析卡片可套用於文字、數字或混合資料值。
最常用的值頻率標準:會透過最常用的值頻率卡片剖析具有少量值或值偏斜分佈的欄位。只有在相同的值有多個執行個體時,才會套用此剖析。使用者可以對欄位值的分佈情況獲得快速的深入資訊。若欄位資料包括文字和數值,而且文字多於數值,則會顯示 Most common values frequency (最常用的值頻率) 卡片。若欄位中的數值超過三個,會提供 Binned frequency (分級頻率) 切換。
每個 Most common values frequency (最常用的值頻率) 剖析卡片提供:
- 欄位名稱
- 基數 (相異值)
- 最常用的值及其頻率
- 其他組成剩餘值的頻率
Binned frequency (分級頻率) 卡片
Binned frequency (分級頻率) 卡片顯示對數字欄位相關的分佈和剖析資訊;包括最小、平均和最大資料值。若欄位資料包括文字和數值,而且數值多於文字值,則會顯示 Binned frequency (分級頻率) 卡片。Most Common Values Frequency (最常用的值頻率) 卡片類型可用於具有非唯一值的所有欄位。
每個 Binned frequency (分級頻率) 剖析卡片提供:
- 欄位名稱
- 基數 (相異值)
- 顯示數字資料分佈的長條圖
- 最小值
- 平均值 (數字總和除以資料集中值的總數)
- 最大值
剖新資料檢視
剖析資料檢視以具有欄位欄名稱的直式資料表格顯示資料集,(最多) 顯示前二十個值。
權限
需要權限才能剖析和取樣資料。您在允許您剖析資料來源的資料集空間中必須有一個角色。如需詳細資訊,請參閱 在共用空間中管理權限 或 在受管理空間中管理權限。