跳到主要內容 跳至補充內容

管理欄位層級中繼資料和資料剖析

資料管理員透過剖析存取關於資料集的豐富技術資訊。應用程式開發人員使用剖析統計資料和資料取樣來取得建立應用程式和規畫視覺化的想法和方向。欄位剖析可協助資料分析師和商業使用者更快獲得深入資訊。他們可以大致檢視和視覺化欄位剖析指標,不需要先建立應用程式。欄位層級中繼資料可讓使用者將別名、描述和分類套用至欄位;這些功能有助於識別特定資料和敏感欄位。

資訊備註Qlik Cloud 最多僅剖析資料集中的 1200 萬列。若資料集超過 1200 萬列,只會剖析前 1200 萬列。無論剖析多少列數,仍會新增所有欄位的中繼資料。

管理欄位層級中繼資料

您可以從欄位索引標籤為資料集中的每個欄位存取並編輯中繼資料。選取圖格圖示以獲得圖格檢視畫面 圖格檢視畫面中選取任何卡片,並從 選取清單圖示以獲得清單檢視畫面 清單檢視畫面中選取任何列,或從 資料檢視畫面中選取任何欄,以在格線右側開啟該欄位的詳細資訊面板。 欄位層級中繼資料欄位 — 欄位別名描述標記分類— 是選用性質,可以從此面板定義和編輯。

欄位中繼資料欄位
詳細資料描述
欄位別名輸入選用替代名稱以讓欄位名稱在剖析分析中更有意義。別名欄位名稱僅顯示在剖析分析中,並且不影響技術欄名稱。
描述

輸入可能對檢視欄位中繼資料和剖析欄位的使用者有幫助的任何資訊。

標記輸入文字片段以定義並分類此欄位及其資料。
分類選取個人資訊敏感資訊的核取方塊。
資訊備註選取的欄位層級分類個人資訊敏感資訊顯示在透過技術資料集中繼資料下的欄位列出的資料集概述索引標籤。
資訊備註套用至具有多個工作表的 Excel 檔案中欄位的分類將以工作表名稱和欄位名稱列出 (範例:個人資訊:Sheet1/EmpID)。

具有多個工作表的 XLSX 檔案的欄位層級中繼資料

在圖格檢視中選取欄位卡片以開啟詳細資訊面板

剖析資料

剖析統計資料提供欄分析,可測量資料集內發生的發生率、範圍和值。這些指標描述欄位值之間的關係,例如:

  • 相異值計數 (基數)
  • 樣本值、最常用的值和值頻率
  • 識別預設或潛在重複值時實用的冗餘
  • Null、字串和數值的計數
  • 關於值範圍的資訊,包括最小值、最大值、平均值、總和與標準差

目錄提供三種欄位剖析資料檢視:Tile viewList viewData view

Tile view 是作為格線顯示之欄位的卡片式視覺呈現。

List view 是可設定剖析統計資料的表格摘要。

Table view 列出欄位欄名稱,最多顯示資料集的前二十個記錄。

選取 Tile選取圖格圖示以獲得圖格檢視畫面List選取清單圖示以獲得清單檢視畫面資料 圖示以在剖析檢視畫面之間切換。

剖析圖格檢視

剖析圖格檢視是一種視覺欄位剖析,其設計用來顯示該欄位類型的大部分資訊內容。依據該欄位中數值或文字值的數量哪個較高,來判定顯示的預設檢視卡片類型。例如,對於具有文字和數值的欄位,若文字值較多,依照預設會顯示 Most Common Values (最常用的值) 卡片類型,若欄位中的數值較多,則會顯示 Binned Frequency (分級頻率) 數字分佈卡片類型。會提供下拉式切換,讓您可以在選取 圖示最常用的值 時為具有非唯一值的任何欄位切換至最常用的值卡片類型;或者若選取分級頻率 圖示分級頻率,您可以切換回數字分佈卡片。請注意,若欄位具有 Null 值,則所有卡片類型都包括 Null 值的數量。

圖格檢視:透過對該欄位中包含的資料類型有意義的指標來剖析欄位 (例如:文字與數值)

資料集的剖析圖格檢視

樣本值卡片

若所有值為唯一且只有文字,就會顯示樣本值卡片。這 (最多) 將會列出前三個值和其他唯一值的總數。

圖格檢視卡片:樣本值
樣本值圖格

樣本值剖析標準:若基數很高 (所有相異值),則透過此卡片剖析欄位值。若每個值都基於文字而且是唯一值,則幾個樣本值可對此類型的欄位資料提供最佳初始檢視。

每個樣本值剖析卡片提供:

  • 欄位名稱
  • 基數 (相異值)
  • 最多三個樣本值 (欄位的值可能少於三個)

最常用的值頻率卡片

最常用的值頻率卡片顯示五個最常用的值及其頻率。若有超過五個相異值,會合併並顯示為其他。若欄位是遺失的值,總計會顯示為 Null。此剖析卡片可套用於文字、數字或混合資料值。

圖格檢視卡片:圖格最常用的值頻率
圖格最常用的值頻率

最常用的值頻率標準:會透過最常用的值頻率卡片剖析具有少量值或值偏斜分佈的欄位。只有在相同的值有多個執行個體時,才會套用此剖析。使用者可以對欄位值的分佈情況獲得快速的深入資訊。若欄位資料包括文字和數值,而且文字多於數值,則會顯示 Most common values frequency (最常用的值頻率) 卡片。若欄位中的數值超過三個,會提供 Binned frequency (分級頻率) 切換。

每個 Most common values frequency (最常用的值頻率) 剖析卡片提供:

  • 欄位名稱
  • 基數 (相異值)
  • 最常用的值及其頻率
  • 其他組成剩餘值的頻率

Binned frequency (分級頻率) 卡片

Binned frequency (分級頻率) 卡片顯示對數字欄位相關的分佈和剖析資訊;包括最小、平均和最大資料值。若欄位資料包括文字和數值,而且數值多於文字值,則會顯示 Binned frequency (分級頻率) 卡片。Most Common Values Frequency (最常用的值頻率) 卡片類型可用於具有非唯一值的所有欄位。

圖格檢視卡片:分級頻率數字分佈

分級頻率圖格

每個 Binned frequency (分級頻率) 剖析卡片提供:

  • 欄位名稱
  • 基數 (相異值)
  • 顯示數字資料分佈的長條圖
  • 最小值
  • 平均值 (數字總和除以資料集中值的總數)
  • 最大值

剖析清單檢視

剖析清單檢視提供含有剖析統計資料選項的表格。使用者會根據欄選擇器 圖示欄 查看對資料集最有意義的興趣指標,這可透過捲動至表格最右邊來找到。依照預設會預先選取前九個統計資料。

清單檢視:從捲動至表格右側而找到的欄選擇器選取感興趣的剖析統計資料。

資料集的剖析清單檢視

剖新資料檢視

剖析資料檢視以具有欄位欄名稱的直式資料表格顯示資料集,(最多) 顯示前二十個值。

資料檢視:資料集欄名稱和前二十個記錄顯示

資料集的剖析資料檢視

權限

需要權限才能剖析和取樣資料。您在允許您剖析資料來源的資料集空間中必須有一個角色。如需詳細資訊,請參閱 在共用空間中管理權限在受管理空間中管理權限

瞭解更多資訊

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!