在 分析 中分析譜系 | Qlik Cloud 說明
跳到主要內容 跳至補充內容

分析 中分析譜系

譜系會將資料和資料轉換向後追蹤至原始來源。Qlik Cloud 提供此流程歷史記錄的詳細視覺化表示,您可以在其中互動式檢查分析內容的上游譜系。譜系可用於應用程式、指令碼、資料流程、表格配方、ML 實驗、ML 部署和資料集等內容。

資訊備註若要檢視分析內容的譜系,基礎資料必須作為已編目的來源儲存在 Qlik Cloud 中。

檢查特定欄位的業務使用者可以檢視該欄位的譜系,其中總結了其最重要的相依性:

  • 用於衍生它的欄位
  • 直接關聯和相依性,包括擁有者和空間
  • 原始來源 (第一個已知來源)

若要檢視下游或前瞻性相依性,您可以透過檢視 影響分析 來調查哪些元素會受到物件變更的影響。請參閱 在 分析 中分析影響分析

如需如何使用譜系的視覺化示範,請參閱:

使用譜系

資訊備註

若要使用譜系,您還需要透過 User Default 或自訂安全性角色將 檢視譜系 設定為 允許

譜系圖

譜系 圖以互動式圖形圖表顯示資料流經分析內容的流程。在譜系圖中,資源、表格或欄位稱為節點。當節點是正在調查的基礎節點時,表示它處於焦點中,並顯示為圖表中的最後一個元素。在最精細的層級,欄位層級譜系圖會顯示節點的來源或相依的資料來源和資料轉換。

譜系圖適用於:

  • 處理資料的資料專家

  • 建置應用程式的業務專家

  • 使用應用程式的進階業務使用者

  • 使用機器學習模型的使用者

每個節點代表所選內容譜系中的一個步驟。每當分析資產重新整理其資料時,就會編譯此譜系資訊。如果您的應用程式、指令碼、資料流程或表格配方最近未重新整理,則譜系可能不完整或不準確。

譜系可用於支援的內容類型,從它們在您的 目錄 中顯示的圖塊或列中取得。您可以分析下列分析內容的譜系:

  • 資料集:資料集是資料來源,例如從連接器或資料檔案載入的資料。資料集可以是資料庫中的表格、上傳到資料儲存的資料,或是從應用程式產生的資料 (例如 qvd 檔案)。資料集通常各有一個表格,但某些資料集 (例如 Excel 檔案) 可以有多個表格。

    Talend Studio 發佈的資料集會以 標示。您可以按一下資料集 ... 選單中的 開啟 TMC 工作,前往用於產生資料集的 Talend Management Console 工作。如需詳細資訊,請參閱 將資料集和譜系發佈至 Qlik Cloud

  • 應用程式:應用程式節點代表使用譜系中資料來源的 Qlik Sense 分析應用程式。應用程式節點會將應用程式名稱和應用程式位置顯示為 Qlik Sense

  • 指令碼:指令碼節點代表在 指令碼 介面中建立的指令碼。

  • 資料流程:可以檢查資料流程,以更深入了解它們使用和轉換的資料來源。

  • 表格配方:可以檢查表格配方,以更深入了解它們使用和轉換的資料來源。

  • ML 實驗:您可以了解機器學習實驗的譜系,該實驗由匯集在一起以產生機器學習模型訓練資料的資料來源組成。

  • ML 部署:您可以了解 ML 部署的譜系以及它在預測中的使用方式。ML 部署的譜系通常由 ML 實驗、實驗版本、模型和資料集組成。

典型的輸入節點包括基礎節點使用的資料來源,或產生資料集的應用程式。欄位層級譜系允許詳細調查欄位的計算方式及其跨轉換和應用程式的特定來源。

譜系圖中可用的節點是所選內容的輸入。選取一個項目以將其指定為基礎節點。輸入節點是基礎節點上游的節點。

欄位層級譜系圖

欄位層級譜系圖

譜系圖中可用的節點是所選基礎節點 (換句話說,焦點節點) 的輸入。基礎節點是您要擷取其譜系的單一節點;例如,它可以是應用程式、資料流程、ML 實驗、資料集、檔案、表格或欄位。

它將是螢幕上最右邊的節點,並以藍色勾勒出輪廓。它是您調查的焦點,並且只會呈現該基礎節點的輸入。

在探索譜系時,您可以互動式地將基礎節點變更為螢幕上的另一個表格、應用程式、欄位或其他項目,以集中您的調查。

譜系基礎節點

焦點節點 (也稱為基礎節點) 將位於螢幕右側

連接節點的線條是邊緣。邊緣代表一個節點與另一個節點的關係。它們代表指示關聯的關係,例如應用程式使用的資料集。它們也可以代表作為應用程式副產品產生的資料。節點和邊緣的集合共同構成了譜系圖。

譜系邊緣代表關係

邊緣代表物件之間的關係

節點會摺疊或展開以顯示從粗略到更精細的階層層級,從較高層級的資料集群組或應用程式開始,一直到最精細的層級 (即欄位層級)。

在此節點影像中,顯示了下列階層層級,從最高 (最粗略) 到最低 (最精細):資料資產 (應用程式)、資源 (資料集)、表格和欄位。

具有資產、資源、表格和欄位層級的節點

開啟譜系圖

  1. 開啟 深入資訊分析 活動中心。

  2. 在支援譜系的項目上的內容選單 更多 中,選取 工具 > 譜系

當您開啟項目時,也可以存取某些內容的譜系圖。按一下 更多譜系

節點詳細資料

詳細資料受限於您對該物件的存取權限。詳細資料可提供下列資訊:

  • 名稱

  • 說明

  • 標籤

  • 位置

  • 空間

  • 擁有者

  • 建立者

  • 上次修改時間

導覽譜系圖

按一下並拖曳圖表以導覽並將譜系圖置中。您也可以使用導覽按鈕。選取首頁 首頁 以將譜系圖置中於基礎節點。按一下向後和向前以在您的選取項目中移動。

譜系圖導覽

譜系圖的導覽按鈕。

譜系 圖會顯示分析內容的上游相依性,當您為其開啟圖表時,它會顯示為預設節點。您可以透過選取 更多譜系 (新基礎節點)影響分析,存取圖表中出現的其他節點的譜系 (上游) 或影響分析 (下游)。選取一個節點以將其指定為基礎節點。

展開 向下箭頭 或摺疊 向上箭頭 節點,以展開或摺疊同一層級的物件群組。

分析不同節點的選單選項

分析不同節點的選單選項

應用程式中的譜系概述檢視

應用程式中的譜系概述檢視可以為業務使用者提供應用程式中上游相依性的高階概述。如需詳細資訊,請參閱 應用程式內譜系摘要檢視

分析機器學習內容的譜系

您可以使用 譜系 圖來分析機器學習內容的來源,包括 ML 實驗、ML 部署和資料集。使用該圖表全面檢視機器學習模型的建立方式、訓練資料以及它們在生產情境中的用途。

在分析 譜系 圖中的其他內容 (例如下游應用程式) 時,實驗、部署和資料集也會顯示為節點。

機器學習資產也會顯示在 影響分析 中,以全面分析下游內容。如需詳細資訊,請參閱 在 分析 中分析影響分析

開啟機器學習內容的 譜系

  • 在您的活動中心,按一下 ML 實驗、ML 部署或資料集旁邊的 更多,然後選取 工具 > 譜系

  • 在 ML 實驗或 ML 部署中,按一下導覽列中的 更多,然後選取 譜系

導覽機器學習內容的 譜系

您探索機器學習節點的方式與其他內容相同。如需介面概述,請參閱:

識別 譜系 圖中的機器學習項目

下表概述了 譜系 圖中出現的與機器學習相關的常見項目。

機器學習的常見譜系項目
項目 圖示 說明
檔案儲存 資料夾

並非機器學習內容獨有。顯示儲存資料集的位置 (在大多數情況下,在空間中)。與訓練資料集、實驗中內嵌分析的匯出、用於預測的套用資料集以及預測輸出資料集相關。

資料集 許多 (例如,QVD 的 QVD 檔案類型) 並非機器學習內容獨有。用於代表訓練資料集、實驗中內嵌分析的匯出、套用資料集和預測輸出資料集。
ML 實驗 ML 實驗 訓練模型的 ML 實驗。
ML 實驗版本 分岔 ML 實驗中的版本,其中已訓練一個或多個模型。
ML 模型 ML 模型 在實驗版本中訓練的 ML 模型。用於代表 ML 實驗中已訓練的模型,以及 ML 部署中已部署的模型。
ML 部署 ML 部署 包含一個或多個已部署模型的 ML 部署。
無圖示 - ML 部署中的預測輸出節點沒有圖示。預測輸出資料集中包含的欄位也沒有圖示。

譜系和 ML 實驗

ML 實驗以分組排列呈現。它們展開如下:

  • ML 實驗會展開為一個或多個實驗版本。

  • 實驗版本會展開為一個或多個 ML 模型。

當在實驗中訓練的模型部署到 ML 部署中時,如果選取下游內容 (例如,預測或 ML 部署) 作為基礎節點,它就會出現在譜系圖中。

譜系和 ML 部署

ML 部署以分組排列呈現。它們展開如下:

  • ML 部署會展開為一個或多個已部署模型。

  • 如果部署中的模型已用於批次預測,則模型會展開以顯示每個批次預測輸出。

欄位層級譜系可用於與 ML 部署相關的套用資料集和預測輸出資料集。

用於預測的已部署模型會連接回訓練它們的實驗。

範例情境

如需範例情境,請參閱 範例:調查機器學習內容的譜系

限制

譜系圖表有下列限制:

  • Qlik Cloud 中發佈譜系後尚未重新載入的應用程式,可能要等到重新載入後才能取得完整的譜系資訊。如果在為您的 租用戶 開啟譜系後尚未載入某些節點,則其詳細資料可能會受到限制。

  • 租用戶外部資料集 (例如 SQL Server 或 Google Drive 連線) 的節點詳細資料僅限於資料集類型和名稱。REST 連線僅顯示它是 REST 資料。

  • 如果刪除某個項目,在分析其他節點時,它可能仍會顯示在 譜系 中。

權限

您必須能夠檢視項目,才能從您的 活動中心 檢視其譜系。如果您可以看到基礎節點的譜系圖,您就能夠看到上游譜系物件的基本詳細資料和中繼資料。

安全性

  • 使用者只能變更為他們有權存取的基礎節點;否則無法使用內容選單。

  • 如果使用者有權存取基礎節點,他們將有權查看所有上游譜系。

分析譜系的範例使用案例

如需譜系分析的逐步解說,請參閱 欄位層級譜系使用案例

範例:使用譜系概述檢視探索資訊來源

作為在應用程式 cars-data4-app 中查看橫條圖的分析取用者,您想知道資訊的來源。您確保在 屬性外觀 > 一般 區段下,為圖表開啟了 顯示詳細資料顯示運算式,然後選取切換至工作表分析模式。以滑鼠右鍵按一下圖表,或使用 更多動作圖示 選單,然後選取 顯示詳細資料 以顯示譜系取用者檢視。按一下 顯示相依性

您會看到維度 Car_ID 相依於欄位 Car_ID,該欄位可在三個列出的 CSV 來源中找到。選取欄位項目上的 更多動作圖示 選單,然後選取 譜系 - Car_ID / Cars,以開啟應用程式中欄位 Car_ID 的譜系圖。

選取來源或欄位以檢視該物件的譜系

在取用者譜系概述檢視中選取選單,然後選取檢視來源譜系的選項

譜系圖由右至左檢視,並顯示欄位 Car_ID 位於載入至應用程式 cars-data4-app 的表格 Cars 中。當您將欄位歷史記錄追溯至上傳到 Qlik Cloud 的原始檔案時,展開 向下箭頭 節點。您會看到第一個向後中繼顯示包含欄位 Car_ID 的 CSV cars-data.csv 已載入至應用程式 cars-data4-app。下一個向後節點是產生 cars-data.csv 的應用程式 cars-data3-app。再向後一個中繼並展開節點,您會看到原始來源檔案是 CSV 檔案 cars-data3.csv,並且它包含欄位 ID

透過展開表格和檢視欄位,您能夠識別橫條圖維度 Car_id-ID 的原始來源檔案、表格和欄位。

展開節點以將欄位的歷史記錄追溯至來源檔案

從焦點節點開始,將譜系歷史記錄追溯至原始來源

範例:調查資料集的來源及其建立方式

作為應用程式開發人員,您正在考慮為您的應用程式使用現有資料集 current_customers_analytics.xlsx。您調查此資料集的來源,以便了解資料的來源。從資料集圖塊或列中,從 更多 選單中選取 譜系 以開啟譜系圖。從譜系圖中,您可以透過選取 XLSX current_customers_analytics.xlsx 上的 更多動作圖示 選單並 開啟 概述,來檢視資料集的中繼資料。

從譜系圖開啟資料集概述

可以從譜系圖開啟資料集概述

從資料集概述索引標籤檢視標籤、分類和其他技術中繼資料

可以從譜系圖存取資料集概述

資料設定檔可從 設定檔 索引標籤取得

可從譜系圖存取欄位設定檔索引標籤

按一下瀏覽器向後箭頭返回譜系圖,以探索資料集的譜系圖。展開 向下箭頭 current_customers_analytics.xlsx 節點,然後按一下 全選,以檢視可用欄位。對所有節點執行相同操作。請注意,每個欄位都提供選項,透過選取 譜系 (新基礎節點) 將其設為焦點基礎節點,或選取 影響分析 以檢視前向譜系和將受資料集變更影響的相依物件。

資料集的展開 譜系 圖。每個節點內的每個欄位都會有開啟應用程式或資料、檢視影響分析或變更焦點節點的選項

檢視資料集的譜系

向後追蹤譜系並展開節點,您可以看到此 XLSX 資料集是 Prep Current Customers Sales - Analytics 應用程式的輸出。再向後一個中繼並展開 檔案儲存 節點,您會看到銷售分析應用程式載入了一個 CSV 檔案:rgb_customers.csv。欄位層級分析顯示,原始來源檔案中的 Tags 欄位在銷售分析應用程式中已重新命名為 rgb_customers.Tags。可以開啟原始 CSV 檔案的概述,以顯示有價值的中繼資料,例如擁有者、建立者、使用量指標、標籤、分類、欄位設定檔和影響分析。

範例:調查機器學習內容的譜系

一般業務使用者或機器學習專家可以使用 譜系 圖來檢查某些預測值的來源。將基礎節點設定為預測資料集後,此使用者可以看到:

  • 訓練資料,包括其來源和資料轉換

  • 實驗、實驗版本和模型

  • 模型的部署位置及其使用方式

展開所有節點的譜系圖。該圖表顯示從訓練資料準備到預測資料集的端對端流程。

顯示從訓練資料準備到預測資料集的端對端流程的譜系圖

上圖顯示下列程序:

  1. 資料流程 資料流程 從儲存在個人空間 資料夾 中的 CSV 資料集 Parquet 檔案類型 載入並轉換資料。輸出會儲存到同一空間中的 Parquet 資料集 Parquet 檔案類型 中。

  2. Parquet 資料集 Parquet 檔案類型 用於 ML 實驗 ML 實驗 的版本 1 分岔 中。此實驗版本會訓練 ML 模型 ML 模型

  3. ML 模型 ML 模型 部署到 ML 部署 ML 部署 中。

  4. 使用個人空間 資料夾 中的 CSV 資料集 Parquet 檔案類型 作為套用資料集,ML 部署 ML 部署 會產生 Parquet 格式的預測資料集 Parquet 檔案類型

資料整合 中的譜系

譜系 圖也可用於 資料整合。如需詳細資訊,請參閱 分析 資料整合 中的譜系

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!