設定實驗 | Qlik Cloud 說明
跳到主要內容 跳至補充內容

設定實驗

實驗的設定包括選擇模型將用於預測目標的目標和特性。您也可以設定一些選用設定。

為了協助您選擇目標,系統會分析歷程記錄資料集,並顯示資料集中每個資料行的摘要統計資料。系統會對資料集套用數個自動預處理步驟,以確保僅包含合適的資料。如需有關資料預處理的詳細資訊,請參閱 自動資料準備和轉換

執行 v1 之後,如果需要進一步微調模型訓練,您可以建立新的實驗版本。如需詳細資訊,請參閱 微調模型

需求與權限

若要深入瞭解使用 ML 實驗的使用者需求,請參閱 使用實驗

介面

以下區段概述如何導覽實驗介面以設定您的實驗。如需有關介面的詳細資訊,請參閱 導覽實驗介面

索引標籤導覽

當您建立實驗時,會開啟 設定 索引標籤。您可以在此處設定實驗的目標和特性。

在執行至少一個實驗版本後,設定 索引標籤會變成 訓練資料。其他索引標籤也會變得可用。這些其他索引標籤可讓您分析您剛在該版本中訓練的模型。如果您需要使用不同的特性選擇來設定後續版本,可以返回 訓練資料 索引標籤。

結構描述檢視資料檢視

設定/訓練資料 索引標籤中,您可以在以下檢視之間切換:

  • 列 結構描述檢視:預設檢視。在此檢視中,資料集中的每個資料行都由結構描述中的一列表示,並附有資訊和統計資料。

  • 表格 資料檢視:一個替代選項檢視,您可以用來存取每個資料行的更多資訊和樣本資料。

結構描述檢視 於 ML 實驗中

ML 實驗中的結構描述檢視

資料檢視 於 ML 實驗中

ML 實驗中的資料檢視

實驗設定面板

在實驗設定面板中,您可以進一步自訂實驗訓練。此面板在新的實驗中預設為開啟。

執行版本後,按一下 控制項 檢視設定 以開啟面板來設定下一個版本。

透過實驗設定面板,您可以:

  • 選擇目標和實驗類型

  • 設定版本名稱

  • 新增或移除特性

  • 設定新版本的實驗

  • 檢視您正在訓練的模型類型

  • 選擇以變更或重新整理訓練資料集

  • 新增或移除演算法

  • 變更模型最佳化設定

  • 對於時間序列模型,設定預測設定

  • 設定偏差偵測

實驗設定面板

具有選定目標、實驗類型和預設特性選擇的實驗設定面板

選擇目標和實驗類型

在開始第一次訓練之前,您可以變更目標資料行 and 實驗類型。在此之後,它們會已鎖定以防編輯。

目標資料行包含您希望機器學習模型預測的值。

實驗類型由目標及其包含的資料類型決定。實驗類型定義了您要訓練的模型類型。以下選項可能可用:

  • 二元分類:訓練模型以預測具有兩個可能值 (例如,是或否) 的目標。資料可以是任何特性類型。

  • 多元分類:訓練模型以預測具有 3-10 個可能值 (例如,類別清單) 的目標。資料可以是任何特性類型,但具有超過 10 個相異、非數值類別 (值) 的資料行無法選取為目標。

  • 迴歸:訓練模型以預測具有超過 10 個可能值的目標 — 具體而言,是具有數值特性類型的目標。

  • 時間序列:訓練模型以利用歷程記錄資料預測特定未來時間段的目標值。目標必須具有超過 10 個相異值且具有數值資料。如需詳細資訊,請參閱 使用時間序列實驗

  1. 列 結構描述檢視表格 資料檢視 中,將滑鼠游標懸停在資料行上。

  2. 按一下顯示的 目標 圖示。

    目標資料行現在由 目標 指示,其他可用資料行會自動選取為特性。

    結構描述檢視 中選擇目標

    具有目標符號的資料集資料行。
  3. 在實驗設定面板中的 實驗設定 下,如果需要,您可以在訓練前變更目標。

  4. 資訊備註實驗設定 可能包含 實驗類型 選取器。例如,如果您的資料集和目標可以進行時間序列預測,則會有一個選項可將實驗類型從 迴歸 變更為 時間序列

選取目標和實驗類型後,您可以開始執行實驗的第一個版本。在 訓練實驗 中閱讀更多內容。您此時可以進行其他設定 (如下所述),或在檢閱訓練結果後調整設定。

隨著實驗訓練的繼續,會顯示有關如何解讀和處理資料的說明。如需詳細資訊,請參閱 解讀資料集深入剖析

選擇特性資料行

設定目標後,您可以選擇要將哪些其他可用資料行納入模型訓練中。排除您不希望成為模型一部分的任何特性。請注意,該資料行將保留在資料集中,但不會被訓練演算法使用。

在實驗設定面板的頂部,您可以看到資料集中的儲存格數量。如果數量超過您的資料集限制,您可以排除特性以使其低於限制。

您可以使用多種方式選取特性資料行:

結構描述檢視資料檢視

在主要檢視中,您可以:

  • 取消選取 包含所有可用特性,然後僅選取您要包含的特性。

  • 手動清除您不想包含的特性的核取方塊。

  • 進行搜尋,並在篩選的搜尋結果中排除或包含所有特性。

在實驗設定面板中

在實驗設定面板中,您可以:

  • 手動清除您不想包含的特性的核取方塊。

  • 在您執行實驗的第一個版本後,您可以定義 要包含的頂部特性數量

實驗設定面板中的 特性 區段

Qlik Predict 實驗設定面板中的特性區段

當您選取特性,系統會自動為其指派特性類型。可能的特性類型為:

  • 類別

  • 數值

  • 日期

  • 自由文字

特性類型是根據特性資料行中包含的資料指派的。如果特性符合特定條件,則可能會被選取為自動工程特性的基礎。如果需要,您可以變更是否將該特性用於自動特性工程。如需有關自動特性工程的完整詳細資訊,請參閱 自動特徵設計

您資料集中的某些資料行可能無法選取為實驗的特性,或者可能對其套用了特定的處理。當您導覽實驗訓練時,會顯示有關如何解讀和處理資料的說明。如需詳細資訊,請參閱 解讀資料集深入剖析

設定偏差偵測

您可以針對包含敏感資料的特性啟用偏差偵測。偏差偵測會在您執行實驗時進行。 您也可以按一下 取得建議,在執行偏差偵測之前,使用生成式 AI 掃描您的訓練資料以尋找可能敏感的特性。

偏差偵測可確定該特性是否會增加模型在預測中促進不公平結果的可能性,或者來源資料是否本質上存在偏差。

  1. 在 ML 實驗中,於訓練組態面板中展開 偏差

  2. 在選取用於偏差偵測的功能之前,您可以選擇按一下 取得建議,以使用生成式 AI 建議可能包含偏差資料的功能。請參閱 使用生成式 AI 建議用於偏差偵測的功能

  3. 選取或取消選取您要執行偏差偵測的任何功能。

或者,在 列 結構定義檢視中,針對所需的功能開啟偏差偵測。

如需有關偏差偵測的詳細資訊,請參閱 偵測機器學習模型中的偏差

選擇演算法

預設會包含所有可用的演算法,您可以排除任何不想使用的演算法。通常,您會在看到第一個訓練結果後,將此作為模型微調的一部分來執行。在 微調模型 中閱讀更多內容。

實驗設定面板中的 演算法 區段

Qlik Predict 實驗設定面板中的演算法區段。

變更特性類型

載入資料集時,會根據資料類型和其他特徵,將資料行視為類別、數值、日期或自由文字。在某些情況下,您可能需要變更此設定。

例如,如果一星期中的天數由數字 1-7 表示,則每個數字代表一個類別值。預設情況下,它會被視為連續排序的數值,因此您需要手動變更設定以將其視為類別。

當資料行被識別為包含日期 and 時間資訊時,它會用作新產生的自動工程特性的基礎。發生這種情況時,原始資料行 (父代特性) 會被視為具有日期特性類型。

您可以將父代特性從日期特性變更為類別或數值特性。例如,當特性被識別為日期,但您需要將其視為字串或數字時,這非常有用。當您這樣做時,您將無法再於實驗訓練中使用其自動工程特性。

  1. 列 結構描述檢視 中,找到該特性。

  2. 在該特性的 特性類型 資料行中,按一下 向下箭頭

  3. 在清單中選取一個值。

您也可以從 表格 資料檢視 變更特性類型。找到該特性,然後按一下目前特性類型旁邊的 向下箭頭。在清單中選取一個值。

時間序列預測

如果您正在訓練 時間序列實驗,系統會根據您的設定自動套用特定的特性類型轉換。例如,如果您選取要用於多元預測的任何群組,這些群組的特性類型會自動切換為類別。

對預測的影響

若您手動變更某個特徵的特徵類型,然後部署產生的模型,特徵類型覆寫將套用至透過該模型進行預測所使用之套用資料集中的特徵。

變更資料集

您可以在執行第一個實驗版本之前以及執行任何版本之後變更訓練資料集。

如果您在執行第一個版本之前變更資料集,您將遺失在變更資料集之前所做的任何設定。

  1. 在實驗設定面板中的 訓練資料檢閱資料集 下,按一下 變更資料集

  2. 選取新的資料集。

如需有關在模型微調期間 (執行實驗版本後) 變更和重新整理資料集的詳細資訊,請參閱 變更和重新整理資料集

設定模型最佳化

如果您的 實驗類型二元分類多元分類迴歸,您可以調整以下設定以最佳化您的模型:

  • 開啟或關閉智慧模型最佳化

  • 開啟或關閉超參數最佳化

  • 開啟或關閉時間感知訓練

您可以針對您執行的每個實驗版本開啟或關閉這些選項。

實驗設定面板中的 模型最佳化 區段

Qlik Predict 訓練設定面板中的模型最佳化區段

設定智慧最佳化

預設情況下,實驗使用智慧模型最佳化。透過智慧模型最佳化,Qlik Predict 會透過反覆進行特性選擇並對您的資料套用進階轉換,為您處理模型微調程序。

如需有關智慧最佳化的詳細資訊,請參閱 智慧模型最佳化

您可以關閉此設定以手動微調您訓練的模型。例如,您可能希望使用智慧模型最佳化開始模型訓練,然後切換到 v2 的手動微調以進一步調整設定。

  1. 按一下 控制項 檢視設定

  2. 如果您已經執行了至少一個實驗版本,請按一下 新版本

  3. 在面板中,展開 模型最佳化

  4. 智慧 切換為 手動

  5. 使用滑桿設定訓練的最大執行持續時間。

設定超參數最佳化

您可以使用超參數最佳化來最佳化模型。請注意,這是一個進階選項,可能會大幅增加訓練時間。如果您關閉智慧最佳化,則可以使用超參數最佳化。

如需詳細資訊,請參閱 超參數最佳化

  1. 按一下 控制項 檢視設定

  2. 如果您已經執行了至少一個實驗版本,請按一下 新版本

  3. 在面板中,展開 模型最佳化

  4. 智慧 切換為 手動

  5. 選取 超參數最佳化 核取方塊。

  6. (選用)設定最佳化的時間限制。預設時間限制為一小時。

設定時間感知訓練

如果您希望在訓練模型時考慮時間序列維度,請為實驗版本啟用時間感知訓練。若要使用此選項,您的資料集中必須有一個包含相關時間序列資訊的資料行。

開啟時間感知訓練時,Qlik Predict 會使用專門的交叉驗證和空值插補程序來訓練模型。

如需詳細資訊,請參閱 建立時間意識模型基於時間的交叉驗證

  1. 按一下 控制項 檢視設定

  2. 如果您已經執行了至少一個實驗版本,請按一下 新版本

  3. 在面板中,展開 模型最佳化

  4. 基於時間的測試-訓練分割 下,選取用於排序資料的 日期索引

檢視關於訓練資料的深入解析

在實驗的 設定/訓練資料 索引標籤中,您可以檢視對訓練資料處理方式的深入解析。此資訊可在 表格列 結構描述檢視 中的 深入解析 資料行中取得。顯示的資訊取決於您是否已使用目前的訓練資料執行版本。深入解析 資料行中的變更可以協助您識別特性可能無法使用的原因,或者它們為何被自動捨棄。

如需有關每個深入解析代表意義的詳細資訊,請參閱 解讀資料集深入剖析

相關學習:

瞭解更多資訊

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!