微調模型
建立一些初始模型後,微調模型以提高其有效性和潛在準確度非常重要。模型評分表示此效能的不同度量。雖然微調模型的目標是提高這些評分,但較高的評分並不總是代表較好的模型。
您可以透過排除或包含特性、變更訓練資料以及修改其他組態參數來微調模型。如此一來,您可以比較不同版本,以查看變更產生的影響。
透過解讀評分,您將瞭解如何微調模型。不同指標的值可以讓您深入瞭解要採取哪些動作來改善結果。
需求和權限
若要深入瞭解使用 ML 實驗的使用者需求,請參閱 使用實驗。
設定新版本
執行實驗版本後,如果需要,您可以透過建立新版本來微調模型。
請執行下列動作:
-
從 訓練資料、模型 或 分析 標籤中,選取要作為下一個版本基礎的模型。
-
按一下 檢視組態。
實驗組態面板隨即開啟。
-
按一下 建立新版本。
建立新版本後,您可以變更其組態,例如:
-
排除現有特性
-
包含先前已排除的特性
-
變更或重新整理資料集
-
選取或取消選取演算法
以下區段提供有關這些選項的更多資訊。
草擬新版本時,按一下實驗組態面板中 特性 下方的篩選 圖示。進行篩選時,您可以更輕鬆地視覺化自變更訓練資料集以來引入了哪些特性。您也可以查看哪些特性是自動工程設計和非工程設計的。
改善資料集
如果您的模型評分不佳,您可能需要檢閱資料集以解決任何問題。請參閱 準備用於訓練的資料集,深入瞭解如何改善資料集。
排除特性
更多特性不一定能產生更好的模型。若要微調模型,您需要排除不可靠且不相關的特性,例如:
-
關聯過高的特性。從兩個具關聯性的特性中,排除特性重要性較低的特性。
-
特性重要性過低的特性。這些特性對您嘗試瞭解的內容沒有任何影響。
-
特性重要性過高的特性。這可能是由於資料洩漏所致。
測試從訓練資料中移除該特性,然後再次執行訓練並檢查這是否能改善模型。這對模型評分會產生很大影響還是沒有影響?
請執行下列動作:
-
從 Catalog 開啟實驗。
-
從 訓練資料、模型 或 分析 標籤中,選取要作為下一個版本基礎的模型。
-
按一下 檢視組態。
實驗組態面板隨即開啟。
-
按一下 建立新版本 以設定新的實驗版本。
-
在 特性 下方,清除您不想在訓練中使用的任何特性的核取方塊。
新增特性
如果您的模型評分仍然不佳,可能是因為與目標有關係的特性尚未在資料集中擷取。您可以重新處理和重新調整資料集用途,以最佳化資料品質,並新增特性和資訊。準備就緒後,可以將新資料集新增至未來的實驗版本。請參閱 變更和重新整理資料集。
請參閱 建立新的特徵欄,深入瞭解如何擷取或工程設計新特性。
變更偏差偵測設定
您可以變更設定要執行偏差偵測的特性。例如,如果您已向資料集新增特性,則可以開啟這些特性的偏差偵測。
請執行下列動作:
-
從目錄開啟實驗。
-
從 訓練資料、模型 或 分析 標籤中,選取要作為下一個版本基礎的模型。
-
按一下 檢視組態。
實驗組態面板隨即開啟。
-
按一下 建立新版本 以設定新的實驗版本。
-
展開訓練組態面板中的 偏差。
-
(選用)按一下 取得建議,以使用生成式 AI 建議可能包含偏差資料的特性。請參閱 使用生成式 AI 建議用於偏差偵測的功能。
-
選取或取消選取您要對其執行偏差偵測的任何特性。
或者,在 結構描述檢視 中進行偏差偵測設定。
如需有關偏差偵測的詳細資訊,請參閱 偵測機器學習模型中的偏差。
選取演算法
根據目標資料行的資料類型,系統會自動選取適合的演算法進行訓練。您可能需要排除效能不佳或速度較慢的演算法。如此一來,您就不必在訓練上浪費時間。
如需有關如何選擇演算法的詳細資訊,請參閱 理解模型演算法。
請執行下列動作:
-
從 Catalog 開啟實驗。
-
從 資料、模型 或 分析 標籤中,選取要作為下一個版本基礎的模型。
-
按一下 檢視組態。
實驗組態面板隨即開啟。
-
按一下 建立新版本 以設定新的實驗版本。
-
在 演算法 下方,清除您不想在訓練中使用的任何演算法的核取方塊。
變更和重新整理資料集
如果您的訓練資料自上一個實驗版本以來已變更,您可以變更或重新整理資料集,以用於實驗的未來版本。
如果您想比較同一實驗中不同資料集的模型指標和效能,這可能會有所幫助。例如,在以下情況下這很有用:
-
有新的資料記錄集可用,或者對原始資料記錄集進行了更新。例如,最新月份的交易可能已可用且適合用於訓練,或者可能已識別並解決了資料收集問題。
-
原始訓練資料集已重新處理或重新調整用途,這可能是為了改善模型訓練。例如,您可能改進了定義特性資料行值的邏輯,甚至新增了特性資料行。
變更或重新整理資料集不會改變已從先前實驗版本訓練的現有模型。在實驗版本中,模型僅在該特定版本中定義的訓練資料上進行訓練。
需求
當您為新實驗版本變更或重新整理資料集時,新資料集必須符合以下需求:
-
目標資料行的名稱和特性類型必須與原始訓練資料集中的目標相同。
- 目標資料行中相異值的數量必須在給定實驗類型所需的相同範圍內。例如,對於多類別分類實驗,新資料集中的目標資料行仍必須具有 3 到 10 個唯一值。如需特定範圍,請參閱 設定實驗。
其他特性資料行可以完全是新的、具有不同的名稱並包含不同的資料。
變更資料集
請執行下列動作:
-
從 訓練資料、模型 或 分析 標籤中,選取要作為下一個版本基礎的模型。
-
按一下 檢視組態。
實驗組態面板隨即開啟。
-
按一下 建立新版本 以設定新的實驗版本。
-
在 訓練資料 > 檢閱資料集 下方,按一下 變更資料集。
-
選取或上傳新資料集。您可以選擇:
-
資料集:選取您可存取的任何空間中的資料集。請參閱 上傳和選取資料集的提示和指南。
-
資料產品:從您可存取的作用中資料產品中選取資料集。如需有關資料產品的詳細資訊,請參閱 Creating data products。
-
重新整理資料集
請執行下列動作:
-
從 訓練資料、模型 或 分析 標籤中,選取要作為下一個版本基礎的模型。
-
按一下 檢視組態。
實驗組態面板隨即開啟。
-
按一下 建立新版本 以設定新的實驗版本。
-
在 訓練資料 下方,按一下 重新整理資料集。
如果資料集重新整理可用,您會收到通知。當現有資料檔案被建立同名新檔案覆寫時,資料集通常會重新整理。
上傳和選取資料集的提示和指南
-
資料集可以透過 分析 活動中心的「建立」頁面上傳,並顯示在目錄中。您也可以將新的資料集從實驗的資料集選取頁面直接上傳到目錄中。若要這麼做,按一下上傳檔案並選擇要上傳的檔案。
-
支援任何可在 Qlik Cloud 中上傳並剖析的一般檔案,以用於 Qlik Predict。
對於多表格檔案,例如具有多個工作表的 Microsoft Excel 檔案,只會匯入第一個表格。若表格的資料剖析失敗 (例如表格是空的),則檔案不受支援。
執行微調版本
完成版本設定後,即可執行該版本。
請執行下列動作:
-
按一下畫面右下角的 執行 v2。
(按鈕上的文字取決於您已執行的版本數量。)
比較實驗版本
新版本完成訓練後,將新版本與舊版本進行比較,以查看變更產生的影響。您有多個選項可用於比較跨實驗版本的模型。
快速分析
使用實驗中的 模型 和 訓練資料 標籤,將該版本與較舊版本進行比較。在 模型 標籤中,您可以:
-
在 模型指標 表格中檢視結果。
-
根據常見的預測分析需求(包括準確度和預測速度)檢視推薦的模型。
-
在模型之間切換,以檢視 模型訓練摘要 和其他自動產生的圖中的差異。
如需有關快速模型分析的詳細資訊,請參閱 執行快速模型分析。
深入分析
您可以透過切換至實驗中的 比較 和 分析 標籤,深入分析模型。這些標籤提供內嵌分析體驗,您可以在其中以更精細的層級互動式評估模型。
比較 標籤提供所有模型之間模型評分 and 超參數的比較。分析 標籤可讓您專注於特定模型,以評估預測準確度、特性重要性及其他詳細資訊。
變更模型最佳化設定
在執行已啟用智慧最佳化的版本後,您可以關閉智慧最佳化。這可讓您使用智慧最佳化提供的深入解析,同時也為您提供進行微小、最低限度調整所需的控制。或者,您可以在執行一個或多個關閉該設定的版本後,開啟智慧模型最佳化。
超參數最佳化是在模型微調過程中開啟可能有所幫助的設定。通常,不建議在實驗的第一個版本中開啟此設定。
您也可以變更是否使用時間感知訓練,或變更用作日期索引的資料行。
請執行下列動作:
-
按一下 檢視組態。
-
如果需要,按一下 建立新版本 以設定新的實驗版本。
-
在面板中,展開 模型最佳化。
-
在 智慧 和 手動 設定之間切換,以開啟或關閉智慧模型最佳化。
-
如果您想啟用超參數最佳化,請按一下 超參數最佳化 核取方塊並設定最大訓練時間。
-
在 基於時間的測試-訓練分割 下方,您可以變更時間感知訓練的設定:
-
若要開啟時間感知訓練,請透過在資料集中選取特定的 日期索引 資料行,來變更預設值 無。
-
若要關閉時間感知訓練,請將 日期索引 設定為值 無。
-
將選取的 日期索引 資料行變更為不同的資料行。
-
刪除實驗版本
您可以刪除不想保留的實驗版本。請注意,實驗版本中的所有模型也將被刪除且無法復原。
請執行下列動作:
-
切換至 模型 標籤。
-
在 模型指標 表格中,從您要刪除的實驗版本中選取模型。
提示備註當您位於 訓練資料 或 分析 標籤時,您也可以使用工具列中的下拉式功能表選取模型。 -
在右下角,按一下 刪除 <版本號碼>。
-
在確認對話方塊中,按一下 刪除。