超參數最佳化
機器學習模型需要不同的條件約束、權重或學習率,以概括不同的資料模式。這些度量稱為超參數,用於控制學習程序。超參數需要進行微調,以便模型能夠以最佳方式解決機器學習問題。
預設情況下,Qlik Predict 會針對模型訓練中使用的每個演算法使用一組預先定義的超參數值。這些是資料科學社群普遍接受的標準最佳化值。系統會自動選取表現最佳的超參數值組合。
不過,在某些情況下,您可能希望微調模型以獲得最佳預測結果。這可以使用超參數最佳化 (HPO) 來完成。
Qlik Predict 僅針對您在實驗組態中選取的演算法組中最佳的演算法執行超參數最佳化。首先會執行隨機搜尋,然後執行格線搜尋,以尋找該演算法的最佳超參數。
在使用超參數最佳化之前,有幾件重要的事情需要考慮:
-
請勿在第一次訓練模型時使用超參數最佳化。它旨在於您已訓練模型且對結果感到滿意之後使用。該程序通常需要重複進行精煉和重新訓練。
-
超參數最佳化會增加相當多的時間。如果使用標準預先定義的超參數值,模型的訓練程序需要五分鐘,那麼在啟用超參數最佳化的情況下訓練同一個模型可能會花費數小時。
超參數最佳化中使用的演算法
超參數最佳化僅限於特定的演算法和模型類型。它專門設計用於以下模型類型和演算法:
-
二元分類模型
-
CatBoost 分類
-
Elastic Net 迴歸
-
Lasso 迴歸
-
LightGBM 分類
-
羅吉斯迴歸
-
隨機森林分類
-
XGBoost 分類
-
-
迴歸模型
-
CatBoost 迴歸
-
LightGBM 迴歸
-
隨機森林迴歸
-
XGBoost 迴歸
-
啟用超參數最佳化
請執行下列動作:
-
在實驗中,按一下 檢視組態。
實驗組態面板隨即開啟。
-
如有需要,按一下 建立新版本 以設定下一個版本。
-
在面板中,展開 模型最佳化。
-
從 智慧 切換為 手動。
智慧模型最佳化不提供超參數最佳化。
-
勾選 超參數最佳化 核取方塊。
檢視超參數值
在詳細模型分析期間,於 比較 索引標籤中檢視超參數值。如需詳細資訊,請參閱 執行詳細模型分析。