精簡模型
建立某些初始模型後,精簡模型很重要,才能提升有效性和潛在準確度。模型分數指示此效能的不同量值。雖然精簡模型的目標是增加這些分數,但較高的分數不一定表示較好的模型。
您可以排除或納入特徵、變更訓練資料以及修改其他設定參數,以精簡模型。這麼做時,您可以比較不同版本,以查看您的變更帶來什麼樣的影響。
透過解譯分數,您將可學習如何精簡模型。不同指標的值可提供深入資訊,以瞭解要採取哪些動作以改善結果。
要求和權限
若要進一步瞭解使用 ML 實驗的使用者要求,請參閱 使用實驗。
設定新版本
執行實驗版本之後,如有需要,您可以建立新的版本,以精簡模型。
請執行下列動作:
-
從資料、模型或分析索引標籤,選取模型以作為下一個版本的基礎使用。
-
按一下檢視設定。
就會開啟實驗設定面板。
-
按一下新版本。
建立新的版本後,您可以變更其設定,例如:
-
排除現有特徵
-
納入之前排除的特徵
-
變更或重新整理資料集
-
選取或取消選取演算法
以下區段提供更多關於這些選項的資訊。
草擬新的版本時,在實驗設定面板中按一下特徵之下的篩選 圖示。篩選時,您可以更輕鬆地視覺化自變更訓練資料集以來採用了哪些特徵。您也可以查看哪些特徵是自動設計,哪些是無設計。
改善資料集
若模型的分數不佳,您可能會想要檢閱資料集以處理任何問題。在 讓資料集準備好進行訓練 中進一步閱讀如何改善資料集。
排除特徵
更多特徵不一定會做出更好的模型。若要精簡模型,您會想要排除不可靠且不相關的特徵,例如:
-
關聯度太高的特徵。從兩個相關聯的特徵,排除特徵重要性較低的特徵。
-
特徵重要性太低的特徵。這些特徵對您嘗試瞭解的內容沒有任何影響。
-
特徵重要性太高的特徵。這可能是由於資料滲漏。
測試以從訓練資料移除特徵,然後再次執行訓練,並檢查這是否改善了模型。對模型分數是否造成很大差異或沒有影響?
請執行下列動作:
-
從目錄開啟實驗。
-
從資料、模型或分析索引標籤,選取模型以作為下一個版本的基礎使用。
-
按一下檢視設定。
就會開啟實驗設定面板。
-
按一下新版本以設定新的實驗版本。
-
在特徵之下,對您不想用於訓練的任何特徵清除核取方塊。
新增特徵
若模型的評分仍然不佳,可能是因為尚未在資料集中擷取與目標有關係的特徵。您可以重新處理資料集並重新設定其用途,以最佳化資料品質,並新增特徵和資訊。就緒後,新的資料集可以新增至未來的實驗版本。請參閱 變更和重新整理資料集。
進一步閱讀如何在 建立新的特徵欄 中擷取或設計新的特徵。
選取演算法
根據目標欄的資料類型,會為訓練自動選取合適的演算法。您可能會想要排除執行情況不佳或速度較慢的演算法。以此方式,您就不必浪費時間對這些演算法進行訓練。
如需更多關於如何選擇演算法的資訊,請參閱 理解模型演算法。
請執行下列動作:
-
從目錄開啟實驗。
-
從資料、模型或分析索引標籤,選取模型以作為下一個版本的基礎使用。
-
按一下檢視設定。
就會開啟實驗設定面板。
-
按一下新版本以設定新的實驗版本。
-
在演算法之下,對您不想用於訓練的任何演算法清除核取方塊。
變更和重新整理資料集
若訓練資料自上一個實驗版本以來已變更,您可以變更或重新整理資料集,以用於未來的實驗版本。
若您想要在相同的實驗內比較不同資料集的模型指標和效能,這可能很實用。例如,在以下情況,這會很實用:
-
有新的資料集記錄可用,或對原始資料集記錄進行了更新。例如,最近月份的交易可能已經可用,適合用於訓練,或者可能已識別並處理資料集合問題。
-
已重新處理原始訓練資料集或重新設定其用途,也許是為了改善模型訓練。例如,您可能已改善邏輯,以定義特徵欄值,或甚至新增了新的特徵欄。
變更或重新整理資料集不會改變已從先前實驗版本訓練的現有模型。在實驗版本內,只會根據特定版本內定義的訓練資料來訓練模型。
要求
為新的實驗版本變更或重新整理資料集時,新的資料集必須符合下列要求:
-
目標欄的名稱和特徵類型需要與原始訓練資料集中的目標相同。
- 目標欄中的相異值數量範圍必須與給定實驗類型要求的範圍相同。例如,對於多類別分類實驗,新資料集中的目標欄必須仍然介於三個和十個唯一值之間。如需具體範圍,請參閱 決定建立的模型類型。
其他特徵欄可以全新,有不同的名稱,並且包含不同的資料。
變更資料集
請執行下列動作:
-
從資料、模型或分析索引標籤,選取模型以作為下一個版本的基礎使用。
-
按一下檢視設定。
就會開啟實驗設定面板。
-
按一下新版本以設定新的實驗版本。
-
在訓練資料之下,按一下變更資料集。
-
選取或上傳新的資料集。
重新整理資料集
請執行下列動作:
-
從資料、模型或分析索引標籤,選取模型以作為下一個版本的基礎使用。
-
按一下檢視設定。
就會開啟實驗設定面板。
-
按一下新版本以設定新的實驗版本。
-
在訓練資料之下,按一下重新整理資料集。
若資料集重新整理可用,會通知您。若建立名稱相同的新檔案,藉此覆寫現有資料檔案,資料集通常會在此時重新整理。
執行精簡的版本
完成版本設定後,就可以執行。
請執行下列動作:
-
在螢幕右下角按一下 執行 v2。
(按鈕上的文字取決於您已執行的版本數量。)
比較實驗版本
新版本完成訓練後,比較新版與舊版,以查看變更後的影響。您有一些選項可用於比較各個實驗版本的模型。
快速分析
使用實驗中的模型和資料索引標籤,以比較該版本與舊版。在模型索引標籤中,您可以:
-
檢視模型指標表格中的結果。
-
在模型之間切換,以檢視模型訓練摘要和其他自動產生的圖表中的差異。
如需更多關於快速模型分析的資訊,請參閱 執行快速模型分析。
深度分析
您可以切換至實驗中的比較和分析索引標籤,以驅動更深入的模型分析。這些索引標籤提供內嵌分析體驗,讓您可以透過互動方式在更精細的層級評估模型。
比較索引標籤提供所有模型的模型分數和超參數比較。分析索引標籤可讓您聚焦於特定模型,以評估預測準確度、特徵重要性和其他詳細資訊。
變更模型最佳化設定
執行啟用智慧最佳化的版本之後,您可以關閉智慧最佳化。這可讓您使用從智慧最佳化提供的深入資訊,同時也提供您需要的控制權,以進行微小的改善。或者,您也可以在關閉該設定的情況下執行一個或多個版本之後,開啟智慧模型最佳化。
超參數最佳化是實用的設定,可在模型精簡流程期間開啟。通常,不建議對第一個實驗版本開啟此設定。
您也可以變更是否要使用時間意識訓練,或變更作為日期索引使用的欄。
請執行下列動作:
按一下檢視設定。
如有需要,按一下新版本以設定新的實驗版本。
在面板中,展開模型最佳化。
在智慧和手動設定之間切換,以開啟或關閉智慧模型最佳化。
若您想要啟用超參數最佳化,按一下超參數最佳化核取方塊,並設定訓練時間上限。
在基於時間的分割測試訓練之下,您可以變更時間意識訓練的設定:
若要開啟時間意識訓練,請選取資料集中的特定日期索引欄,以變更無的預設值。
若要關閉時間意識訓練,請將日期索引的值設定為無。
將所選的日期索引欄變更為其他欄。
刪除實驗版本
您可以刪除不想保留的實驗版本。請注意,也會刪除實驗版本中的所有模型且無法復原。
請執行下列動作:
切換至模型索引標籤。
在模型指標表格中,從您想要刪除的實驗版本選取模型。
提示備註若您位於資料或分析索引標籤,也可以使用工具列中的下拉式功能表選取模型。在右下方,按一下刪除 <版本編號>。
在確認對話方塊中,按一下刪除。