精簡模型
建立某些初始模型後,精簡模型很重要,才能提升有效性和潛在準確度。模型分數指示此效能的不同量值。雖然精簡模型的目標是增加這些分數,但較高的分數不一定表示較好的模型。
您可以排除或納入特徵、變更訓練資料以及修改其他設定參數,以精簡模型。這麼做時,您可以比較不同版本,以查看您的變更帶來什麼樣的影響。
透過解譯分數,您將可學習如何精簡模型。不同指標的值可提供深入資訊,以瞭解要採取哪些動作以改善結果。
要求和權限
若要進一步瞭解使用 ML 實驗的使用者要求,請參閱 使用實驗。
設定新版本
執行實驗版本之後,如有需要,您可以建立新的版本,以精簡模型。
請執行下列動作:
-
在模型指標表格中,選取您想要精簡的模型。
-
在右下方,按一下檢視設定 以開啟實驗設定窗格。
-
按一下新版本。
建立新的版本後,您可以變更其設定,例如:
-
排除現有特徵
-
納入之前排除的特徵
-
變更或重新整理資料集
-
選取或取消選取演算法
以下區段提供更多關於這些選項的資訊。
草擬新的版本時,在實驗設定窗格中按一下特徵之下的篩選 圖示。篩選時,您可以更輕鬆地視覺化自變更訓練資料集以來採用了哪些特徵。您也可以查看哪些特徵是自動設計,哪些是無設計。
改善資料集
若模型的分數不佳,您可能會想要檢閱資料集以處理任何問題。在 讓資料集準備好進行訓練 中進一步閱讀如何改善資料集。
排除特徵
更多特徵不一定會做出更好的模型。若要精簡模型,您會想要排除不可靠且不相關的特徵,例如:
-
關聯度太高的特徵。從兩個相關聯的特徵,排除特徵重要性較低的特徵。
-
特徵重要性太低的特徵。這些特徵對您嘗試瞭解的內容沒有任何影響。
-
特徵重要性太高的特徵。這可能是由於資料滲漏。
測試以從訓練資料移除特徵,然後再次執行訓練,並檢查這是否改善了模型。對模型分數是否造成很大差異或沒有影響?
請執行下列動作:
-
從目錄開啟實驗。
-
選取您要精簡的模型。
-
在右下方,按一下檢視設定 以開啟實驗設定窗格。
-
按一下新版本以設定新的實驗版本。
-
在特徵之下,對您不想用於訓練的任何特徵清除核取方塊。
新增特徵
若模型的評分仍然不佳,可能是因為尚未在資料集中擷取與目標有關係的特徵。您可以重新處理資料集並重新設定其用途,以最佳化資料品質,並新增特徵和資訊。就緒後,新的資料集可以新增至未來的實驗版本。請參閱 變更和重新整理資料集。
進一步閱讀如何在 建立新的特徵欄 中擷取或設計新的特徵。
選取演算法
根據目標欄的資料類型,會為訓練自動選取合適的演算法。您可能會想要排除執行情況不佳或速度較慢的演算法。以此方式,您就不必浪費時間對這些演算法進行訓練。
如需更多關於如何選擇演算法的資訊,請參閱 演算法。
請執行下列動作:
-
從目錄開啟實驗。
-
選取您要精簡的模型。
-
在右下方,按一下檢視設定 以開啟實驗設定窗格。
-
按一下新版本以設定新的實驗版本。
-
在演算法之下,對您不想用於訓練的任何演算法清除核取方塊。
變更和重新整理資料集
若訓練資料自上一個實驗版本以來已變更,您可以變更或重新整理資料集,以用於未來的實驗版本。
若您想要在相同的實驗內比較不同資料集的模型指標和效能,這可能很實用。例如,在以下情況,這會很實用:
-
有新的資料集記錄可用,或對原始資料集記錄進行了更新。例如,最近月份的交易可能已經可用,適合用於訓練,或者可能已識別並處理資料集合問題。
-
已重新處理原始訓練資料集或重新設定其用途,也許是為了改善模型訓練。例如,您可能已改善邏輯,以定義特徵欄值,或甚至新增了新的特徵欄。
變更或重新整理資料集不會改變已從先前實驗版本訓練的現有模型。在實驗版本內,只會根據特定版本內定義的訓練資料來訓練模型。
要求
為新的實驗版本變更或重新整理資料集時,新的資料集必須符合下列要求:
-
目標欄的名稱和特徵類型需要與原始訓練資料集中的目標相同。
- 目標欄中的相異值數量範圍必須與給定實驗類型要求的範圍相同。例如,對於多類別分類實驗,新資料集中的目標欄必須仍然介於三個和十個唯一值之間。如需具體範圍,請參閱 決定建立的模型類型。
其他特徵欄可以全新,有不同的名稱,並且包含不同的資料。
變更資料集
請執行下列動作:
-
在實驗中的模型指標表格中,選取模型。
-
在右下方,按一下檢視設定 以開啟實驗設定窗格。
-
按一下新版本以設定新的實驗版本。
-
在訓練資料之下,按一下變更資料集。
-
選取或上傳新的資料集。
重新整理資料集
請執行下列動作:
-
在實驗中的模型指標表格中,選取模型。
-
在右下方,按一下檢視設定 以開啟實驗設定窗格。
-
按一下新版本以設定新的實驗版本。
-
在訓練資料之下,按一下重新整理資料集。
若資料集重新整理可用,會通知您。若建立名稱相同的新檔案,藉此覆寫現有資料檔案,資料集通常會在此時重新整理。
比較實驗版本
進行變更後,再次執行訓練並比較新版本與舊版本,以查看變更的影響。
請執行下列動作:
-
在螢幕右下角按一下 執行 v2 以訓練另一個實驗版本。
(按鈕上的文字取決於您已執行的版本數量。)
-
在模型指標表格中,您可以使用演算法、版本和其他屬性的下拉式功能表篩選模型。也可以依個別指標欄排序表格。
刪除實驗版本
您可以刪除不想保留的實驗版本。請注意,也會刪除實驗版本中的所有模型且無法復原。
請執行下列動作:
-
在模型指標表格中,從您想要刪除的實驗版本選取模型。
-
在右下方,按一下刪除 <版本編號>。
-
在確認對話方塊中,按一下刪除。