跳到主要內容 跳至補充內容

精簡模型

建立某些初始模型後,精簡模型很重要,才能提升有效性和潛在準確度。模型分數指示此效能的不同量值。雖然精簡模型的目標是增加這些分數,但較高的分數不一定表示較好的模型。

您可以排除或納入特徵、變更訓練資料以及修改其他設定參數,以精簡模型。這麼做時,您可以比較不同版本,以查看您的變更帶來什麼樣的影響。

透過解譯分數,您將可學習如何精簡模型。不同指標的值可提供深入資訊,以瞭解要採取哪些動作以改善結果。

要求和權限

若要進一步瞭解使用 ML 實驗的使用者要求,請參閱 使用實驗

設定新版本

執行實驗版本之後,如有需要,您可以建立新的版本,以精簡模型。

  1. 模型指標表格中,選取您想要精簡的模型。

  2. 在右下方,按一下檢視設定 以開啟實驗設定窗格。

  3. 按一下新版本

建立新的版本後,您可以變更其設定,例如:

  • 排除現有特徵

  • 納入之前排除的特徵

  • 變更或重新整理資料集

  • 選取或取消選取演算法

以下區段提供更多關於這些選項的資訊。

草擬新的版本時,在實驗設定窗格中按一下特徵之下的篩選 篩選 圖示。篩選時,您可以更輕鬆地視覺化自變更訓練資料集以來採用了哪些特徵。您也可以查看哪些特徵是自動設計,哪些是無設計。

改善資料集

若模型的分數不佳,您可能會想要檢閱資料集以處理任何問題。在 讓資料集準備好進行訓練 中進一步閱讀如何改善資料集。

排除特徵

更多特徵不一定會做出更好的模型。若要精簡模型,您會想要排除不可靠且不相關的特徵,例如:

  • 關聯度太高的特徵。從兩個相關聯的特徵,排除特徵重要性較低的特徵。

  • 特徵重要性太低的特徵。這些特徵對您嘗試瞭解的內容沒有任何影響。

  • 特徵重要性太高的特徵。這可能是由於資料滲漏。

測試以從訓練資料移除特徵,然後再次執行訓練,並檢查這是否改善了模型。對模型分數是否造成很大差異或沒有影響?

  1. 從目錄開啟實驗。

  2. 選取您要精簡的模型。

  3. 在右下方,按一下檢視設定 以開啟實驗設定窗格。

  4. 按一下新版本以設定新的實驗版本。

  5. 特徵之下,對您不想用於訓練的任何特徵清除核取方塊。

提示備註或者,您可以在結構描述和資料檢視中取消選取特徵。按一下結構描述檢視切換到結構描述檢視。按一下資料檢視切換到資料檢視。按一下 模型檢視 以返回模型檢視。

新增特徵

若模型的評分仍然不佳,可能是因為尚未在資料集中擷取與目標有關係的特徵。您可以重新處理資料集並重新設定其用途,以最佳化資料品質,並新增特徵和資訊。就緒後,新的資料集可以新增至未來的實驗版本。請參閱 變更和重新整理資料集

進一步閱讀如何在 建立新的特徵欄 中擷取或設計新的特徵。

選取演算法

根據目標欄的資料類型,會為訓練自動選取合適的演算法。您可能會想要排除執行情況不佳或速度較慢的演算法。以此方式,您就不必浪費時間對這些演算法進行訓練。

如需更多關於如何選擇演算法的資訊,請參閱 演算法

  1. 從目錄開啟實驗。

  2. 選取您要精簡的模型。

  3. 在右下方,按一下檢視設定 以開啟實驗設定窗格。

  4. 按一下新版本以設定新的實驗版本。

  5. 演算法之下,對您不想用於訓練的任何演算法清除核取方塊。

變更和重新整理資料集

若訓練資料自上一個實驗版本以來已變更,您可以變更或重新整理資料集,以用於未來的實驗版本。

若您想要在相同的實驗內比較不同資料集的模型指標和效能,這可能很實用。例如,在以下情況,這會很實用:

  • 有新的資料集記錄可用,或對原始資料集記錄進行了更新。例如,最近月份的交易可能已經可用,適合用於訓練,或者可能已識別並處理資料集合問題。

  • 已重新處理原始訓練資料集或重新設定其用途,也許是為了改善模型訓練。例如,您可能已改善邏輯,以定義特徵欄值,或甚至新增了新的特徵欄。

變更或重新整理資料集不會改變已從先前實驗版本訓練的現有模型。在實驗版本內,只會根據特定版本內定義的訓練資料來訓練模型。

要求

為新的實驗版本變更或重新整理資料集時,新的資料集必須符合下列要求:

  • 目標欄的名稱和特徵類型需要與原始訓練資料集中的目標相同。

  • 目標欄中的相異值數量範圍必須與給定實驗類型要求的範圍相同。例如,對於多類別分類實驗,新資料集中的目標欄必須仍然介於三個和十個唯一值之間。如需具體範圍,請參閱 決定建立的模型類型

其他特徵欄可以全新,有不同的名稱,並且包含不同的資料。

變更資料集

  1. 在實驗中的模型指標表格中,選取模型。

  2. 在右下方,按一下檢視設定 以開啟實驗設定窗格。

  3. 按一下新版本以設定新的實驗版本。

  4. 訓練資料之下,按一下變更資料集

  5. 選取或上傳新的資料集。

重新整理資料集

  1. 在實驗中的模型指標表格中,選取模型。

  2. 在右下方,按一下檢視設定 以開啟實驗設定窗格。

  3. 按一下新版本以設定新的實驗版本。

  4. 訓練資料之下,按一下重新整理資料集

    若資料集重新整理可用,會通知您。若建立名稱相同的新檔案,藉此覆寫現有資料檔案,資料集通常會在此時重新整理。

比較實驗版本

進行變更後,再次執行訓練並比較新版本與舊版本,以查看變更的影響。

  1. 在螢幕右下角按一下 執行 v2 以訓練另一個實驗版本。

    (按鈕上的文字取決於您已執行的版本數量。)

  2. 模型指標表格中,您可以使用演算法、版本和其他屬性的下拉式功能表篩選模型。也可以依個別指標欄排序表格。

比較模型版本

模型指標表顯示多個實驗版本的模型指標比較

刪除實驗版本

您可以刪除不想保留的實驗版本。請注意,也會刪除實驗版本中的所有模型且無法復原。

  1. 模型指標表格中,從您想要刪除的實驗版本選取模型。

  2. 在右下方,按一下刪除 <版本編號>

  3. 在確認對話方塊中,按一下刪除

瞭解更多資訊

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!