跳到主要內容 跳至補充內容

精簡模型

建立某些初始模型後,精簡模型很重要,才能提升有效性和潛在準確度。模型分數指示此效能的不同量值。雖然精簡模型的目標是增加這些分數,但較高的分數不一定表示較好的模型。

您可以排除或納入特徵、變更訓練資料以及修改其他設定參數,以精簡模型。這麼做時,您可以比較不同版本,以查看您的變更帶來什麼樣的影響。

透過解譯分數,您將可學習如何精簡模型。不同指標的值可提供深入資訊,以瞭解要採取哪些動作以改善結果。

要求和權限

若要進一步瞭解使用 ML 實驗的使用者要求,請參閱 使用實驗

設定新版本

執行實驗版本之後,如有需要,您可以建立新的版本,以精簡模型。

  1. 資料模型分析索引標籤,選取模型以作為下一個版本的基礎使用。

  2. 按一下檢視設定

    就會開啟實驗設定面板。

  3. 按一下新版本

建立新的版本後,您可以變更其設定,例如:

  • 排除現有特徵

  • 納入之前排除的特徵

  • 變更或重新整理資料集

  • 選取或取消選取演算法

以下區段提供更多關於這些選項的資訊。

草擬新的版本時,在實驗設定面板中按一下特徵之下的篩選 篩選 圖示。篩選時,您可以更輕鬆地視覺化自變更訓練資料集以來採用了哪些特徵。您也可以查看哪些特徵是自動設計,哪些是無設計。

改善資料集

若模型的分數不佳,您可能會想要檢閱資料集以處理任何問題。在 讓資料集準備好進行訓練 中進一步閱讀如何改善資料集。

排除特徵

更多特徵不一定會做出更好的模型。若要精簡模型,您會想要排除不可靠且不相關的特徵,例如:

  • 關聯度太高的特徵。從兩個相關聯的特徵,排除特徵重要性較低的特徵。

  • 特徵重要性太低的特徵。這些特徵對您嘗試瞭解的內容沒有任何影響。

  • 特徵重要性太高的特徵。這可能是由於資料滲漏。

測試以從訓練資料移除特徵,然後再次執行訓練,並檢查這是否改善了模型。對模型分數是否造成很大差異或沒有影響?

  1. 從目錄開啟實驗。

  2. 資料模型分析索引標籤,選取模型以作為下一個版本的基礎使用。

  3. 按一下檢視設定

    就會開啟實驗設定面板。

  4. 按一下新版本以設定新的實驗版本。

  5. 特徵之下,對您不想用於訓練的任何特徵清除核取方塊。

提示備註或者,您可以從結構描述或資料檢視中取消選取特徵。切換至實驗中的資料索引標籤,然後按一下 結構描述檢視 結構描述檢視資料檢視 資料檢視

新增特徵

若模型的評分仍然不佳,可能是因為尚未在資料集中擷取與目標有關係的特徵。您可以重新處理資料集並重新設定其用途,以最佳化資料品質,並新增特徵和資訊。就緒後,新的資料集可以新增至未來的實驗版本。請參閱 變更和重新整理資料集

進一步閱讀如何在 建立新的特徵欄 中擷取或設計新的特徵。

選取演算法

根據目標欄的資料類型,會為訓練自動選取合適的演算法。您可能會想要排除執行情況不佳或速度較慢的演算法。以此方式,您就不必浪費時間對這些演算法進行訓練。

如需更多關於如何選擇演算法的資訊,請參閱 理解模型演算法

  1. 從目錄開啟實驗。

  2. 資料模型分析索引標籤,選取模型以作為下一個版本的基礎使用。

  3. 按一下檢視設定

    就會開啟實驗設定面板。

  4. 按一下新版本以設定新的實驗版本。

  5. 演算法之下,對您不想用於訓練的任何演算法清除核取方塊。

變更和重新整理資料集

若訓練資料自上一個實驗版本以來已變更,您可以變更或重新整理資料集,以用於未來的實驗版本。

若您想要在相同的實驗內比較不同資料集的模型指標和效能,這可能很實用。例如,在以下情況,這會很實用:

  • 有新的資料集記錄可用,或對原始資料集記錄進行了更新。例如,最近月份的交易可能已經可用,適合用於訓練,或者可能已識別並處理資料集合問題。

  • 已重新處理原始訓練資料集或重新設定其用途,也許是為了改善模型訓練。例如,您可能已改善邏輯,以定義特徵欄值,或甚至新增了新的特徵欄。

變更或重新整理資料集不會改變已從先前實驗版本訓練的現有模型。在實驗版本內,只會根據特定版本內定義的訓練資料來訓練模型。

要求

為新的實驗版本變更或重新整理資料集時,新的資料集必須符合下列要求:

  • 目標欄的名稱和特徵類型需要與原始訓練資料集中的目標相同。

  • 目標欄中的相異值數量範圍必須與給定實驗類型要求的範圍相同。例如,對於多類別分類實驗,新資料集中的目標欄必須仍然介於三個和十個唯一值之間。如需具體範圍,請參閱 決定建立的模型類型

其他特徵欄可以全新,有不同的名稱,並且包含不同的資料。

變更資料集

  1. 資料模型分析索引標籤,選取模型以作為下一個版本的基礎使用。

  2. 按一下檢視設定

    就會開啟實驗設定面板。

  3. 按一下新版本以設定新的實驗版本。

  4. 訓練資料之下,按一下變更資料集

  5. 選取或上傳新的資料集。

重新整理資料集

  1. 資料模型分析索引標籤,選取模型以作為下一個版本的基礎使用。

  2. 按一下檢視設定

    就會開啟實驗設定面板。

  3. 按一下新版本以設定新的實驗版本。

  4. 訓練資料之下,按一下重新整理資料集

    若資料集重新整理可用,會通知您。若建立名稱相同的新檔案,藉此覆寫現有資料檔案,資料集通常會在此時重新整理。

執行精簡的版本

完成版本設定後,就可以執行。

  • 在螢幕右下角按一下 執行 v2

    (按鈕上的文字取決於您已執行的版本數量。)

比較實驗版本

新版本完成訓練後,比較新版與舊版,以查看變更後的影響。您有一些選項可用於比較各個實驗版本的模型。

快速分析

使用實驗中的模型資料索引標籤,以比較該版本與舊版。在模型索引標籤中,您可以:

  • 檢視模型指標表格中的結果。

  • 在模型之間切換,以檢視模型訓練摘要和其他自動產生的圖表中的差異。

如需更多關於快速模型分析的資訊,請參閱 執行快速模型分析

深度分析

您可以切換至實驗中的比較分析索引標籤,以驅動更深入的模型分析。這些索引標籤提供內嵌分析體驗,讓您可以透過互動方式在更精細的層級評估模型。

比較索引標籤提供所有模型的模型分數和超參數比較。分析索引標籤可讓您聚焦於特定模型,以評估預測準確度、特徵重要性和其他詳細資訊。

如需更多資訊,請參閱 比較模型執行詳細模型分析

變更模型最佳化設定

執行啟用智慧最佳化的版本之後,您可以關閉智慧最佳化。這可讓您使用從智慧最佳化提供的深入資訊,同時也提供您需要的控制權,以進行微小的改善。或者,您也可以在關閉該設定的情況下執行一個或多個版本之後,開啟智慧模型最佳化。

超參數最佳化是實用的設定,可在模型精簡流程期間開啟。通常,不建議對第一個實驗版本開啟此設定。

您也可以變更是否要使用時間意識訓練,或變更作為日期索引使用的欄。

  1. 按一下檢視設定

  2. 如有需要,按一下新版本以設定新的實驗版本。

  3. 在面板中,展開模型最佳化

  4. 智慧手動設定之間切換,以開啟或關閉智慧模型最佳化。

  5. 若您想要啟用超參數最佳化,按一下超參數最佳化核取方塊,並設定訓練時間上限。

  6. 基於時間的分割測試訓練之下,您可以變更時間意識訓練的設定:

    1. 若要開啟時間意識訓練,請選取資料集中的特定日期索引欄,以變更的預設值。

    2. 若要關閉時間意識訓練,請將日期索引的值設定為

    3. 將所選的日期索引欄變更為其他欄。

刪除實驗版本

您可以刪除不想保留的實驗版本。請注意,也會刪除實驗版本中的所有模型且無法復原。

  1. 切換至模型索引標籤。

  2. 模型指標表格中,從您想要刪除的實驗版本選取模型。

    提示備註若您位於資料分析索引標籤,也可以使用工具列中的下拉式功能表選取模型。
  3. 在右下方,按一下刪除 <版本編號>

  4. 在確認對話方塊中,按一下刪除

瞭解更多資訊

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!