設定實驗
實驗設定包括選取目標以及模型用來預測目標的特徵。您也可以設定選用設定的數量。
為了在目標選項中支援您,會分析歷史資料集,並在資料集中的每欄顯示摘要統計資料。數個自動前置處理步驟會套用至資料集,以確認僅納入合適的資料。如需更多關於資料前置處理的詳細資訊,請參閱 自動資料準備和轉換。
執行第 1 版後,如有需要,您可以建立新的實驗版本,進一步精簡模型訓練。如需詳細資訊,請參閱精簡模型。
要求和權限
若要進一步瞭解使用 ML 實驗的使用者要求,請參閱 使用實驗。
介面
下列區段概述如何導覽實驗介面,以設定實驗。如需更多關於介面的資訊,請參閱 導覽實驗介面。
索引標籤式導覽
建立實驗時,會開啟資料索引標籤。您可在此設定實驗的目標和特徵。
執行至少一個實驗版本後,其他索引標籤就可供使用。這些其他索引標籤可讓您分析剛才在版本中訓練的模型。若您需要透過不同特徵選項設定後續版本,可以返回資料索引標籤。
結構描述檢視和資料檢視
在資料索引標籤中,您可以在下列檢視之間交替:
-
結構描述檢視:預設檢視。在此檢視中,資料集的每欄透過結構描述中的一列呈現,含有資訊和統計資料。
-
資料檢視:可用來存取每個欄的更多資訊和樣本資料的替代檢視。
實驗設定面板
按一下 檢視設定以開啟面板,您可在此進一步自訂實驗訓練。無論您在檢視哪個索引標籤,都可以開啟面板。此面板提供一些額外的設定選項。
藉由實驗設定面板,您可以:
-
在訓練第一個版本之前選取目標
-
新增或移除功能
-
設定新的實驗版本
-
選取以變更或重新整理訓練資料集
-
新增或移除演算法
-
變更模型最佳化設定
選取目標
目標欄包含您希望機器學習模型預測的值。在您開始首次訓練之前,可以變更目標欄。之後就會鎖定編輯。
請執行下列動作:
在 結構描述檢視或 資料檢視中,將游標暫留在欄上方。
按一下顯示的 圖示。
目標欄現在透過 指示,並自動選取其他可用欄作為特徵。
可以在訓練設定面板中交替選取目標。
選取目標後,您可以開始執行第一個實驗版本。在 訓練實驗 中閱讀更多。您目前可以進行其他設定 (如下所述) 或在檢閱訓練結果之後調整設定。
關於如何解譯和處理資料的說明會在實驗訓練繼續時顯示。如需詳細資訊,請參閱解譯資料集深入資訊。
決定建立的模型類型
您選取作為目標的欄決定實驗建立的模型類型。這反過來會參與決定哪些演算法用來訓練模型。可能無法選取資料集中的特定欄作為實驗目標,或者可能已套用特定處理。
模型類型為:
二元分類模型
多類別分類模型
迴歸模型
下表概述決定所用模型類型的目標中因素
模型類型 | 欄中的相異值數量 | 需要特徵類型 | 其他資訊 |
---|---|---|---|
二元分類 | 2 | 任何 | - |
多類別分類 | 3-10 | 任何 | 有超過 10 個相異非數字分類的欄不可選為目標。 |
迴歸 | 超過 10 | 數字 | - |
若要瞭解您的實驗訓練哪個模型類型,按一下 檢視設定並展開演算法。模型類型可見於區段標題中。
選取特徵欄
透過目標設定,您可以從其他可用欄中選擇要在模型訓練中納入哪些欄。排除您不想歸屬到模型的任何特徵。請注意,欄將會留在資料集中,但訓練演算法不會使用。
在實驗設定窗格頂端,您可以看見資料集中的儲存格數量。若數量超過資料集限制,您可以排除特徵以低於限制。
您可以透過各種方式選取特徵欄:
在結構描述檢視和資料檢視中
在主要檢視中,您可以:
取消選取納入所有可用特徵,然後僅選取您要納入的項目。
為您不想納入的特徵手動清除核取方塊。
進行搜尋並在篩選的搜尋結果中排除或納入所有特徵。
在訓練自訂面板中
若您展開實驗設定面板,您可以:
為您不想納入的特徵手動清除核取方塊。
執行第一個實驗版本之後,您可以定義要納入的最佳特徵數量。
選取特徵時,會向這些特徵自動指派特徵類型。可能的特徵類型包括:
類別
數字
日期
自由文字
會根據特徵欄中包含的資料指派特徵類型。若特徵滿足特定條件,可能會暫存,以成為自動設計特徵的基礎。如有需要,您可以變更特徵是否用於自動特徵設計。如需關於自動特徵設計的完整詳細資訊,請參閱 自動特徵設計。
可能無法選取資料集中的特定欄作為實驗特徵,或者可能已套用特定處理。關於如何解譯和處理資料的說明會在您導覽實驗訓練時顯示。如需詳細資訊,請參閱解譯資料集深入資訊。
選取演算法
依照預設,會納入所有可用的演算法,您可以排除您不想使用的任何演算法。通常,您會在看見第一批訓練結果後這麼做,作為模型精簡的一部分。在 精簡模型 中閱讀更多。
變更特徵類型
載入資料集後,會根據資料類型和其他特性將欄視為類別、數字、日期或自由文字。在某些情況下,您可能會想要變更此設定。
例如,若星期幾以數字 1-7 代表,則每個數字代表一個類別值。依照預設,這會被視為連續排名數值,因此您會需要手動變更設定,才能視為類別。
若將欄識別為包含日期和時間資訊,這會作為新產生之自動設計特徵的基礎來使用。若發生此情況,會將原始欄 (父特徵) 視為具有日期特徵類型。您可以將父特徵從日期特徵類型變更為類別特徵類型。 不過,若您這麼做,您就無法再於實驗訓練中使用其自動設計的特徵。
請執行下列動作:
在 結構描述檢視中,找到特徵。
在此特徵的特徵類型欄,按一下 。
在清單中選取值。
您可以從 資料檢視交替變更特徵類型。找到特徵,然後按一下目前特徵類型旁邊的 。在清單中選取值。
您可以在資料處理之下的實驗設定面板查看特徵類型已變更的所有欄。
變更資料集
您可以在執行第一個實驗版本之前,以及在執行任何版本之後,變更訓練資料集。
若您在執行第一個版本之前變更資料集,將會失去變更資料集之前進行的任何設定。
請執行下列動作:
在訓練資料之下的實驗設定面板,按一下變更資料集。
選取新的資料集。
如需更多關於在模型精簡期間 (在執行實驗版本之後) 變更和重新整理資料集的資訊,請參閱 變更和重新整理資料集。
設定模型最佳化
可以自訂下列設定以最佳化模型:
開啟或關閉智慧模型最佳化
開啟或關閉超參數最佳化
開啟或關閉時間意識訓練
可以對您執行的每個實驗版本開啟或關閉這些選項。
設定智慧最佳化
依照預設,實驗會使用智慧模型最佳化。 透過智慧模型最佳化,AutoML 迭代進行特徵選取並對資料套用進階轉換,藉此為您處理模型精簡流程。
如需更多關於智慧最佳化的資訊,請參閱 智慧模型最佳化。
您可以關閉此設定,以手動精簡您訓練的模型。例如,您可能會想要透過智慧模型最佳化開始模型訓練,那麼請為第 2 版切換至手動精簡,以進一步調整設定。
請執行下列動作:
按一下 檢視設定。
若您已執行至少一個實驗版本,按一下新版本。
在面板中,展開模型最佳化。
從智慧切換為手動。
使用滑桿設定訓練的最大執行持續時間。
設定超參數最佳化
您可以使用超參數最佳化來最佳化模型。請注意,這是進階選項,可能會大幅增加訓練時間。若您關閉智慧最佳化,則可使用超參數最佳化。
如需詳細資訊,請參閱超參數最佳化。
請執行下列動作:
按一下 檢視設定。
若您已執行至少一個實驗版本,按一下新版本。
在面板中,展開模型最佳化。
從智慧切換為手動。
選取超參數最佳化核取方塊。
也可以選擇為最佳化設定時間限制。預設時間限制為一小時。
設定時間意識訓練
如果您希望在訓練模型時考慮時間序列維度,請啟用實驗版本的時間意識訓練。若要使用此選項,資料集中的某一欄需要包含相關的時間序列資訊。
開啟時間意識訓練後,AutoML 使用專門的交叉驗證和 Null 插補流程來訓練模型。
如需更多資訊,請參閱 建立時間意識模型 和 基於時間的交叉驗證。
請執行下列動作:
按一下 檢視設定。
若您已執行至少一個實驗版本,按一下新版本。
在面板中,展開模型最佳化。
在基於時間的分割測試訓練之下,選取用於排序資料的日期索引。
檢視關於訓練資料的深入資訊
在實驗的資料索引標籤中,您可以針對處理訓練資料檢視深入資訊。此資訊可見於 結構描述檢視中的深入資訊欄。顯示的資訊取決於您是否已透過目前的訓練資料執行某個版本。深入資訊欄的變更可協助您識別為什麼特徵可能無法使用,或者為什麼已自動捨棄。
如需關於每個深入資訊意義的更多資訊,請參閱 解譯資料集深入資訊。