建立並設定實驗
第一步是建立並設定實驗。您將會使用先前上傳的訓練資料集來訓練模型,直到準備好部署以進行預測為止。
建立新的實驗
請執行下列動作:
-
前往 分析 活動中心的「建立」頁面,並選取 ML 實驗。
-
輸入實驗名稱,例如客戶流失教學課程。
-
也可以選擇新增說明和標記。
-
選擇用於實驗的空間。這可以是個人空間或共用空間。
-
按一下建立。
-
選取訓練資料集檔案。根據您使用 CSV 或 QVD,這將會是下列任一項內容:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
檢閱資料
現在您已準備好開始設定實驗,但在開始之前,我們來看看資料集。
我們在資料索引標籤開始。預設檢視是 結構描述檢視在此我們可以看見每列呈現資料集某欄的表格。已在自動資料準備時產生統計資料和深入資訊。您可能必須捲動至結構描述右側以查看深入資訊。
我們可以看見 AccountID 由於高基數而被排除。這表示欄包含太多唯一值。特徵 Country 則是由於相反原因而被排除:該值在所有列都相同。 這兩個特徵不會對機器學習模型提供任何值。
我們也可以看見類別特徵 Territory 已經過 impact encoded。將游標暫留在 和 圖示上,以獲得更多資訊。
按一下 資料檢視。在此檢視中,我們可以看見更多關於每欄的資訊,包括樣本資料。
選取目標
我們希望機器學習模型預測客戶流失情況,因此選取資料集的最後一欄 Churned (已流失) 作為目標。
請執行下列動作:
-
切換回 結構描述檢視。
-
將游標暫留在 Churned 上方,並按一下顯示的目標 圖示。
在實驗設定面板上,我們現在可以看見已選取 Churned。我們也可以看見自動選取和排除了哪些特徵。由於 Churned 是目標,這不會作為特徵使用。我們也可以看見此實驗將會作為二元分類問題來處理。
選取特徵
對於實驗的首次執行,我們將納入預設已選取的所有特徵和演算法。不過,若您根據自己的商務知識,已經知道特定特徵不會影響目標,則您可以在這時取消選取這些特徵,以從訓練中排除。
變更最佳化設定
依照預設,會開啟智慧模型最佳化。透過智慧模型最佳化,AutoML 可自動精簡模型訓練。不過,本教學課程的目標是呈現如何手動識別特徵資料和訓練結果的特定問題。
如需如何透過智慧模型最佳化訓練模型的範例,請參閱 範例 – 透過自動化機器學習訓練模型。
現在來關閉智慧模型最佳化,以展示手動精簡。
請執行下列動作:
-
在實驗設定面板,展開模型最佳化區段。
-
從智慧切換為手動。
訓練實驗
設定完成後,我們就準備好開始訓練。
請執行下列動作:
-
在實驗視窗的右下角,按一下執行實驗。
實驗完成執行後,我們可以繼續進行下一步,即檢閱產生的模型指標。