建立並設定實驗
第一步是建立並設定實驗。您將會使用先前上傳的訓練資料集來訓練模型,直到準備好部署以進行預測為止。
建立新的實驗
請執行下列動作:
-
在 Qlik Cloud 分析 中心,按一下新增,然後選取新的 ML 實驗。
-
輸入實驗名稱,例如客戶流失教學課程。
-
也可以選擇新增說明和標記。
-
選擇用於實驗的空間。這可以是個人空間或共用空間。
-
按一下建立。
-
選取 Customer churn data - training.csv 檔案。
檢閱資料
現在您已準備好開始設定實驗,但在開始之前,我們來看看資料集。
我們在結構描述檢視開始。在此我們可以看見每列呈現資料集某欄的表格。已在自動資料準備時產生統計資料和深入資訊。您可能必須捲動至結構描述右側以查看深入資訊。
我們可以看見 AccountID 由於高基數而被排除。這表示欄包含太多唯一值。特徵 Country 則是由於相反原因而被排除:該值在所有列都相同。 這兩個特徵不會對機器學習模型提供任何值。
我們也可以看見類別特徵 Territory 已經過 impact encoded。將游標暫留在 和 圖示上,以獲得更多資訊。
按一下資料檢視 圖示以變更為資料檢視。在此我們可以看見更多關於每欄的資訊,包括樣本資料。
選取目標
我們希望機器學習模型預測客戶流失情況,因此選取資料集的最後一欄 Churned (已流失) 作為目標。
請執行下列動作:
-
按一下結構描述檢視 圖示,以切換回結構描述檢視。
-
將游標暫留在 Churned 上方,並按一下顯示的目標 圖示。
在實驗設定面板上,我們現在可以看見已選取 Churned。我們也可以看見自動選取和排除了哪些特徵。由於 Churned 是目標,這不會作為特徵使用。我們也可以看見此實驗將會作為二元分類問題來處理。
選取特徵
對於首次執行實驗,我們將會納入預設已選取的所有特徵和演算法。不過,若您根據自己的商務知識,已經知道特定特徵不會影響目標,則您可以在這時取消選取這些特徵,以從訓練中排除。
訓練實驗
設定完成後,我們就準備好開始訓練。
請執行下列動作:
-
在實驗視窗的右下角,按一下執行實驗。
實驗完成執行後,我們可以繼續進行下一步,即檢閱產生的模型指標。