跳到主要內容 跳至補充內容

建立並設定實驗

第一步是建立並設定實驗。您將會使用先前上傳的訓練資料集來訓練模型,直到準備好部署以進行預測為止。

建立新的實驗

  1. Qlik Cloud 分析 中心,按一下新增,然後選取新的 ML 實驗

  2. 輸入實驗名稱,例如客戶流失教學課程

  3. 也可以選擇新增說明和標記。

  4. 選擇用於實驗的空間。這可以是個人空間或共用空間。

  5. 按一下建立

  6. 選取 Customer churn data - training.csv 檔案。

檢閱資料

現在您已準備好開始設定實驗,但在開始之前,我們來看看資料集。

我們在結構描述檢視開始。在此我們可以看見每列呈現資料集某欄的表格。已在自動資料準備時產生統計資料和深入資訊。您可能必須捲動至結構描述右側以查看深入資訊。

我們可以看見 AccountID 由於高基數而被排除。這表示欄包含太多唯一值。特徵 Country 則是由於相反原因而被排除:該值在所有列都相同。 這兩個特徵不會對機器學習模型提供任何值。

我們也可以看見類別特徵 Territory 已經過 impact encoded。將游標暫留在 警告三角形警告三角形 圖示上,以獲得更多資訊。

用於在 Qlik AutoML 中訓練資料集的結構描述檢視

表格欄與關於特徵的深入資訊。

按一下資料檢視 資料檢視 圖示以變更為資料檢視。在此我們可以看見更多關於每欄的資訊,包括樣本資料。

資料檢視

表格欄與關於特徵的深入資訊。

選取目標

我們希望機器學習模型預測客戶流失情況,因此選取資料集的最後一欄 Churned (已流失) 作為目標。

  1. 按一下結構描述檢視 表格列 圖示,以切換回結構描述檢視。

  2. 將游標暫留在 Churned 上方,並按一下顯示的目標 目標 圖示。

會選取結構描述檢視中的列作為目標

所選目標的表格列。

實驗設定面板上,我們現在可以看見已選取 Churned。我們也可以看見自動選取和排除了哪些特徵。由於 Churned 是目標,這不會作為特徵使用。我們也可以看見此實驗將會作為二元分類問題來處理。

資訊顯示在實驗設定窗格

所選目標的表格列。

選取特徵

對於首次執行實驗,我們將會納入預設已選取的所有特徵和演算法。不過,若您根據自己的商務知識,已經知道特定特徵不會影響目標,則您可以在這時取消選取這些特徵,以從訓練中排除。

訓練實驗

設定完成後,我們就準備好開始訓練。

  • 在實驗視窗的右下角,按一下執行實驗

實驗完成執行後,我們可以繼續進行下一步,即檢閱產生的模型指標。

瞭解更多資訊

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!