建立與設定實驗
第一步是建立與設定實驗。您將使用先前上傳的訓練資料集來訓練模型,直到其準備好部署以進行預測。
建立新實驗
請執行下列動作:
-
前往 分析 活動中心 的建立頁面,然後選取 ML 實驗。
-
輸入實驗的名稱,例如 Customer churn tutorial。
-
選擇性地新增描述和標籤。
-
為您的實驗選擇一個空間。這可以是您的個人空間或共用空間。
-
按一下 建立。
-
選取訓練資料集檔案。這將是以下其中之一,取決於您使用的是 CSV 還是 QVD:
-
ML - Churn data - training.csv
-
ML - Churn data - training.qvd
-
檢閱資料
現在您已準備好開始設定實驗,但在開始之前,讓我們看一下資料集。
我們從 設定 索引標籤開始。預設檢視為 結構描述檢視。在這裡我們可以看到一個表格,其中每一列代表您資料集中的一個資料行。統計資料和深入剖析已在自動資料準備中產生。您可能需要向右捲動結構描述才能看到 深入剖析。
我們可以看到 AccountID 因高基數而被排除。這意味著該資料行包含太多唯一值。特性 Country 因相反的原因而被排除:所有列的值都相同。這兩個特性不會為機器學習模型提供任何價值。
我們還可以看到類別特性 Territory 已進行影響編碼。將滑鼠游標懸停在警告 和資訊
圖示上以取得更多資訊。
結構描述檢視 中訓練資料集的 Qlik Predict
按一下 資料檢視。在此檢視中,我們可以看到關於每個資料行的更多資訊,包括樣本資料。
資料檢視
選取目標
我們希望我們的機器學習模型能夠預測客戶流失,因此我們選取資料集中的最後一個資料行 Churned 作為我們的目標。
請執行下列動作:
-
切換回
結構描述檢視。
-
將滑鼠游標懸停在 Churned 上,然後按一下出現的目標
圖示。
結構描述檢視中的某一列被選取為目標
在實驗設定面板中,展開 實驗設定。您可以看到 Churned 已被選取為目標。根據您的目標和可用的特性資料,實驗類型 為 二元分類。
您也可以看到哪些特性會被自動選取和排除。Churned 是目標,因此不會用作特性。
設定面板中顯示的資訊
特性選取與模型最佳化
預設情況下,實驗設定為使用智慧型模型最佳化。若要確認,請展開實驗設定面板中的 模型最佳化。應選取 智慧型 選項。
在設定面板中確認智慧型模型最佳化

特性選取可以在設定面板的 特性 區段中手動設定。透過智慧型模型最佳化,系統會透過移除無用的特性來自動處理特性選取。開啟此設定後,我們可以在訓練中包含所有可用的特性。
訓練實驗
設定已完成,我們已準備好開始訓練。
請執行下列動作:
-
按一下 執行實驗。
當實驗執行完畢後,我們可以繼續進行下一步,即檢閱產生的模型計量。