建立與設定實驗 | Qlik Cloud 說明
跳到主要內容 跳至補充內容

建立與設定實驗

第一步是建立與設定實驗。您將使用先前上傳的訓練資料集來訓練模型,直到其準備好部署以進行預測。

建立新實驗

  1. 前往 分析 活動中心 的建立頁面,然後選取 ML 實驗

  2. 輸入實驗的名稱,例如 Customer churn tutorial

  3. 選擇性地新增描述和標籤。

  4. 為您的實驗選擇一個空間。這可以是您的個人空間或共用空間。

  5. 按一下 建立

  6. 選取訓練資料集檔案。這將是以下其中之一,取決於您使用的是 CSV 還是 QVD:

    • ML - Churn data - training.csv

    • ML - Churn data - training.qvd

檢閱資料

現在您已準備好開始設定實驗,但在開始之前,讓我們看一下資料集。

我們從 設定 索引標籤開始。預設檢視為 表格列 結構描述檢視。在這裡我們可以看到一個表格,其中每一列代表您資料集中的一個資料行。統計資料和深入剖析已在自動資料準備中產生。您可能需要向右捲動結構描述才能看到 深入剖析

我們可以看到 AccountID 因高基數而被排除。這意味著該資料行包含太多唯一值。特性 Country 因相反的原因而被排除:所有列的值都相同。這兩個特性不會為機器學習模型提供任何價值。

我們還可以看到類別特性 Territory 已進行影響編碼。將滑鼠游標懸停在警告 警告三角形 和資訊 警告三角形 圖示上以取得更多資訊。

結構描述檢視 中訓練資料集的 Qlik Predict

ML 實驗中的結構描述檢視,包含關於特性的深入剖析。

按一下 資料檢視 資料檢視。在此檢視中,我們可以看到關於每個資料行的更多資訊,包括樣本資料。

資料檢視

實驗設定中的資料檢視。

選取目標

我們希望我們的機器學習模型能夠預測客戶流失,因此我們選取資料集中的最後一個資料行 Churned 作為我們的目標。

  1. 切換回 表格列 結構描述檢視

  2. 將滑鼠游標懸停在 Churned 上,然後按一下出現的目標 目標 圖示。

結構描述檢視中的某一列被選取為目標

選取目標的表格列。

在實驗設定面板中,展開 實驗設定。您可以看到 Churned 已被選取為目標。根據您的目標和可用的特性資料,實驗類型二元分類

您也可以看到哪些特性會被自動選取和排除。Churned 是目標,因此不會用作特性。

設定面板中顯示的資訊

實驗設定面板,包含選取的目標、實驗類型和預設特性選取

特性選取與模型最佳化

預設情況下,實驗設定為使用智慧型模型最佳化。若要確認,請展開實驗設定面板中的 模型最佳化。應選取 智慧型 選項。

在設定面板中確認智慧型模型最佳化

已開啟智慧型模型最佳化的實驗設定面板

特性選取可以在設定面板的 特性 區段中手動設定。透過智慧型模型最佳化,系統會透過移除無用的特性來自動處理特性選取。開啟此設定後,我們可以在訓練中包含所有可用的特性。

訓練實驗

設定已完成,我們已準備好開始訓練。

  • 按一下 執行實驗

當實驗執行完畢後,我們可以繼續進行下一步,即檢閱產生的模型計量。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!