跳到主要內容 跳至補充內容

建立並設定時間序列實驗

第一步是建立並設定時間序列實驗。您將會使用先前上傳的訓練資料集來訓練模型,直到準備好部署以進行預測為止。

建立新的實驗

  1. 前往 分析 活動中心的「建立」頁面,並選取 ML 實驗

  2. 輸入實驗名稱,例如銷售預測

  3. 也可以選擇新增說明和標記。

  4. 選擇用於實驗的空間。這可以是個人空間或共用空間。

  5. 按一下建立

  6. 選取訓練資料集檔案 ML - Multivariate forecasting - training.csv

已選取時間序列訓練資料集的 ML 實驗。

已選取時間序列訓練資料集的新 ML 實驗中的結構描述檢視

設定時間序列預測參數

步驟 1:選取目標

首先定義目標欄。我們想要預測未來的銷售額,因此請選取該欄作為目標。

  • 表格列 結構描述檢視中,按一下 sales 旁邊的選項按鈕。目標 目標 圖示取代了按鈕。

選取用於時間序列實驗的目標欄。

選取用於時間序列實驗的目標欄

步驟 2:將實驗設定為時間序列實驗

  1. 如未開啟,按一下 架構 檢視設定,以展開實驗設定面板。

  2. 展開目標和實驗類型

  3. 實驗類型下,選取時間序列。此選項僅在選取高基數數字欄後才會出現。

步驟 3:選取日期索引

接下來,您需要選取要使用的時間序列索引欄。

  1. 仍在設定面板的目標和實驗類型區段中,在日期索引之下,按一下下拉式功能表以展開。

  2. 選取 date

實驗設定面板,其中選取了時間序列作為實驗類型,並選取了 date 作為日期索引欄。

選取實驗的實驗類型和日期索引

在您選取日期索引後,面板中會出現一些新資訊。您現在可以設定群組未來特徵,並調整預測設定。

步驟 4:選取群組

此教學課程的訓練資料集專為多變量預測所設計。透過多變量預測,目標是預測目標值以及其他直接與目標一起變化的維度。例如,在本教學課程中,資料包含針對每個商店和產品系列個別追蹤的銷售指標。多變量預測可讓您將這些維度中的每一個 (否則可能需要作為獨立模型來訓練) 合併到單一實驗中,讓模型能夠更深入地了解不同資料群組之間的模式和互動。

您最多可以選取訓練資料中的兩個欄作為群組來使用,藉此設定多變量實驗。

本教學課程的目標是訓練模型,以學習和預測銷售額以及商店編號和產品系列,因此請選取這兩個欄作為群組。

  • 選取 store_nbrfamily 作為群組

資訊備註 如果沒有明確選取群組,模型只會使用類別特徵自動搜尋適合的分組。一旦識別出有效的群組,流程就會進入訓練階段。因此,如果我們希望系統自動偵測 store_nbr 作為有效的群組欄,這必須標記為類別特徵。

步驟 5:設定共變量 (特徵)

「共變量」和「特徵」這兩個詞在機器學習中經常互換使用,但在 Qlik Predict 的時間序列預測中,「共變量」這個詞更常用且更具描述性。在多變量時間序列模型中,有三種類型的共變量:靜態、過去和未來。

靜態和過去共變量是您在實驗訓練中包含的特徵之一,但群組、日期索引和未來特徵除外。靜態和過去共變量由系統自動識別。您無需設定這些,只要納入這些內容作為特徵即可 (並避免將這些內容設定為未來特徵)。

未來共變量,或未來特徵,也指您在訓練中包含的特徵。未來共變量是具有您會事先知道的未來資料的特徵,特別是若您對於涵蓋您所選預測範圍的此特徵可以存取未來值。對於未來特徵,您也需要知道模型進行訓練所針對的歷史時間範圍的資料值。

除了在訓練特徵清單中包含未來特徵,您也需要在訓練設定面板中將其設定為未來特徵。在預測時,模型將會預期涵蓋預測範圍的未來特徵資料,以產生準確的預測。

在訓練資料中,onpromotion 特徵會追蹤在指定日期有多少產品以促銷價格享有折扣。這是預先已知的資訊,並且有可用的未來資料,因此可以作為未來特徵使用。

  • 群組下拉式清單下方,展開未來特徵並選取 onpromotion

摘要:

  • 已選取 onpromotion 作為未來特徵。

  • 除了日期索引之外,沒有選取其他共變量用於訓練。

步驟 6:設定預測時段和間隔

在您選取日期索引後,面板中會出現一些新資訊。

前往根據您的資料區段。此區段概述了您的歷史資料時間範圍,並允許您設定您想要預測的未來日期範圍。

預估最大預測為 180 天。此預估值是根據可用的歷史資料,其中預測時段是可用歷史資料總量的一部分。這代表了您預估能夠預測目標的未來時間步長數量上限 (在此案例下為天數)。在執行某個版本的訓練後,將會得知更多資訊,此預估值將會由明確的最大值預測取代。

預測時段大小會設定您要對未來預測多少個時間步長。例如,在本教學課程中,將預測時段設定為 7,表示模型將預測未來一週的目標日期。

預測間隔大小會設定在訓練資料結束之後,您不想進行預測的時間步長數量。例如,您可能只想預測未來三天或更多天日期的銷售額。

  1. 根據您的資料區段中,將預測時段大小設定為 7 個時間步長。

  2. 預測間隔大小設定為 3 個時間步長。

資訊備註預測範圍是預測時段加上預測間隔大小,以時間步長衡量。在此情況下,預測範圍為 10,這表示在預測時,您正在預測未來 10 個時間步長,即使該預測間隔可能沒有記錄任何實際值。

實驗設定面板,顯示已設定的群組、未來特徵,以及所有所選特徵的摘要。

實驗設定面板,顯示已設定的群組、未來特徵,以及所有所選特徵的摘要。

下圖說明了時間序列預測概念及其與實驗設定的關係。如需更多關於時間序列預測概念的資訊,請參閱 使用多變量時間序列預測

Qlik Predict 中概述時間序列預測問題元件的簡化圖示。

確認其他設定

完成時間序列設定後,請檢閱設定面板中剩餘的訓練設定。

  • 特徵之下,您可以看到已選取四個特徵。

  • 演算法之下,您可以看到已選取所有可用的演算法。

訓練實驗

設定完成後,我們就準備好開始訓練。

  • 在實驗視窗的右下角,按一下執行實驗

實驗完成執行後,我們可以繼續進行下一步,即檢閱產生的模型指標。

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!