建立時間意識模型
透過時間意識訓練,您可以組建能夠沿著訓練資料中存在的基於時間的欄來預測資料的模型。如果您需要對已知受此基於時間的欄影響的目標進行預測,請啟用時間意識訓練。
時間意識訓練對訓練資料運用專門的資料處理方式,藉此協助減少資料滲漏。此處理讓機器學習演算法能夠根據特定日期或時間維度,進一步解譯資料和預測性內容。
若要訓練時間意識模型,您需要訓練資料集中包含日期或時間戳記資料的某一欄。此欄是訓練之前用來排序資料集的日期索引。如需更多關於日期索引的資訊,請參閱 日期索引要求。
什麼情況下使用
時間意識模型訓練非常適合預測訓練中已存在之時間指標變化的模型。例如︰
-
您想要預測下個月的銷售額,並且資料集中有交易日期欄。
-
您想要預測延遲出貨的指標,並且資料集中有配送日期欄。
考慮事項
根據您的使用情況,時間意識模型訓練可以協助您組建更好的模型。在其他情況下,使用 AutoML 提供的預設訓練流程可能會看到更好的結果。通常,如果您的資料在很大程度上依賴基於時間的特定欄,建議您使用時間意識模型訓練。
在 Qlik AutoML 中,時間意識訓練不會執行自動化特徵設計以為時間序列問題產生滯後特徵。對於需要特徵設計且基於時間的使用情況,建議您在資料集準備階段執行任何所需的特徵設計。
時間意識訓練的運作方式
機器學習中的一個常見問題是找到方法來確保模型僅根據訓練時可用的資訊進行訓練。如果您的訓練資料包含突出的日期和時間資訊,則該資訊可用於協助防止資料滲漏。
日期索引要求
若要啟用時間意識訓練,資料集中的某一欄需要包含模型訓練所依賴的日期和時間資訊。您在為訓練設定模型最佳化時選取該欄。
若要在訓練中使用欄作為日期索引,該欄必須具有以下所有內容:
-
完整日期。例如,不能使用由月份或日期值組成的欄。
-
日期或時間戳記資料類型。
-
日期特徵類型。
鑑效組和交叉驗證
選擇如何分離資料以進行鑑效組和交叉驗證流程時,隨機選取方法可以將未來的資料引入模型訓練中。啟用時間意識訓練時,AutoML 將使用以下流程:
-
訓練資料集會先沿著您選取的索引欄排序,然後再分為訓練資料和鑑效組資料。
-
訓練的每次反覆運作都使用固定的測試大小和逐漸增加的訓練大小。隨著每次反覆運作,資料變得越來越新。
如需完整詳細資訊,請參閱 基於時間的交叉驗證。
其他處理
時間意識模型訓練也使用與預設訓練流程不同的其他流程。例如,時間意識訓練使用修改後的 Null 插補流程。如需詳細資訊,請參閱Null 插補。
開啟時間意識訓練
對於實驗中執行的每個版本,可以開啟或關閉或重新設定時間意識模型訓練。
請執行下列動作:
-
在實驗中,按一下 檢視設定。
-
若您已執行至少一個實驗版本,按一下新版本。
-
在面板中,展開模型最佳化。
-
在基於時間的分割測試訓練之下,選取用於排序資料的日期索引。
您可以在模型精簡期間變更時間意識訓練。例如,您可以關閉該設定,或選取新的欄作為日期索引。如需詳細資訊,請參閱精簡模型。