資料漂移
隨著時間的推移,模型的準確度可能會下降,因為一個或多個特徵中的資料分佈、幅度和其他屬性會發生變化。由於原始模型的訓練是使用包含特定模式和分佈的特徵,因此這些分佈的未來變化將影響預測的精確度和品質。
資料漂移可以量化並可以透過多種方式計算。在 Qlik AutoML 中,資料漂移是透過母體穩定指數公式來計算。請參閱 監控已部署模型中的資料漂移。
最佳做法是比較原始訓練資料集與您要產生預測的最新套用資料集,以監控模型的資料漂移情況。當資料漂移達到特定閾值時,請重新訓練模型,或者,如果原始機器學習問題發生了重大變化,則請設定新的模型。
如需更多關於隨著時間評估模型效能的資訊,請參閱 隨著時間評估模型效能。
範例
假設一間公司有一套產品,主要受到年滿 45 歲的消費者歡迎。特徵年齡的值分佈可能如下所示。
最近,該公司推出了一款新產品,旨在吸引較年輕的消費者。若產品的銷售符合預期,我們會看到特徵年齡出現顯著的特徵漂移。
AutoML 中的資料漂移監控
AutoML 具有內建工具,可協助您偵測已部署模型中每個特徵的資料漂移。如需詳細資訊,請參閱監控已部署模型中的資料漂移。