跳到主要內容 跳至補充內容

資料漂移

隨著時間的推移,模型的準確度可能會下降,因為一個或多個特徵中的資料分佈、幅度和其他屬性會發生變化。由於原始模型的訓練是使用包含特定模式和分佈的特徵,因此這些分佈的未來變化將影響預測的精確度和品質。

資料漂移可以量化並可以透過多種方式計算。在 Qlik AutoML 中,資料漂移是透過母體穩定指數公式來計算。請參閱 監控已部署模型中的資料漂移

最佳做法是比較原始訓練資料集與您要產生預測的最新套用資料集,以監控模型的資料漂移情況。當資料漂移達到特定閾值時,請重新訓練模型,或者,如果原始機器學習問題發生了重大變化,則請設定新的模型。

如需更多關於隨著時間評估模型效能的資訊,請參閱 隨著時間評估模型效能

範例

假設一間公司有一套產品,主要受到年滿 45 歲的消費者歡迎。特徵年齡的值分佈可能如下所示。

長條圖顯示公司銷售內容對 45 歲以上的消費者更具吸引力。

長條圖顯示在公司推出新產品之前依年齡劃分的產品購買分佈。

最近,該公司推出了一款新產品,旨在吸引較年輕的消費者。若產品的銷售符合預期,我們會看到特徵年齡出現顯著的特徵漂移。

長條圖顯示公司銷售額的分佈更加均勻,公司銷售內容對各個年齡層消費者的吸引力更加平均。

長條圖顯示在公司推出新產品之後依年齡劃分的產品購買分佈。

AutoML 中的資料漂移監控

AutoML 具有內建工具,可協助您偵測已部署模型中每個特徵的資料漂移。如需詳細資訊,請參閱監控已部署模型中的資料漂移

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們可以如何改善!