資料漂移 | Qlik Cloud 說明
跳到主要內容 跳至補充內容

資料漂移

隨著時間推移,模型的準確度可能會下降,因為一個或多個特性中的資料在分佈、量級和其他屬性上發生了變化。由於原始模型是使用包含特定模式和分佈的特性進行訓練的,因此這些分佈未來的變化將影響預測的精確度和品質。

資料漂移可以量化,並且可以透過多種方式進行計算。在 Qlik Predict 中,資料漂移是使用群體穩定性指標公式計算的。請參閱 監控已部署模型中的資料漂移

最佳實務是透過比較原始 訓練資料集 與產生預測所依據的最新 套用資料集,來監控模型的資料漂移。當資料漂移達到特定閾值時,請重新訓練模型,或者如果原始機器學習問題發生了重大變化,請設定新模型。

如需有關隨時間評估模型效能的詳細資訊,請參閱 隨著時間評估模型效能

範例

假設一家公司有一系列產品,已確定主要受 45 歲及以上的消費者歡迎。特性 Age 的值分佈可能如下所示。

顯示公司銷售額更吸引 45 歲以上消費者的長條圖。

顯示公司推出新產品前按年齡劃分的產品購買分佈的長條圖。在這種情況下,年齡頻率的分佈顯示銷售主要吸引 45 歲及以上的成年人。

最近,該公司推出了一款新產品,其行銷對象也吸引了年輕消費者。當產品如預期銷售時,我們看到特性 Age 出現了顯著的特性漂移。

顯示公司銷售額分佈更均勻的長條圖,公司銷售額對所有年齡層的消費者具有同等吸引力。

顯示公司推出新產品後按年齡劃分的產品購買分佈的長條圖。在這種情況下,年齡頻率的分佈已從主要吸引 45 歲及以上成年人的銷售,轉變為在所有年齡層中分佈更均勻的受歡迎程度。

Qlik Predict 中的資料漂移監控

Qlik Predict 具有內建工具,可協助您在已部署的模型中按特性偵測資料漂移。如需詳細資訊,請參閱 監控已部署模型中的資料漂移

此頁面是否對您有幫助?

若您發現此頁面或其內容有任何問題——錯字、遺漏步驟或技術錯誤——請告知我們!