このページ上

メインコンテンツをスキップする

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

データドリフト

時間の経過とともに、1 つ以上の特徴量のデータの分布、大きさ、その他のプロパティが変化するため、モデルの正確度が低下する可能性があります。元のモデルは特定のパターンと分布を含む特徴量を使用してトレーニングされたため、これらの分布が将来変更されると、予測の精度と品質に影響します。

データドリフトは数値化でき、さまざまな方法で計算できます。Qlik Predict では、データドリフトは集団安定性指数式で計算されます。「展開されたモデルでのデータドリフトの監視」を参照してください。

ベストプラクティスは、元のトレーニングデータセットと、予測を生成している最新の適用データセットを比較することにより、モデルのデータドリフトを監視することです。データドリフトが特定のしきい値に達した場合は、モデルを再トレーニングするか、元の機械学習の問題が大幅に変更された場合は新しいモデルを構成します。

経時的なモデル性能の評価の詳細については、「経時的なモデルパフォーマンスの評価」を参照してください。

例

ある企業が、主に 45 歳以上の消費者に支持される商品群を持っているとします。特徴量 Age の値分布は次のようになります。

企業が新製品を導入する前の、年齢別の製品購入分布を示す棒グラフ。 — 45 歳以上の消費者からの売上が多いことを示す棒グラフ。

最近、同社は若い消費者に訴求することを目的とした新製品を導入しました。製品が期待通りに売れると、特徴量 Age に大幅な特徴量ドリフトが見られます。

企業が新製品を導入する後の、年齢別の製品購入分布を示す棒グラフ。 — 企業の売上がより均等に分布していることを示す棒グラフ。売上は、あらゆる年齢層の消費者に均等に訴求しています。

Qlik Predict でのデータドリフトの監視

Qlik Predict には、展開されたモデル内の特徴量ごとにデータドリフトを検出するためのツールが組み込まれています。詳細については、「展開されたモデルでのデータドリフトの監視」を参照してください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

こちらにフィードバックをお寄せください

データ ドリフト

例

Qlik Predict でのデータ ドリフトの監視

このページは役に立ちましたか?

データドリフト

Qlik Predict でのデータドリフトの監視