予測データの作成
モデルを展開すると、新しいデータに関する予測を作成できます。
ここまでのところ、既存の顧客データを使って機械学習モデルを作成しました。このプロセスの目的は、新しいデータに適用するために、機械学習を通してパターンを認識することです。
トレーニング データで SHAP 値を分析するためのみのユース ケースもあります。この情報は、自分の権限においても非常に重要です。
Qlik AutoMLでの予測に関する詳細については、データセットでの予測の作成を参照してください。
プロセスの最初のステップは、モデルを適用して予測を生成するデータセットを選択することです。この後、出力のために希望するプロパティを設定してから、ファイルを生成できます。
次の手順を実行します。
[カタログ] で、新しい ML 展開を開きます。[ML モデル管理] が開きます。
-
[ML モデル管理] インターフェイスの右下で、予測の作成をクリックします。
-
[予測構成] パネルがまだ開いていない場合は、 をクリックして開きます。
-
次に、適用データセットを選択する必要があります。データの適用で、適用データセットを選択をクリックします。
-
チュートリアルの開始時にインポートした Customer churn data - apply.csv データセットを選択します。
-
トレーニング データセットと適用データセットのスキーマを比較します。トレーニング中に特徴量の選択を解除したため、適用データセットにはトレーニング データセットよりも多くの項目が含まれます。これについて心配する必要はありません。予測を生成するとき、AutoML はトレーニング データセットに存在しない適用データセットの項目を単純に無視します。
-
[データセットの予測] ペインで、[予測データセットに名前を付ける] をクリックします。データセットの名前を入力 (または既定の名前に設定) してから、確認をクリックします。
-
予測オプションで、この予測で生成するデータセットを選択します。この場合は、SHAP およびエラーの選択を解除してから、座標 SHAP を選択します (これによりピボット テーブルを標準フォーマットに変換し、すべての含まれる項目のデータを分析できます)。AccountID をインデックス列として使用できるようにします。
保存して今すぐ予測をクリックします。プロセスは、データセットの予測で監視できます。
表示されたポップアップで開くをクリックすることにより、[カタログ] の出力をレビューできます。
予測の実行が終了すると、新しいデータセットを使ってアプリの構築を開始できます。次のトピックに移ります。