予測データの作成
モデルを展開して承認すると、新しいデータに関する予測を作成できます。
ここまでのところ、既存の顧客データを使って機械学習モデルを作成しました。このプロセスの目的は、新しいデータに適用するために、機械学習を通してパターンを認識することです。
トレーニング データで SHAP 値を分析するためのみのユース ケースもあります。この情報は、自分の権限においても非常に重要です。
Qlik AutoMLでの予測に関する詳細については、データセットでの予測の作成を参照してください。
プロセスの最初のステップは、モデルを適用して予測を生成するデータセットを選択することです。この後、出力のために希望するプロパティを設定してから、ファイルを生成できます。
次の手順を実行します。
カタログで、新しい ML 展開を開きます。
-
ML 展開インターフェイスの右下で、 [予測の作成] をクリックします。
-
[予測構成] パネルがまだ開いていない場合は、 をクリックして開きます。
-
次に、適用データセットを選択する必要があります。[データの適用] で、 [適用データセットを選択] をクリックします。
-
適用データセット ファイルを選択します。これは、CSV または QVD のどちらを使用しているかに応じて、次のいずれかになります。
-
AutoML Tutorial - Churn data - apply.csv
-
AutoML Tutorial - Churn data - apply.qvd
-
-
トレーニング データセットと適用データセットのスキーマを比較します。トレーニング中に特徴量の選択を解除したため、適用データセットにはトレーニング データセットよりも多くの項目が含まれます。これについて心配する必要はありません。予測を生成するとき、AutoML はトレーニング データセットに存在しない適用データセットの項目を単純に無視します。
-
[データセットの予測] ペインで、[予測データセットに名前を付ける] をクリックします。データセットの名前を入力(または既定の名前に設定)し、形式を選択します。既定は Parquet ですが、このチュートリアルでは CSV を使用します。
-
スペースを選択し、[確定] をクリックします。
-
[予測オプション] で、この予測で生成するデータセットを選択します。この場合は、 [SHAP] および [エラー] の選択を解除してから、 [座標 SHAP] を選択します (これによりピボット テーブルを標準フォーマットに変換し、すべての含まれる項目のデータを分析できます)。AccountID をインデックス列として使用できるようにします。
[保存して今すぐ予測] をクリックします。プロセスは、 [データセットの予測] で監視できます。
表示されたポップアップで [開く] をクリックすることにより、カタログの出力をレビューできます。
予測の実行が終了すると、新しいデータセットを使ってアプリの構築を開始できます。次のトピックに移ります。