データセットでの予測の作成
ML 展開を使用して、新しいデータで将来の結果を予測します。
予測構成の作成を開始するには、ML 展開を開き、 [データセットの予測] パネルに移動します。「ML 展開インターフェイスの操作」を参照してください。
新しいトランザクションに対する毎日の予測など、カタログのデータセットに関する予測を実行できます。予測 API を使用して、リアルタイムで予測することもできます。予測 API の詳細については、 「リアルタイム予測の作成」を参照してください。
予測は、予測と各クラスの確率を含む列 (分類モデルの場合) を含むデータセットで生成されます。 必要に応じて、SHAP 値またはエラーを含むデータセットと、適用データセットのコピーを生成することもできます。データセットは、Parquet、CSV、または QVD 形式にできます。
予測が生成されたら、予測インサイトを Qlik Sense アプリにロードできます。 これにより、データを視覚化して操作し、仮定のシナリオを作成できます。
始める前に:
ML 展開で予測の生成を開始する前に、ソースモデルをアクティブ化する必要があります。詳細については、「展開されたモデルの承認」を参照してください。
主な概念
適用データセット
実験トレーニング中に、新しいデータセットで予測を生成するために使用されるモデルを展開します。このデータセットは適用データセットとして知られています。予測は、予測と各クラスの確率を含む列 (分類モデルの場合) を含むデータセットで生成されます。必要に応じて、SHAP 値またはエラーを含むデータセットを生成することもできます。
Qlik Cloud でアップロードおよびプロファイリングできるフラット ファイルはすべて、Qlik AutoML での使用もサポートされています。
複数のシートを持つ Microsoft Excel ファイルなど、複数のテーブルを含むファイルの場合、最初のテーブルのみがインポートされます。テーブルのデータ プロファイリングが失敗した場合 (テーブルが空の場合など)、そのファイルはサポートされていません。
適用するデータセットには、ML 展開のトレーニングに使用されるデータセットと同じ特徴量とデータ型が必要です。ML 実験で指定されたターゲット列は、適用データセットに含める必要はありません。モデルのトレーニングの一部ではなかった追加の列が、適用データセットに存在したままになる可能性があることに注意してください。AutoML は、予測を生成するときに追加の列を単純に無視します。
自動特徴量エンジニアリング
自動特徴量エンジニアリングを使用してトレーニングされたモデルを使用して予測を生成する方法については、「自動特徴量エンジニアリング」を参照してください。
予測構成
予測データセットは、予測構成から生成されます。各 ML 展開には複数の予測構成を含めることができます。予測構成は、スケジュールの有無にかかわらず実行するように設定できます。
予測構成の所有権
ユーザーが予測構成を作成すると、所有者として自動的に割り当てられます。
次のリストは、予測構成を実行するためのアクセス要件を示しています。予測を手動で実行する場合、予測を実行するユーザーは要件を満たしている必要があります。スケジュールされた予測の場合、予測構成の所有者は要件を満たしている必要があります。
-
テナントでの Professional 資格または Full User 資格 および Automl Deployment Contributor ロール。参照先: Qlik AutoML を操作できるユーザー
-
ML 展開からの予測を実行するためにスペースで必要な権限。
-
予測データが保存されているスペースにデータ ソースを作成するために必要な権限。
予測構成の所有者がテナントにアクセスできなくなったり、ML 展開を操作するための他の要件を満たさなくなったりする可能性があります。この場合、必要な権限を持つユーザーは、 [自分を所有者にする] をクリックしてスケジュールされた予測の所有権を取得すると、予測を実行できるようになります。これは、予測構成パネルで、または [データセットの予測] ウィンドウのアクションとして実行されます。
このセクションで説明されているアクションに必要なスペースの権限については、「共有スペースでの権限の管理」および「 管理スペースでの権限の管理」を参照してください。
データセットの適用に関する考慮事項
特徴量タイプを手動で変更した場合の影響
特徴量の特徴量タイプを手動で変更し、結果のモデルを展開すると、そのモデルで実行された予測で使用される適用データセット内の特徴量に、特徴量タイプのオーバーライドが適用されます。
要件と権限
ML 展開と予測を操作するための権限の要件については、「ML 予測の作業」を参照してください。
新しい予測の作成
[展開の概要] パネルと [データセットの予測] パネルの両方から新しい予測構成を作成できます。
次の手順を実行します。
-
カタログから ML 展開を開きます。
-
右下の [予測を作成] をクリックします。
-
[予測構成] パネルで、[データを適用] を展開し、[適用データセットを選択] をクリックします。
-
予測を生成するデータセットを選択します。データセットには、モデル スキーマと同じ特徴量とデータ タイプが必要です。
データセットは、Analytics アクティビティ センターの [作成] ページからアップロードできます。予測データセットの選択ページから、新しいデータセットを直接カタログにアップロードすることもできます。このデータセットは、予測に使用する適用データセットとして自動的に選択されます。実行するには、[適用データセットを追加] をクリックし、アップロードするファイルを選択します。
-
[予測データセット] で、[予測データセットに名前を付ける] をクリックします。
-
名前を入力 (または既定の名前を承認) します。
Qlik AutoML は、予測データセットの動的なファイル命名をサポートしています。詳細については、「予測データセット ファイル名で変数を使用する」を参照してください。
-
生成されるデータセットの形式を選択します。既定は Parquet です。データセットは、CSV または QVD 形式で生成することもできます。
-
スペースを選択します。
-
[確認] をクリックします。
-
[予測オプション] で、生成する追加のデータセットを選択します。
-
エラー データセット: 適用データセットのレコードのエラーを含むデータセットを生成します。これにより、レコードが削除されたかどうか、またその理由を知ることができます。
-
SHAP: 各レコードに SHAP 値を含むデータセットを生成します。データセットには、モデルの各特徴量に index と <feature>_SHAP の列があります。
情報メモこのオプションは、多項分類モデルからの予測には使用できません。これらのモデルの場合は、代わりに [座標 SHAP] オプションを使用できます。 -
座標 SHAP: 各レコードに SHAP 値を含むデータセットを生成します。これにより、SHAP データセットと同じ値が得られますが、編成方法が異なります。データセットには、index、automl_feature、SHAP_value の列があります。追加の列 Predicted_class は、多項分類モデルからの予測に含まれています。
-
-
index 列を自動生成するか、適用データセットの既存の列を使用するかを選択します。
-
スケジュールに従って予測を実行することもできます。[予測スケジュール] で [スケジュールを作成] をクリックし、表示されるダイアログで設定を調整します。詳細については、「スケジューリング予測」を参照してください。
-
[保存して閉じる] ボタンをクリックして予測構成を保存し、予測を実行せずに [データセットの予測] パネルに戻ります。スケジュールに従って予測を実行するだけの場合は、このオプションをお勧めします。
または、[保存して今すぐ予測] をクリックして、予測構成を保存し、予測を手動で実行します。
[最終ステータス] が「成功」と表示されたら、予測は終了です。
-
カタログに移動して、生成されたデータセットを確認します。
予測構成の編集
[データセットの予測] パネルから、既存の予測構成を編集できます。
次の手順を実行します。
-
[データセットの予測] パネルで、編集する予測構成の [...] をクリックします。
-
[アクション] メニューから、[予測構成を編集] を選択します。
-
[予測構成] パネルで、次のセクションを編集できます。
-
データを適用: 適用データセットを変更できます。
-
予測データセット: 予測データセットの名前とスペースを変更できます。
-
予測オプション: 生成される追加のデータセットの選択を変更できます。
-
予測スケジュール: 必要に応じて、予測を実行するスケジュールを設定できます。詳細については、「スケジューリング予測」を参照してください。
-
-
[保存して閉じる] ボタンをクリックして予測構成を保存し、予測を実行せずに [データセットの予測] パネルに戻ります。
または、[保存して今すぐ予測] をクリックして、予測構成を保存し、予測を手動で実行します。
[最終ステータス] が「成功」と表示されたら、予測は終了です。
予測の実行
[データセットの予測] パネルから、既存の予測構成の予測を実行できます。 または、カスタマイズ可能なスケジュールに従って予測を実行することもできます。ニーズに合わせて、予測の手動実行とスケジュール実行を組み合わせることができます。
予測を手動で実行する
[データセットの予測] パネルのコンテキスト メニューからオプションを選択することで、予測構成の実行を直接開始できます。
ユーザーが予測を手動で実行するには、そのユーザーがアクションのアクセス要件を満たしている必要があります。「予測構成の所有権」を参照してください。
次の手順を実行します。
-
[データセットの予測] パネルで、予測を実行する予測構成の [...] をクリックします。
-
[アクション] メニューから [今すぐ予測を実行] を選択して、予測の生成を開始します。
[最終ステータス] が「成功」と表示されたら、予測は終了です。
スケジューリング予測
スケジュールに従って自動的に実行されるように、予測を設定できます。作成する予測構成ごとに 1 つのスケジュールを作成できます。予測構成を作成または編集するときに、[予測スケジュール] メニューにアクセスします。
スケジュールされた予測を正常に実行するには、予測構成の所有者がいくつかの権限の要件を満たしている必要があります。要件を満たしていない場合、予測は実行できません。詳細については、「予測構成の所有権」を参照してください。
[予測スケジュール] ダイアログでは、スケジュールに次のパラメーターを指定できます。
-
予測を実行: 実行する予測の一般的なスケジュールを調整します (毎日、毎週、毎月)。選択した内容に応じて、間隔、曜日、日付を設定します。
-
時間: 予測の実行を開始する時間を構成します。
時間単位でスケジュールする場合 (毎日または毎週の予測)、予測を実行する開始時間と終了時間を指定することもできます。
-
開始日: 予測スケジュールが有効になる日付を設定します。
-
終了日: スケジュールで予測の実行を停止する日付を設定します。デフォルトでは、スケジュールは無期限で実行するように設定されていますが、スケジュールの終了日を指定できます。
-
適用データセットが変更された場合にのみ実行: 最後の予測が実行されてから適用データセットに変更がない場合、スケジュールされた予測は実行されません。データの変更に関係なく、スケジュールされた予測を常に実行する場合は、この設定をオフに切り替えることができます。
予測構成の削除
[データセットの予測] パネルから、既存の予測構成を削除できます。
次の手順を実行します。
-
[データセットの予測] パネルで、削除する予測構成の [...] をクリックします。
-
[アクション] メニューから、[予測構成を削除] を選択します。
-
[削除] をクリックして確定します。
予測ジョブの管理
テナント管理者は、Administration アクティビティ センターから予測ジョブを停止またはキャンセルできます。詳細については、「Qlik AutoML の管理」を参照してください。
通知の構成
ML 展開から予測が作成されると、通知を受け取ることができます。詳細については、「AutoML の通知の構成Qlik 」を参照してください。
データ ドリフトと予測イベントの詳細の表示
予測を実行した後、 [データ ドリフトの監視] パネルに切り替えると、次の詳細が表示されます。
-
適用データセット内の各特徴量のデータ ドリフトのレベル。適用データセットとトレーニング データセットの間で比較が実行されます。
-
予測イベントの詳細 (成功または失敗、生成された予測の数など)。
詳細については、「展開されたモデルのパフォーマンスと使用状況の監視」を参照してください。