予測における日付特徴量の取り扱い
自動生成された日付特徴量でトレーニングされた ML 展開から予測を実行する場合、適用データにおける日付や時刻の指定方法には要件があります。これらの要件と考慮事項は、バッチ予測を実行しているか、リアルタイム予測を実行しているか、または Qlik Predict 分析コネクタを使用しているかに応じて若干異なります。
自動日付特徴量エンジニアリング
自動特徴量エンジニアリングは、モデルのトレーニング中に ML 実験で実行されるデータの準備ステップです。このプロセスにより、トレーニング データ セットから新しい特徴量が作成され、モデルのトレーニングに使用されます。日付特徴量の列については、このプロセスは既定で自動的に実行されます。ユーザーは、日付特徴量エンジニアリングをオプト アウトできます。ただし、ほとんどの場合、この機能の利用が推奨されます。
詳細については、「日付特徴量エンジニアリング」を参照してください。
バッチ予測の要件
トレーニング データセットを使用してモデルを作成すると、自動設計の日付特徴量が生成されます。モデルは、新しいデータ (バッチ予測では適用データセット) で予測を作成するために ML 展開として展開され、使用されます。
予測を作成するために自動設計の日付特徴量でトレーニングされたモデルを展開する場合、生成中の予測にある適用データには自動設計の日付特徴量を含める必要はありません。Qlik Predict は、予測開始前に適用データ向けの自動設計特徴量を生成します。ただし、適用データセットには親日付特徴量 (日付の構成要素が抽出された元の列) が含まれている必要があり、列のデータ タイプは日付、日時、タイムスタンプ、または時刻である必要があります。
SHAP と適用データを含む ML 展開によって作成された予測データセットには、自動設計の日付特徴量が含まれます。
リアルタイム予測およびコネクタ ベース予測の要件
リアルタイム予測および Qlik Predict 分析コネクタからの予測を実行する場合、Qlik Predict に提供する適用データの日付特徴量には要件があります。これらの種類の予測では、適用データは適用データセットとしてではなく、小さな JSON ペイロードで指定されます。リアルタイム予測およびコネクタ ベース予測の両方で、JSON ペイロードは Machine Learning API のリアルタイム予測エンドポイントに送信されます。
Machine Learning API のリアルタイム予測エンドポイントが日付とタイムスタンプの項目を処理できるようにするには、エンドポイントに送信する JSON ペイロードが以下の要件に準拠している必要があります。
-
日付と日時の値は、ISO 8601 規格に準拠した書式の文字列である必要があります。例:
-
2020-01-14
-
2020-01-14T00:00:00.000Z
-
-
親日付 (日付部分の派生元となった特徴量) は、その全体を含める必要があります。たとえば、モデルでは Year (年) の特徴量のみを使用している場合でも、日付は ISO 8601 準拠の形式で指定する必要があります。
-
各列内のデータは同じタイム ゾーンである必要があります。
上記の要件は次のように適用されます。
-
日付特徴量エンジニアリングでトレーニングされた特徴量にのみ適用されます。特徴量タイプが手動でカテゴリ特徴量タイプに変更された場合、これらの要件は適用されません。特徴量タイプがカテゴリに変更されている場合は、適用データにおいて、トレーニング時に使用された元の日付形式で列を提供してください。
-
時系列モデルには適用されません。
リアルタイム予測 API は非推奨となり、Machine Learning API のリアルタイム予測エンドポイントに置き換えられました。機能自体が廃止されるわけではありません。今後のリアルタイム予測では、Machine Learning API のリアルタイム予測エンドポイントを使用します。リアルタイム予測 API から Machine Learning API への移行に関するヘルプについては、「Qlik Cloud 開発者ポータルの移行ガイド」を参照してください。