メイン コンテンツをスキップする 補完的コンテンツへスキップ

日付特徴量エンジニアリング

Qlik Predict は、日付と時刻の情報が含まれていると識別された、日付特徴量タイプの該当する列から自動設計特徴量を生成します。自動設計された日付特徴量と派生元の親特徴量には、自動設計 アイコンが表示されます。

Qlik Predict で使用するために選択したトレーニング データセットを Qlik Cloud Analytics がプロファイリングすると、特定のデータ タイプが日付特徴量タイプにリンクされます。これには、次のデータ タイプが含まれます。

  • Date

  • 日付/時間

  • 時間

  • タイムスタンプ

プロファイリング中にこれらのデータ タイプのいずれかが割り当てられた特徴量には、日付特徴量タイプが付与されます。データ 項目用に表示できる利用可能なプロファイル統計に関する情報については、「リスト ビュー」を参照してください。

可能な場合、Qlik Predict は日付特徴量タイプが付与された該当する親特徴量から生成できる自動設計の日付特徴量のリストを表示します。自動設計の日付特徴量は、デフォルトで実験に含まれます。含めることを選択した場合は、実験の v1 の後に新しい特徴量が生成されます。

情報メモ2023 年 8 月 29 日よりも前にトレーニングしたモデルに日付またはタイムスタンプを含んだ特徴量がある場合は、そのモデルの再トレーニングを推奨します。

自動設計の日付特徴量には、数値の特徴量タイプがあります。これらはデフォルトで実験に含まれますが、オプションです。実験のトレーニングを開始する前、または次の実験バージョンを構成する際に、それらの一部、またはすべてを削除することができます。自動設計の日付特徴量を含める場合、元の親日付特徴量は実験から削除されます。

代わりに、親となる日付特徴量をカテゴリ特徴量または数値特徴量として含めることができます。これを実行すると、自動設計の日付特徴量は使用できなくなります。ほとんどの場合、機械学習モデルの性能が改善されるため、実験には利用可能な自動設計特徴量の使用を推奨します。ただし、ある列が日付特徴量として識別されているにもかかわらず、その列をカテゴリまたは数値として扱う必要がある場合があります。このような場合は、手動で特徴量タイプを変更できます。

自動設計の日付特徴量は、Qlik Cloud サブスクリプションで指定されている Qlik Predict データセット サイズ (トレーニング データセットと適用データセットの最大セル カウント) にはカウントされません。元の日付列セルのみがカウントされます。

親日付特徴量「Invoice Date」から生成できる自動設計特徴量を表示するスキーマ ビュー。各特徴量の [データ タイプ] と [特徴量タイプ] における相違に注意してください。

自動設計特徴量により生成できる可能性のある日付特徴量として識別された親特徴量を表示している、実験トレーニングのスキーマ ビュー。

実験ターゲットとしての日付特徴量の使用

まれに、日付と時刻の情報をともなう特徴量を実験のターゲットとして使用する場合は、列の特徴量タイプが日付からカテゴリ別に切り替わり、自動設計の日付特徴量は削除されます。別のターゲットを選択し、後で日付と時刻の特徴量を標準の特徴量として追加する場合は、必要に応じて日付特徴量タイプに手動で戻す必要があります。特徴量を日付特徴量タイプに戻すと、自動設計の日付特徴量が再度生成されます。

特徴量タイプの変更方法に関する情報については、「特徴量タイプの変更」を参照してください。

利用可能な自動設計の日付特徴量

データセットの列から自動設計の日付特徴量を生成する際、Qlik Predict は各日付と日時値の特定のコンポーネントを抽出して計算し、各コンポーネントをそれぞれの列に分離します。 以下のテーブルは、Qlik Predict によって生成される自動設計特徴量をリストしています。

日付と時刻の特徴量から派生する自動設計特徴量のリスト
自動設計特徴量 データ型 特徴量タイプ 説明
YEAR Integer 数値 ソースの日付またはタイムスタンプから直接解析された年項目。
MONTH Integer 数値 ソースの日付またはタイムスタンプから直接解析された月項目。
DAY Integer 数値 ソースの日付またはタイムスタンプから直接解析された日項目。
HOUR 整数 数値 ソースのタイムスタンプから直接解析された時項目。
MINUTE Integer 数値 ソースのタイムスタンプから直接解析された分項目。
SECOND Integer 数値 ソースのタイムスタンプから直接解析された秒項目。
DAYOFWEEK Integer 数値 ソースの年月日から計算された曜日。
WEEK Integer 数値 ソースの年月日から計算された週番号。

新しく生成された各特徴量に対して、該当する自動設計特徴量により元の列名がサフィックスとして追加されます

実験構成ペイン内の自動設計の日付特徴量

自動設計特徴量を表示している、実験構成パネル内の特徴量セクション。

自動設計された日付特徴量と時系列モデル

時系列実験の日付インデックス列を選択すると、この列には日付特徴量タイプが使用されます。ただし、時系列モデルでは日付特徴量エンジニアリングはサポートされていません。自動エンジニアリングされた日付特徴量は、列から派生できません。

時系列モデルの詳細については、「時系列実験の作業」および「多変量時系列予測の作業」を参照してください。

予測内の自動設計の日付特徴量

予測の実行時に日付特徴量を使用する方法については、「予測における日付特徴量の取り扱い」を参照してください。

予測内の自動設計の日付特徴量

トレーニング データセットを使用してモデルを作成すると、自動設計の日付特徴量が生成されます。モデルは、新しいデータ (適用データセット) で予測を作成するために ML 展開として展開され、使用されます。

予測を作成するために自動設計の日付特徴量でトレーニングされたモデルを展開する場合、生成中の予測にある適用データには自動設計の日付特徴量を含める必要はありません。Qlik Predict は、予測開始前に適用データ向けの自動設計特徴量を生成します。ただし、適用データには親日付特徴量が含まれている必要があり、列は日付、日時、タイムスタンプ、または時刻データ タイプのある列としてプロファイルされている必要があります。

SHAP と適用データを含む ML 展開によって作成された予測データセットには、自動設計の日付特徴量が含まれます。

リアルタイム予測内の自動設計の日付特徴量

Machine Learning API のリアルタイム予測エンドポイントが日付とタイムスタンプの項目を処理できるようにするには、エンドポイントに送信する JSON ペイロードが以下の要件に準拠している必要があります。

  • 日付と日時の値は、ISO 8601 規格に準拠した書式の文字列である必要があります。例:

    • 2020-01-14

    • 2020-01-14T00:00:00.000Z

  • 親日付 (日付部分の派生元となった特徴量) は、その全体を含める必要があります。たとえば、モデルでは Year (年) の特徴量のみを使用している場合でも、日付は ISO 8601 準拠の形式で指定する必要があります。

  • 各列内のデータは同じタイム ゾーンである必要があります。

情報メモモデルのトレーニングに使用するデータは、これらの要件に準拠する必要はありません。
情報メモ

リアルタイム予測 API は非推奨となり、Machine Learning API のリアルタイム予測エンドポイントに置き換えられました。機能自体が廃止されるわけではありません。今後のリアルタイム予測では、Machine Learning API のリアルタイム予測エンドポイントを使用します。リアルタイム予測 API から Machine Learning API への移行に関するヘルプについては、「Qlik Cloud 開発者ポータルの移行ガイド」を参照してください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。