Dates プロセッサー
日付に関連する操作を実行します。
Dates プロセッサーを使用すると、日付、時刻、タイムスタンプに関連するフィールドにさまざまな関数を適用できます。利用可能な関数を使用して、日付を計算、クレンジング、変更、または変換できます。
使用方法
Dates プロセッサーは、1 つの入力フローを必要とし、1 つの出力フローのみを生成できます。
プロパティ
日付に基づいて動作するように構成するプロパティ。
プロパティ | 設定 |
---|---|
関数名 |
|
[Fields to process] (処理するフィールド) |
ファンクションを適用するフィールドをリストから選択します。 ヒント メモ同じ関数を複数のフィールドに一度に適用する場合は、
![]() |
新しい項目を作成 | 関数を適用した後に新しいフィールドを作成するには、このオプションを有効にします。このオプションを有効にしない場合は、既存のフィールドが保持および変更されます。 |
新しい項目の名前を変更 | 新規作成したフィールドにカスタム名を付けます。 |
プロセッサーの名前を変更したり、説明を編集したりするには、 [プロパティ] パネルのプロセッサー名の横にある [編集] アイコンをクリックします。
日付の操作方法に関する追加情報
一般的に日付と呼ばれる日付関連の形式には、次の 3 つがあります。
-
時間 (1 日の時間を表します)
-
日付 (特定の日を示します)
-
タイムスタンプ (日付と時間から作成されます)
日付は、ほとんどの場合データ フロー内で自動的に識別されます。ただし、次の場合には、 Convert to 関数のいずれかを使用して、日付をシステムに適切に導入する必要があります。
-
日付が自動的に識別できない形式でフォーマットされている。
-
データ フローを作成したユーザーのローカライゼーションに基づいて、データ フローと同じ日付形式で配置する必要がある。
-
特定の形式で設定されていることを確認する必要がある。そうでない場合、認識されない日付形式は Null に設定されます。
制限事項
-
場合によっては、エンジンの制限により日付形式が機能しないことがあります。この制限は、Format 関数と Convert to 関数にあてはまります。これは、元の入力フィールドを更新するときにのみ発生し、新しいフィールドが作成されるときには発生しません。
-
Excel などのネイティブに日付をサポートする形式から日付をロードする場合、エンジンの制限により日付形式を設定できないことがあります。
事前定義された日付形式
この表には、データ フローで事前定義されているさまざまな形式が一覧表示されていますが、手動で入力する場合は他の形式もサポートされます。手動で定義された形式の詳細については、「数値や日付形式の説明」を参照してください。
形式 | タイプ | 例 |
---|---|---|
YYYY-MM-DD | 日付 | 1999-03-22 |
YYYYMMDD | 日付 | 19990322 |
M/D/YYYY | 日付 | 3/22/1999 |
M/D/YY | 日付 | 3/22/99 |
MM/DD/YY | 日付 | 03/22/99 |
MMM D, YYYY | 日付 | Mar 22, 1999 |
MMMM D, YYYY | 日付 | March 22, 1999 |
YYYY-MM-DD hh:mm | タイムスタンプ | 1999-03-22 05:06 |
YYYY-MM-DD hh:mm:ss | タイムスタンプ | 1999-03-22 05:06:07 |
YYYY-MM-DDThh:mm | タイムスタンプ | 1999-03-22T05:06 |
YYYY-MM-DDThh:mm:ss | タイムスタンプ | 1999-03-22T05:06:07 |
M/D/YYYY hh:mm tt | タイムスタンプ | 3/22/1999 05:06 AM |
M/D/YY hh:mm tt | タイムスタンプ | 3/22/99 05:06 AM |
MM/DD/YY hh:mm tt | タイムスタンプ | 03/22/99 05:06 AM |
M/D/YYYY hh:mm:ss tt | タイムスタンプ | 3/22/1999 05:06:07 AM |
M/D/YY hh:mm:ss tt | タイムスタンプ | 3/22/99 05:06:07 AM |
MM/DD/YY HH:mm:ss tt | タイムスタンプ | 03/22/99 05:06:07 AM |
MMM D, YYYY h:mm:ss tt | タイムスタンプ | Mar 22, 1999 5:06:07 AM |
WWWW, MMMM D, YYYY h:mm:ss tt | タイムスタンプ | Monday, March 22, 1999 5:06:07 AM |
hh:mm | 時間 | 05:06 |
hh:mm:ss | 時間 | 05:06:07 |
hh:mm tt | 時間 | 05:06 AM |
hh:mm:ss tt | 時間 | 05:06:07 AM |
例: 日付の変換と操作
このシナリオでは、見込み客に関する情報を含むデータセットを準備し、どの見込み客が顧客になる可能性があるかを特定することを目的として ML 実験をトレーニングする方法を示します。利用可能な情報の中には、FirstContactDate や TrialDate など、日付を含むフィールドがいくつかあります。
最初のステップは、2 つの日付フィールドが共通の形式を使用していることを確認することです。FirstContactDate および TrialDateフィールドに Convert to date 関数を使用して、最初の Dates プロセッサーを使用します。2 つのフィールドは同じ D/MM/YYYY 形式を使用するようになりました。
2 番目の Dates プロセッサーで、 [日付の差を計算] を使用して、最初の問い合わせからトライアル開始までの日数を表示します。
その後、Fork プロセッサーを使用して結果データから最初の出力が生成され、2 番目のブランチでは 3 番目の Dates プロセッサーが使用されます。日付部分を抽出の関数を使用すると、FirstContactDate フィールドの年と月の情報のみを保持できるため、将来の ML 実験で読み取りや操作が容易になります。
集計操作の後、データ フローを実行してモデルをトレーニングできます。最終的なデータ フローは次のようになります。
例: 日付の差を計算する
この例でソースとして使用されるデータには、注文日と発送日を含む注文の参照が含まれています。
注文の発送に必要な時間を知るために、Dates プロセッサーを使用して注文から発送までの時間を計算できます。
プロセッサーのプロパティで、関数として [Calculate date difference (日付の差を計算)]、時間単位として [Day (日)] を選択します。処理するフィールドとして [Order Date (注文日)] を選択し、時間差を計算する他のフィールドとして [Ship Date (発送日)] を選択します。作成する新しいフィールドの名前を入力し、ターゲットを設定してデータ フローを実行します。
このデータ フローのターゲットには、分析に使用できる注文の発送にかかった日数を示す新しい列が含まれます。