メイン コンテンツをスキップする 補完的コンテンツへスキップ

Dates プロセッサー

日付に関連する操作を実行します。

Dates プロセッサーを使用すると、日付、時刻、タイムスタンプに関連するフィールドにさまざまな関数を適用できます。利用可能な関数を使用して、日付を計算、クレンジング、変更、または変換できます。

使用方法

Dates プロセッサーは、1 つの入力フローを必要とし、1 つの出力フローのみを生成できます。

プロパティ

日付に基づいて動作するように構成するプロパティ。

情報メモこのセクションにリストされているプロパティは、このプロセッサーのほとんどの関数の既定プロパティです。選択した関数によっては他のプロパティの定義が必要となる場合もあります。
設定
プロパティ 設定
関数名
  • タイムスタンプに変換: リストから選択するか手動で指定できる形式を使用して、文字列をタイムスタンプとして解釈します。入力形式として [自動] を選択した場合、関数はもっとも一般的な形式セットから形式を検出しようとします。タイムスタンプとして解釈できない場合は、Null に設定されます。

  • 日付に変換: リストから選択するか手動で指定できる形式を使用して、文字列を日付として解釈します。入力形式として [自動] を選択した場合、関数はもっとも一般的な形式セットから形式を検出しようとします。日付として解釈できない場合は、Null に設定されます。

  • 時間に変換: リストから選択するか手動で指定できる形式を使用して、文字列を時間として解釈します。入力形式として [自動] を選択した場合、関数はもっとも一般的な形式セットから形式を検出しようとします。時間として解釈できない場合は、Null に設定されます。

  • 部分からタイムスタンプを作成: 他のフィールドの数値部分を連結して新しいタイムスタンプ フィールドを作成します。

  • 部分から日付を作成: 他のフィールドの数値部分を連結して新しい日付フィールドを作成します。

  • 部分から時間を作成: 他のフィールドの数値部分を連結して新しい時間フィールドを作成します。

  • 日付の書式設定: 日付フィールドで使用する日付形式を変更します。

  • 日付の差を計算: 指定された時間部分単位について、フィールド内の日付と選択した日付の間の時間を計算します。計算は、まず日付を指定した日付または時刻の部分まで切り捨て、それらの差を整数として返します。

  • 期間を追加: 日付に特定の時間を追加します。

  • 日付を比較: このフィールドを別のフィールドまたは定数と比較します

  • 日付部分を抽出: 年、月、四半期、日、時間、分、秒などのフィールドを作成します。

  • 日付を切り捨て: 日付の一部を削除します。

[Fields to process] (処理するフィールド)

ファンクションを適用するフィールドをリストから選択します。

ヒント メモ同じ関数を複数のフィールドに一度に適用する場合は、ダイアログを開く。 をクリックしますダイアログ アイコンを開くと、複数のフィールドを選択できるツリー ビューが開きます。
新しい項目を作成 関数を適用した後に新しいフィールドを作成するには、このオプションを有効にします。このオプションを有効にしない場合は、既存のフィールドが保持および変更されます。
新しい項目の名前を変更 新規作成したフィールドにカスタム名を付けます。

プロセッサーの名前を変更したり、説明を編集したりするには、 [プロパティ] パネルのプロセッサー名の横にある 編集 [編集] アイコンをクリックします。

日付の操作方法に関する追加情報

一般的に日付と呼ばれる日付関連の形式には、次の 3 つがあります。

  • 時間 (1 日の時間を表します)

  • 日付 (特定の日を示します)

  • タイムスタンプ (日付と時間から作成されます)

日付は、ほとんどの場合データ フロー内で自動的に識別されます。ただし、次の場合には、 Convert to 関数のいずれかを使用して、日付をシステムに適切に導入する必要があります。

  • 日付が自動的に識別できない形式でフォーマットされている。

  • データ フローを作成したユーザーのローカライゼーションに基づいて、データ フローと同じ日付形式で配置する必要がある。

  • 特定の形式で設定されていることを確認する必要がある。そうでない場合、認識されない日付形式は Null に設定されます。

制限事項

  • 場合によっては、エンジンの制限により日付形式が機能しないことがあります。この制限は、Format 関数と Convert to 関数にあてはまります。これは、元の入力フィールドを更新するときにのみ発生し、新しいフィールドが作成されるときには発生しません。

  • Excel などのネイティブに日付をサポートする形式から日付をロードする場合、エンジンの制限により日付形式を設定できないことがあります。

事前定義された日付形式

この表には、データ フローで事前定義されているさまざまな形式が一覧表示されていますが、手動で入力する場合は他の形式もサポートされます。手動で定義された形式の詳細については、「数値や日付形式の説明」を参照してください。

形式 タイプ
YYYY-MM-DD 日付 1999-03-22
YYYYMMDD 日付 19990322
M/D/YYYY 日付 3/22/1999
M/D/YY 日付 3/22/99
MM/DD/YY 日付 03/22/99
MMM D, YYYY 日付 Mar 22, 1999
MMMM D, YYYY 日付 March 22, 1999
YYYY-MM-DD hh:mm タイムスタンプ 1999-03-22 05:06
YYYY-MM-DD hh:mm:ss タイムスタンプ 1999-03-22 05:06:07
YYYY-MM-DDThh:mm タイムスタンプ 1999-03-22T05:06
YYYY-MM-DDThh:mm:ss タイムスタンプ 1999-03-22T05:06:07
M/D/YYYY hh:mm tt タイムスタンプ 3/22/1999 05:06 AM
M/D/YY hh:mm tt タイムスタンプ 3/22/99 05:06 AM
MM/DD/YY hh:mm tt タイムスタンプ 03/22/99 05:06 AM
M/D/YYYY hh:mm:ss tt タイムスタンプ 3/22/1999 05:06:07 AM
M/D/YY hh:mm:ss tt タイムスタンプ 3/22/99 05:06:07 AM
MM/DD/YY HH:mm:ss tt タイムスタンプ 03/22/99 05:06:07 AM
MMM D, YYYY h:mm:ss tt タイムスタンプ Mar 22, 1999 5:06:07 AM
WWWW, MMMM D, YYYY h:mm:ss tt タイムスタンプ Monday, March 22, 1999 5:06:07 AM
hh:mm 時間 05:06
hh:mm:ss 時間 05:06:07
hh:mm tt 時間 05:06 AM
hh:mm:ss tt 時間 05:06:07 AM

例: 日付の変換と操作

このシナリオでは、見込み客に関する情報を含むデータセットを準備し、どの見込み客が顧客になる可能性があるかを特定することを目的として ML 実験をトレーニングする方法を示します。利用可能な情報の中には、FirstContactDateTrialDate など、日付を含むフィールドがいくつかあります。

日付を含む、見込み客に関する情報を含むデータセット

最初のステップは、2 つの日付フィールドが共通の形式を使用していることを確認することです。FirstContactDate および TrialDateフィールドに Convert to date 関数を使用して、最初の Dates プロセッサーを使用します。2 つのフィールドは同じ D/MM/YYYY 形式を使用するようになりました。

2 番目の Dates プロセッサーで、 [日付の差を計算] を使用して、最初の問い合わせからトライアル開始までの日数を表示します。

その後、Fork プロセッサーを使用して結果データから最初の出力が生成され、2 番目のブランチでは 3 番目の Dates プロセッサーが使用されます。日付部分を抽出の関数を使用すると、FirstContactDate フィールドの年と月の情報のみを保持できるため、将来の ML 実験で読み取りや操作が容易になります。

集計操作の後、データ フローを実行してモデルをトレーニングできます。最終的なデータ フローは次のようになります。

日付が適切にフォーマットされたデータ フロー

例: 日付の差を計算する

この例でソースとして使用されるデータには、注文日と発送日を含む注文の参照が含まれています。

注文と発送日を含むデータセット

注文の発送に必要な時間を知るために、Dates プロセッサーを使用して注文から発送までの時間を計算できます。

プロセッサーのプロパティで、関数として [Calculate date difference (日付の差を計算)]、時間単位として [Day (日)] を選択します。処理するフィールドとして [Order Date (注文日)] を選択し、時間差を計算する他のフィールドとして [Ship Date (発送日)] を選択します。作成する新しいフィールドの名前を入力し、ターゲットを設定してデータ フローを実行します。

時間差を計算する日付プロセッサー

このデータ フローのターゲットには、分析に使用できる注文の発送にかかった日数を示す新しい列が含まれます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。