メイン コンテンツをスキップする 補完的コンテンツへスキップ

データの変化の監視

最初にプロファイリングしたアドレスデータのクオリティを追跡するには、Talend Studioを使って、カラム分析で作成した進展レポートを起動するジョブを生成します。次に、このジョブをTalend Administration Centerにデプロイして、たとえばこのジョブを毎月起動するようにスケジューリングできます。

こうすることで、Talend Studioで生成されるレポートはTalend Administration Centerからリモートで起動できるようになります。

データの変化を監視するための前提条件

Procedure

  1. Talend Administration Center Webアプリケーションでデータクオリティプロジェクト(dq_projなど)を作成します。

    Talend Administration Center Webアプリケーションでプロジェクトを作成する方法は、プロジェクトを追加をご覧ください。

    情報メモNote: プロジェクトの作成または管理に必要な権限がない場合、Webアプリケーションの管理者にお問い合わせください。
  2. Talend Studioから上記のプロジェクトを保存するリモートSVNリポジトリーへの接続を確立します。

    リモートリポジトリーへの接続方法については、Talend Studioからリモートプロジェクトにアクセスをご覧ください。

  3. この新規接続と新規データクオリティプロジェクトを使ってTalend Studioを起動します。

レポートを起動するジョブを生成する

このセクションでは、カラム分析で作成したレポートを起動する既製ジョブを生成する方法を説明します。

Procedure

  1. Talend Studio Profiling パースペクティブで、[Report]ノードの下のprofile_customersレポートを右クリックし、[Generate jobs] (ジョブを生成) > [Launch a report] (レポートの起動)の順に選択します。

    これによってレポートを起動するジョブが生成され、Integrationパースペクティブでそのジョブが開きます。

    自動生成されたジョブの起動レポート。
    [Report filenames] (レポートファイル名)フィールドはレポートの技術的なパスを示し、[Output folder] (出力フォルダー)フィールドは、レポートファイルを保存する出力フォルダーのパスを示しています。
  2. F6を押して、Talend Studioからジョブを実行してテストします。

Results

Talend Studioのコンソールに、レポートのID、名前、実行時間などを含む、レポート情報が表示されます。

Talend Studioコンソールからのレポートの例。

実行タスクを作成してスケジューリングする

このセクションでは、Talend Studioで作成したレポート起動ジョブを実行するために、Talend Administration Centerで実行タスクを作成する方法を説明します。さらに、1か月に一度タスクを実行するトリガーを定義する方法についても説明します。

Procedure

  1. Talend Administration Center Web アプリケーションに接続します。
  2. Webアプリケーションの[Menu] (メニュー)ツリービューで、[Job Conductor] (ジョブコンダクター)を展開し、[Job Conductor] (ジョブコンダクター)をクリックして、実行タスクリストを表示します。
  3. [Job Conductor] (ジョブコンダクター)ページのツールバーで、[Add] (追加)をクリックし、[Execution task] (実行タスク)設定パネルの内容を消去します。
    [実行タスク]設定パネルの概要。
  4. この設定パネルで、次のように、レポート起動ジョブの実行に必要なパラメーターを設定します。
    1. [Label] (ラベル)フィールドに、タスク名を入力します。
    2. [Project] (プロジェクト)フィールドで、レポート起動ジョブを作成したデータクオリティプロジェクトを選択します。
    3. [Branch] (ブランチ)フィールドで、このプロジェクトのブランチとして、trunkを選択します。
    4. [Name] (名前)リストで、使用するレポート起動ジョブを選択します。
    5. [Version] (バージョン)リストで、起動するジョブのバージョンを選択し、[Context] (コンテキスト)フィールドで、実行するジョブのコンテキストを選択します。
    6. [Execution server] (実行サーバー)リストで、このタスクの実行に使用するサーバーを選択します。
  5. [Save] (保存)をクリックして、この実行タスクの設定を有効にします。

    新規タスクが[Job Conductor] (ジョブコンダクター)ページのデータクオリティプロジェクトの下に表示されます。

    新しいタスクが[ジョブコンダクター]ページに表示されます。
  6. タスクのリストから、追加したばかりのタスクを選択し、[Triggers] (トリガー)をクリックします。
  7. [Add trigger] (トリガーの追加) > [Add CRON trigger] (CRONトリガーの追加)の順にクリックします。
  8. [CRON Trigger] (CRONトリガー)設定パネルで、トリガーの名前を入力し、[Open UI configurer] (UI設定機能を開く)をクリックします。
  9. タスクを実行する時刻(時と分)および日付を選択し、[Apply modifications] (変更を適用)をクリックします。

    選択した日付がトリガー設定パネルに表示されます。

    実行タスクを作成してスケジュールする設定。

    このトリガーは、毎月1日の3:15PMに進展レポートが再生成されることを意味します。

  10. [Save] (保存)をクリックします。

サーバーにタスクをデプロイ

Procedure

  1. [Job Conductor] (ジョブコンダクター)ページで、タスクを選択し、ツールバーの[Generate] (生成)をクリックします。
  2. このタスクのステータスが、タスクリストで[Ready to send] (送信準備完了)になったら、タスクを再度選択し、ツールバーの[Deploy] (デプロイ)をクリックします。
  3. このタスクのステータスが、タスクリストで[Ready to run] (実行準備完了)になったら、タスクを再度選択し、ツールバーの[Run] (実行)をクリックします。

    このタスクにより、Talend Administration Center Webアプリケーションからレポート起動ジョブが毎月自動的に実行されます。進展レポートに表示されるカラム分析が実行され、その結果がデータクオリティデータマートに保存されます。レポートファイルはtDqReportRunの基本設定で定義した出力フォルダーに保存されます。

    この進展レポートを繰り返し生成すると、アドレスカラムの最初のプロファイリングからのデータの変化を追跡できます。レポートの線はデータが修正されると右上がりになり、データの正確さと一貫性が失われると右下がりになります。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。