メイン コンテンツをスキップする 補完的コンテンツへスキップ

ジョブタスクを作成

ジョブタスクとは、Talend Studioから公開されたジョブアーティファクトを含んでいる実行可能な統合プロセスのことです。

このジョブアーティファクトのコンテキストがTalend Studioで定義済みの場合は、このジョブアーティファクトのデフォルトコンテキストが自動的に公開されます。これらのコンテキストをTalend Studioで定義する際に推奨されるルールについては、コンテキストと変数を使用をご覧ください。

セキュリティ上の理由により、このコンテキスト設定の値はエクスポートされたファイルでクリアされます。Talend Management Consoleでコンテキスト値を再入力する必要があります。

始める前に

  • タスクが存在するワークスペースで[Author] (作成者)権限を持っており、ジョブを作成および編集できること。

    [Author] (作成者)権限は、タスクの作成時や編集時に[Artifact] (アーティファクト)ステップと[Parameters] (パラメーター)ステップを設定できます。

  • タスクが存在するワークスペースで[Execute] (実行)権限を持っており、実行の設定やスケジュール(エンジン、ログレベル、実行タイムアウトの設定など)を管理できること。

    [Execute] (実行)権限があれば、タスクの作成時や編集時に[Processing] (処理)ステップと[Schedule] (スケジュール)ステップを設定できます。

手順

  1. [Management] (管理)ページを開きます。
  2. [Tasks] (タスク)タブに移動します。
  3. ページの上部にあるファセット検索を使って環境とワークスペースを選択します。
  4. [Add task] (タスクを追加)をクリックします。
  5. [Artifact] (アーティファクト)ステップで、[Job] (ジョブ)アーティファクトタイプを選択します。
  6. ドロップダウンリストから実行するアーティファクトを選択します。
    アーティファクトの詳細と説明が表示されます。
  7. タスクで使用するアーティファクトのバージョンを選択します。

    アーティファクトの新しいバージョンが公開されるたびにタスクを自動アップデートする場合は、[Always use the latest available artifact version] (アーティファクトの最新バージョンを常に使用)を選択します。必要であれば、特定のバージョンを選択して手動でアップデートすることもできます。

    情報メモ注: このオプションによって、Talend Studio[Update corresponding job task] (対応するジョブタスクをアップデート)オプションが上書きされます。
    アーティファクトの詳細と説明は自動的に更新されます。
  8. オプション: [Override parameter values with artifact defaults] (パラメーター値をアーティファクトのデフォルトで上書き)チェックボックスをオンにします。
    このオプションは、[Artifact version] (アーティファクトのバージョン)フィールドで[Always use the latest available artifact version] (アーティファクトの最新バージョンを常に使用)を選択した場合のみ利用できます。このオプションを選択すると、新しいバージョンのアーティファクトが公開されるたびに、タスクで定義されたパラメーターがデフォルトのアーティファクトパラメーターによって置き換えられます。
  9. タスクのワークスペースを選択します。
  10. 新しいタスクに名前を付けます。
    デフォルトでは、作成元であるアーティファクトの名前がタスク名になります。
    情報メモ注: ワークスペース内のタスクには一意名が必要です。
  11. オプション: タグをタスクに追加します。
    1. 既存のタグをドロップダウンリストから選択します。
    2. 名前を入力し、ドロップダウンリストでクリックして、新しいタグを作成します。
  12. [Continue] (続行)をクリックします。
  13. [Parameters] (パラメーター)ステップで、ジョブのパラメーターに値を入力します。
    各パラメーターの説明は、そのフィールドの下に表示されます。
    このステップで[Show order as in Studio] (Studioと同じように順序を表示)の切り替えが無効になっている場合、値を設定できるのはTalend Studioparameter_プレフィックスを使って定義したパラメーターのみです。
    情報メモ注: 値が特殊文字として解釈される場合(\tなど)は、\ではなく\\を使います。

    Talend Management Consoleで表示される場合、パラメーター名の各単語の最初の文字は大文字に、アンダースコア(_)は空白にそれぞれ自動的に変更されます。たとえばcity_nameCity Nameとなります。

    つまり、プログラムでパラメーター名を使用する必要がある場合(APIリクエストなど)は、表示名ではなくTalend Studioの名前を使用してください。

  14. オプション: [Advanced parameters] (詳細パラメーター)セクションで、Talend Studioでプレフィックスなしで定義したパラメーター、およびジョブで定義されていないconnection_パラメーターに値を入力します。 このセクションは、[Show order as in Studio] (Studioと同じように順序を表示)の切り替えが無効になっている場合に利用できます。無効になっていない場合、パラメーターはすべて[Parameters] (パラメーター)ステップにあります。
    情報メモ注: 値が特殊文字として解釈される場合(\tなど)は、\ではなく\\を使います。
  15. オプション: [Connection] (接続)ステップで、ドロップダウンリストから適切な接続を選択します。
    また、アーティファクトで既に定義されているパラメーターに基づいて新しい接続を作成することもできます。
  16. オプション: [Resources] (リソース)ステップで、タスクに使用する適切なリソースを選択します。
  17. [Processing] (処理)ステップで、[Engine] (エンジン)ドロップダウンリストからタスクを実行するエンジンかエンジンクラスターを選択します。
    • クラウド
    • Cloud Exclusive
    • Remote Engine
    • Remote Engineクラスター
  18. オプション: 実行プロファイルを選択します。
    タスク実行のJVMパラメーターは、選択したRemote Engineやクラスターのために以前作成した実行プロファイルを選択して設定できます。

    Remote Engineまたはクラスターを使用している場合、この機能はRemote Engine2.9.1以降でサポートされています。

  19. ログレベルを設定します。ログには5つのレベルを含めることができますが、そのすべてを独立したオプションとして利用できるわけではありません。
    • ドロップダウンリストに表示され、すぐに選択できるログレベルは、[Info] (情報)[Warning] (警告)[Error] (エラー)の3つです。
    • リストにはない[Debug] (デバッグ)というレベルは、失敗したタスクをデバッグ実行として手動で開始する時に自動的に使用されます。詳細は、ジョブタスクをデバッグをご覧ください。
    • [Fatal] (致命的)レベルは、単独のオプションとしては利用できませんが、他のどのログレベルにも含まれます。
    • レベルは重複することもあります。
      • [Debug] (デバッグ)は最も低いレベルです。

        デバッグ実行ではすべてのログが含まれます。低いものから高いものに並べると、[Debug] (デバッグ)[Info] (情報)[Warning] (警告)[Error] (エラー)[Fatal] (致命的)となります。

      • [Info] (情報)には[Info] (情報)[Warning] (警告)[Error] (エラー)[Fatal] (致命的)のログが含まれますが、[Debug] (デバッグ)のログは除外されます。
      • [Error] (エラー)は、すぐに選択できる3つのレベルの中で最も高いものです。このレベルには、[Error] (エラー)[Fatal] (致命的)のみが含まれます。

        デフォルトでは、[Fatal] (致命的)エラーが[Error] (エラー)ログに表示されます。Talend Management Console[Fatal] (致命的)致命的なログとして明示的に表示するためには、<RemoteEngineInstallationDirectory>/etc/org.talend.ipaas.rt.jobserver.client.cfgファイルにjob.log.fatal.levelパラメーターが存在し、その値がtrueになっていることを確認します。

    • 本番環境で推奨されるログレベルです。

      データ損失や処理の遅れにつながる可能性があるログ生成プロセスの過負荷を避けるため、本番環境にデプロイされたジョブではログレベルを[Warning] (警告)に設定します。このレベルには[Warning] (警告)[Error] (エラー)[Fatal] (致命的)が含まれます。

    • [Off] (オフ)を選択すると、エンジン側ではジョブ実行ログが一切生成されません。タスク実行の要約ログのみが生成され、Talend Management Consoleに送信されます。これらのログは、タスク実行の要約(タスクの開始日時、終了日時、成功または失敗のステータスなど)が含まれています。
      情報メモヒント: 標準出力(stdout)と標準エラー(stderr)の情報は、エンジンのJobServerディレクトリーにあるstdOutErr_.logファイルに引き続き書き込むことができますが、Talend Management Consoleには送信されません。
  20. オプション: [Allow parallel run of this task] (このタスクの並列実行を許可)オプションを選択すると、Cloud Engine、Cloud Exclusive、Remote Engine、クラスターを使用する時にタスクを並列実行できるようになります。

    Remote Engineを使って同一のタスクを同時に実行する場合、この機能のサポートはRemote Engine v2.12.0以降です。

    デフォルトでは、1つのRemote Engineで3つの異なるタスクか同一のタスクを並列実行できます。関連設定の詳細は、1台のRemote Engineでタスクを並列実行をご覧ください。

    このオプションを無効にする前に、タスクを停止するか、実行の終了を待ちます。このいずれかの操作を行わない限り、並列実行は許可されたままとなります。

  21. オプション: Remote Engineやクラスターを選択した場合は、[Run as impersonated user] (実行ユーザーとして実行)フィールドにユーザー名を入力すれば別のユーザーとしてジョブを実行できます。
    この機能は、Unix (または同様の)環境にRemote Engineがインストールされている場合のみサポートされます。
    実行ユーザーの詳細は、Talend Remote Engineの実行ユーザー化を設定をご覧ください。
  22. オプション: [Custom[ (カスタム)を選択して値を入力し、タスク実行のタイムアウトを設定します。

    デフォルト値は5分で、最小値は1です。

  23. オプション: [Schedule] (スケジュール)ステップで実行間隔を(そして必要であればトリガーのタイムアウトも)選択します。

    1つまたは複数のトリガーを追加してタスクをスケジュールすることも、トリガーなしでタスクを手動で開始することもできます。

    デフォルトでは、トリガーのタイムアウト値はタスクのタイムアウト値と同じです。

    タスクのタイムアウトはトリガーのタイムアウトによってオーバーライドされます。

    詳細は、ジョブタスクをスケジューリングをご覧ください。
  24. [Save and close] (保存して閉じる)をクリックします。

タスクの結果

これで、Talend Management Consoleでタスクを実行する準備ができます。

情報メモ注:

指数関数的なバックオフ再試行パターンを採用することで、1回目と2回目の再試行が高速化(最初の失敗からそれぞれ1分後と3分後)されるだけでなく、ピーク時の負荷急増の際にグローバルな動作が向上しました。

たとえば既に実行中のタスクを実行しようとすると、その実行は失敗します。 Talend Management Consoleは実行間隔を長くしながら再試行するので、最初の再試行は1分後、2回目は2分後、その後は4分後と8分後に行われます。

4回目の試行が失敗すると、Exceeded the limit of deployment attempts: another instance of the same task was running on the engine at same timeというエラーメッセージが表示されます。その場合は、後でタスクを実行し直してみてください。

トラブルシューティング: タスク実行スケジュールの頻度が高すぎると、異なる2つのCloud EngineやRemote Engineで同じタスクが並列実行されてしまうことがあります。この問題を回避するためには、Cloud Engineが1つのみ割り当てられた環境でタスクを実行するか、Remote Engineでタスクをスケジュール設定してください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。