メイン コンテンツをスキップする 補完的コンテンツへスキップ

Talend StudioにおけるHadoopディストリビューションのダイナミックサポート(非推奨)

Availability-note非推奨
情報メモDeprecated: Talend8.0以降、ダイナミックディストリビューションと組み込みディストリビューションは非推奨となっています。Spark Universalは、ビッグデータプラットフォームでビッグデータジョブを実行するための標準です。詳細は、Spark Universalを使ってジョブを実行をご覧ください。

組み込みディストリビューションまたはダイナミックディストリビューション(Cloudera、Hortonworks、Amazon EMR、Azure Synapse、Databricks、Microsoft HDInsightなど)から移行する場合、Talendは、ビッグデータのディストリビューションとジョブでSpark Universalディストリビューションを有効にすることを強くお勧めします。

Talend Studioで、使用したいビッグデータプラットフォームのサポートがない場合は、このディストリビューションを追加し、Talend Studioで使用できるようにします。

このダイナミックサポート機能により、Talend Studioのリリース時にはまだリリースされていなかったClouderaやHortonworksのバージョンを使用する際の俊敏性と柔軟性が向上します。何回かクリックしてこのバージョンを追加するだけで準備は完了します。

最新のビッグデータプラットフォームをダイナミックに追加(ダイナミックディストリビューション) (非推奨)

Availability-noteDeprecated

Talend Studioの場合、使用したいビッグデータプラットフォームにサポートがない場合は、以下に説明する手順に従ってこのディストリビューションを追加し、Talend Studioで使用できるようにします。

最新バージョンのTalend Studioでは、この手順を使ってClouderaとHortonworksのディストリビューションのみ追加できます。この手順では、Clouderaを使用してダイナミックディストリビューションをTalend Studioに追加する方法を説明します。

このダイナミックサポート機能により、Talend Studioのリリース時にはまだリリースされていなかったClouderaやHortonworksのバージョンを使用する際の俊敏性と柔軟性が向上します。何回かクリックしてこのバージョンを追加するだけで準備は完了します。

この方法で追加されたダイナミックディストリビューションは一般的に、ユーザーのディストリビューションのTalend認証メジャーリリースのマイナーバージョンです。Talendはディストリビューションベンダーの互換性ステートメントに依拠して、Talend Studioとこれらのマイナーバージョンとの互換性を確認します。また、この方法でこれらのマイナーバージョンとTalend認証バージョンに基づいて生成できるユースケースに対する公式サポートを提供します。 Talend認定済みのディストリビューションバージョン、および認定済みバージョンと互換バージョンに関するTalendの一般的なサポートポリシーは、Talendジョブでサポートされているビッグデータプラットフォームディストリビューションのバージョンをご覧ください。
  • ディストリビューションのバージョンリストに、[Builtin] (組み込み)というラベルの付いたバージョンがいくつかあります。リリース時に、これらのバージョンがダイナミックディストリビューションメカニズムを使用してTalendによって追加され、Talend Studioと共に提供されました。これらはTalendによって認定され公式にサポートされているので、すぐに使用できます。
情報メモNote: Talendのディストリビューションについては、CDPダイナミックディストリビューションではなくCDP 7.xビルトインディストリビューションの使用をお勧めします。CDPダイナミックディストリビューションの場合、Talendは7.1.8までのバージョンをサポートしています。CDP 7.1.9 Private Cloud Baseと7.2 Public Cloudはサポートされていません。CDP 7.1.9 Private Cloud Baseを使用したい場合、Talendはユニバーサル機能の使用をお勧めします。詳細は、Spark Universalを使ってジョブを実行をご覧ください。

Procedure

  1. Integrationパースペクティブで、[File] (ファイル) > [Edit Project properties] (プロジェクトプロパティを編集)をクリックして[Project Settings] (プロジェクト設定)ダイアログボックスを開きます。
  2. [General] (一般) > [Dynamic distribution settings] (ダイナミックディストリビューションの設定)をクリックしてビューを開きます。
  3. [Distribution] (ディストリビューション)ドロップダウンリストから[Cloudera]を選択します。
  4. ダウンロードするダイナミックディストリビューションjarファイルを保存するローカルNexusリポジトリーを設定します。
    必須ではありませんが、このステップにより、他のユーザーまたは他のTalend Studioインスタンスが同じjarファイルをダウンロードする時間が大幅に短縮されます。
    1. ローカルNexusリポジトリー上にプロキシを設定し、このプロキシを専用のTalendプロキシであるhttps://talend-update.talend.com/nexus/content/groups/dynamicdistribution/にリンクします。
      このTalendプロキシへの接続に使用する認証情報は次のとおりです。
      • ユーザー名: studio-dl-client
      • パスワード: studio-dl-client

      ローカルプロキシを作成する時に、このローカルプロキシに固有の認証情報を定義する必要があります。Nexusプロキシの作成方法のサンプルは、NexusのドキュメンテーションからProxy settings (英語のみ)をご覧ください。

    2. [General] (一般) > [Artifact Proxy Setting] (アーティファクトプロキシ設定)をクリックしてビューを開き、[Override default setup] (デフォルトセットアップの上書き)チェックボックスをオンにして[Repository] (リポジトリー)フィールドを有効にします。
    3. [Repository] (リポジトリー)フィールドに、ローカルプロキシのURLと、このプロキシに定義した認証情報を入力します。
    4. [Check Connection] (接続をチェック)をクリックして接続ステータスを検証します。
  5. [Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューに戻り、[Dynamic distribution setup] (ダイナミックディストリビューションの設定)ボタンをクリックしてダイナミックディストリビューション設定ウィザードを開きます。
  6. [Create new dynamic configuration] (ダイナミック設定の新規作成)ラジオボタンを選択し、[Refresh] (最新の情報に更新)をクリックして接続先Clouderaリポジトリーで利用可能なClouderaバージョンを[Version] (バージョン)ドロップダウンリストに表示します。
  7. Talend Studioで使う設定の生成対象とするClouderaバージョンを選択します。
  8. [Finish] (終了)をクリックします。

    Talend Studioではこのディストリビューションの設定ファイルをClouderaリポジトリーから取得し始めます。この取得にはしばらく時間がかかることがあります。

    完了したら[Dynamic distribution setup] (ダイナミックディストリビューションの設定)ウィザードは自動的に閉じ、[Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューに戻ります。新しく生成された「ダイナミック」ディストリビューションは、[Version] (バージョン)リストに表示されます。

  9. 必要に応じてこのオペレーションを繰り返し、別のバージョンをさらに追加することもできます。または、[Apply and Close] (適用して閉じる)をクリックして[Project settings] (プロジェクト設定)ダイアログボックスを閉じます。

Results

この新しいバージョンは、Talend Studioと共に提供される組み込みディストリビューションと同様に使用できます。次の操作が可能です。
  • このダイナミックディストリビューションへの接続を[Repository] (リポジトリー)で設定し、Talendジョブでこの接続を再利用します。

  • このダイナミックディストリビューションをジョブで直接使用する。ジョブをビルドしてZip内に実行可能ファイルを生成し、実行可能ファイルをWindowsで実行する必要がある場合は、.batスクリプトを使用せず、.ps1スクリプトを使用します。

ジョブをエクスポートする場合は通常、[Repository] (リポジトリー)で定義した接続などの依存項目と共にエクスポートできますが、ダイナミックディストリビューションへの接続を同様にエクスポートすることはできません。詳細は、ダイナミックビッグデータプラットフォームディストリビューションの設定をエクスポートまたはインポートをご覧ください。

ダイナミックディストリビューション設定の編集(非推奨)

Availability-noteDeprecated

ダイナミックビッグデータプラットフォームディストリビューションがTalend Studioに追加されると、設定を容易に編集できるようになります。

カスタムJARファイルを必要とするカスタマイズされたディストリビューションを使用する必要がある場合や、ダイナミック設定をデバッグする必要がある場合に、これは特に有用です。

前述の内容から推察されるように、以下に説明する手順は、最新のビッグデータプラットフォームをダイナミックに追加(ダイナミックディストリビューション)に説明されている方法で追加されたビッグデータプラットフォームディストリビューションにのみ該当します。

Before you begin

ディストリビューションに関する知識が十分にあり、設定に施す変更の意味を理解できること。

Procedure

  1. Integrationパースペクティブで、[File] (ファイル) > [Edit project properties] (プロジェクトプロパティを編集)をクリックして[Project settings] (プロジェクト設定)ダイアログボックスを開きます。
  2. [General] (全般)ノードを展開し、[Dynamic distribution settings] (ダイナミックディストリビューションの設定)をクリックしてビューを開きます。
  3. [Dynamic distribution setup] (ダイナミックディストリビューションの設定)ボタンをクリックしてダイナミックディストリビューション設定ウィザードを開きます。
  4. [Edit an existing dynamic configuration] (既存のダイナミック設定を編集)ラジオボタンを選択し、編集する設定を[Version] (バージョン)ドロップダウンリストから選択します。
  5. [Next] (次へ)をクリックし、選択されているディストリビューションの設定モジュールグループのリストを開きます。
  6. Talend Studioによって生成されたディストリビューションと区別するために、カスタマイズするディストリビューションの新しい名前を[Distribution name] (ディストリビューション名)フィールドに入力します。
  7. 編集の必要なモジュールを選択し、その横にある[...]ボタンをクリックして、[Module Groups Wizard] (モジュールグループウィザード)を開きます。
  8. ディストリビューションの設定を変更するために、[Module Groups Wizard] (モジュールグループウィザード)[Add] (追加)ボタンと[Delete] (削除)ボタンを使用して、JARファイルを追加または削除します。
  9. 完了したら、[Finish] (終了)をクリックして変更を確定し、[Module Groups Wizard] (モジュールグループウィザード)を閉じます。
  10. [Finish] (終了)をもう一度クリックして[Dynamic distribution setup] (ダイナミックディストリビューションの設定)ウィザードを閉じます。

    このカスタムディストリビューションは、[Project settings] (プロジェクト設定)ダイアログボックスの[Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューの[Version] (バージョン)ドロップダウンリストに表示されます。

  11. [Apply] (適用)、次にOKをクリックして新しい設定を確定し、[Project settings] (プロジェクト設定)ダイアログボックスを閉じます。

Results

カスタムディストリビューションがTalend Studioで使用できるようになりました。

ダイナミックビッグデータプラットフォームディストリビューションの設定をエクスポートまたはインポート(非推奨)

Availability-noteDeprecated

ダイナミックビッグデータプラットフォームディストリビューションの設定は、それを使用するジョブでのエクスポートやインポートはできないものの、[Project settings] (プロジェクト設定)ダイアログボックスの[Dynamic distribution setup] (ダイナミックディストリビューションの設定)ビューを使うことでエクスポートやインポートが可能です。

前述の内容から推察されるように、以下に説明する手順は、新のビッグデータプラットフォームをダイナミックに追加する手順で説明されている方法で追加されたビッグデータプラットフォームディストリビューションにのみ該当します。

Procedure

  1. Integrationパースペクティブで、[File] (ファイル) > [Edit project properties] (プロジェクトプロパティを編集)をクリックして[Project settings] (プロジェクト設定)ダイアログボックスを開きます。
  2. [General] (全般)ノードを展開し、[Dynamic distribution settings] (ダイナミックディストリビューションの設定)をクリックしてビューを開きます。
  3. [Dynamic distribution setup] (ダイナミックディストリビューションの設定)ボタンをクリックしてダイナミックディストリビューション設定ウィザードを開きます。
    Option Description

    Edit an existing dynamic configuration (既存のダイナミック設定を編集)

    このラジオボタンを使用して、ダイナミックディストリビューションをエクスポートします。

    このラジオボタンを選択すると、[Version] (バージョン)リストが有効になります。

    次に、このリストからエクスポートするディストリビューションを選択し、[Next] (次へ)をクリックしてこのディストリビューションの詳細ビューを開きます。このビューで[Export configuration] (設定のエクスポート)ボタンをクリックして設定をJSONファイルにエクスポートします。

    Import dynamic configuration (ダイナミック設定のインポート)

    このラジオボタンを使用して、ダイナミックディストリビューションをインポートします。

    このラジオボタンを選択したら、有効になる[...]ボタンをクリックします。

    次に、インポートするダイナミックディストリビューションの設定情報を含むJSONファイルを参照します。

    このJSONファイルは、多くの場合、別のTalend Studioインスタンスからエクスポートされて使用されます。手動で作成したJSONファイルを使用する場合は、使用するJSONスキーマがエクスポートされたJSONファイルのスキーマと同じになっていることをご確認ください。

  4. [Finish] (終了)をもう一度クリックして[Dynamic distribution setup] (ダイナミックディストリビューションの設定)ウィザードを閉じます。
  5. ダイナミックディストリビューションをインポートする場合、インポートされるディストリビューションは[Project settings] (プロジェクト設定)ダイアログボックスの[Dynamic distribution settings] (ダイナミックディストリビューションの設定)ビューの[Version] (バージョン)ドロップダウンリストに表示されます。次に[Apply] (適用)、次にOKをクリックして新しい設定を確認し、[Project settings] (プロジェクト設定)ダイアログボックスを閉じます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。