tHDFSConnection
特定のHDFSに接続することで、このHDFSと通信するために作成した接続を他のHadoopコンポーネントが再使用できるようにします。
tHDFSConnectionは、実行時に対象のHadoop分散ファイルシステム(HDFS)への接続を提供します。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tHDFSConnectionの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtHDFSConnectionを設定するために使われます。
標準のtHDFSConnectionコンポーネントは、ビッグデータファミリーとファイルファミリーに属しています。
このフレームワークのコンポーネントは、すべてのビッグデータ対応のTalend製品およびTalend Data Fabricで利用できます。
基本設定
| プロパティ | 説明 |
|---|---|
|
[Property Type] (プロパティタイプ) |
接続の詳細を設定する方法を選択します。
|
| [Hadoop version] (Hadoopのバージョン) |
使用しているディストリビューションのHadoopバージョンを選択します。 |
| [Scheme] (スキーム) | [Scheme] (スキーム)ドロップダウンリストから、使用するファイルシステムのURIスキームを選択します。このスキームは
このリストにあるスキームは、使用しているディストリビューションによって異なります。また、特定のディストリビューションでこのリストに表示されるスキームのみが、Talendによって正式にサポートされています。 スキームをオンにすると、WebHDFS用のwebhdfs://localhost:50070/などの対応する構文が、クラスターのNameNodeロケーションのフィールドに表示されます。 ADLSを選択した場合、定義の必要な接続パラメーターは以下のとおりです。
|
|
[NameNode URI] (ネームノードURI) |
Hadoopシステムのマスターノード、Hadoop NameNodeのURIを入力します。たとえば、NameNodeとしてmasternodeという名前のマシンを選択した場合、その場所はhdfs://masternode:portnumberになります。 WebHDFSを使用している場合、ロケーションはwebhdfs://masternode:portnumberとなります。WebHDFS with SSLはまだサポートされていません。 |
| [Inspect the classpath for configurations] (設定用のクラスパスを検査) |
$HADOOP_CONF_DIR変数で設定したディレクトリー内の設定ファイルをコンポーネントがチェックして、このディレクトリー内のこれらのファイルからパラメーターを直接読み取ることができるようにする場合は、このチェックボックスをオンにします。この機能により、コンポーネントのHadoop設定を変更して、たとえばテスト環境から本番環境に切り替えるなど、環境の切り替えを容易に行うことができます。 この状況では、Hadoop接続とKerberosセキュリティ(またはそのいずれか)の設定に使われるフィールドやオプションは非表示になっています。 Kerberosパラメーターなど、特定のパラメーターを使おうとしていて、それらのパラメーターがHadoop設定ファイルに含まれていない場合は、talend-site.xmlという名前のファイルを作成し、$HADOOP_CONF_DIRを使用して定義したのと同じディレクトリーに置く必要があります。このtalend-site.xmlファイルは、次のようになります。
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>talend.kerberos.authentication </name>
<value>kinit </value>
<description> Set the Kerberos authentication method to use. Valid values are: kinit or keytab. </description>
</property>
<property>
<name>talend.kerberos.keytab.principal </name>
<value>user@BIGDATA.COM </value>
<description> Set the keytab's principal name. </description>
</property>
<property>
<name>talend.kerberos.keytab.path </name>
<value>/kdc/user.keytab </value>
<description> Set the keytab's path. </description>
</property>
<property>
<name>talend.encryption </name>
<value>none </value>
<description> Set the encryption method to use. Valid values are: none or ssl. </description>
</property>
<property>
<name>talend.ssl.trustStore.path </name>
<value>ssl </value>
<description> Set SSL trust store path. </description>
</property>
<property>
<name>talend.ssl.trustStore.password </name>
<value>ssl </value>
<description> Set SSL trust store password. </description>
</property>
</configuration>
これらの設定ファイルから読み取られたパラメーターは、Talend Studioが使用しているデフォルトのパラメーターを オーバーライドします。これらの設定ファイルにパラメーターが存在しない場合は、デフォルトのパラメーターが使用されます。 |
| [Use Kerberos authentication] (Kerberos認証を使用) |
Kerberosセキュリティを実行しているHadoopクラスターにアクセスする場合は、このチェックボックスをオンにし、表示されるフィールドにネームノードとしてKerberosのプリンシパル名を入力します。これにより、ユーザー名を使って、Kerberosに保存された認証情報に対して認証を実行できます。 接続しているHadoopのディストリビューションによってはこのチェックボックスが表示されないこともあります。 |
| MapRチケットを使用した認証 | MapRチケットを使用して認証するには、このチェックボックスをオンにして、次の情報を入力します。
|
| [Use a keytab to authenticate] (Keytabを認証に使用) |
[Use a keytab to authenticate] (Keytabを認証に使用)チェックボックスをオンにして、所定のkeytabファイルを使ってKerberos対応のシステムにログインします。keytabファイルには、Kerberosのプリンシパルと暗号化されたキーのペアが含まれています。使用するプリンシパルを[Principal] (プリンシパル)フィールドに入力し、keytabファイルへのアクセスパスを[Keytab] フィールドに入力します。このキータブファイルは、ジョブが実際に実行されているマシン(Talend JobServerなど)に保存する必要があります。 keytabが有効なジョブは、プリンシパルに任命されたユーザーでなくても実行できますが、使用するkeytabファイルの読み取り権限が必要です。たとえばuser1というユーザー名でジョブを実行し、使用するプリンシパルがguestの場合、user1に使用するキータブファイルの読み取り権限があることをご確認ください。 |
| User name (ユーザー名) | HDFSのユーザー認証名。 |
| グループ | HDFSインスタンスが起動された認証ユーザーを含めたメンバーシップを入力します。このフィールドは、使用しているHadoopのディストリビューションによっては、表示されないことがあります。 |
| [Hadoop properties] (Hadoopプロパティ) |
Talend Studio では、Hadoopディストリビューションの処理を実行するエンジンに、デフォルト設定を使用しています。特定の場合にカスタム設定を使用する必要がある場合は、カスタマイズするプロパティをこのテーブルで設定します。設定後、カスタマイズしたプロパティによってこれらのデフォルトのプロパティが実行時に上書きされます。
Hadoopやその関連システム(HDFS、Hiveなど)で必要なプロパティの詳細は、使用しているHadoopディストリビューションのドキュメンテーションか、ApacheのHadoopドキュメンテーションをご覧になって、必要なバージョンのドキュメンテーションを選択してください。以下のリンクでは、一部のプロパティについて実例を紹介しています。
|
| [Use datanode hostname] (データノードホスト名を使用) |
[Use datanode hostname] (データノードホスト名を使用)チェックボックスをオンにして、これらのホスト名によるデータノードへのアクセスをジョブに許可します。これは、実際にはdfs.client.use.datanode.hostnameプロパティをtrueに設定しています。 |
| [Setup HDFS encryption configurations] (HDFS暗号化設定) |
HDFSの透過的暗号化をクラスターで有効にしている場合は、[Setup HDFS encryption configurations] (HDFS暗号化設定)チェックボックスをオンにし、[HDFS encryption key provider] (HDFS暗号化キープロバイダー)フィールドが表示されたら、KMSプロキシのロケーションを入力します。 HDFSの透過的暗号化とそのKMSプロキシの詳細は、Transparent Encryption in HDFSをご覧ください。 |
詳細設定
| プロパティ | 説明 |
|---|---|
| [tStatCatcher Statistics] (tStatCatcher統計) | このチェックボックスをオンにすると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
| 変数 | 説明 |
|---|---|
| グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
| 使用方法のガイダンス | 説明 |
|---|---|
| 使用ルール | このコンポーネントは、通常、他のHadoopコンポーネントとともに使います。 |
| 前提条件 |
Talend Studio との操作を確実に行うには、Hadoopディストリビューションを適切にインストールする必要があります。以下のリストに、MapR関連の情報などを示します。
Hadoopディストリビューションのインストール方法の詳細は、使用しているHadoopディストリビューションに対応するマニュアルをご覧ください。 |
| 制限事項 |
JRE 1.6+が必要です。 |