[Component-specific settings] (コンポーネント固有設定) (tHBaseOutput用)
コンポーネントのsetSettings {}関数で定義できるジョブスクリプトの関数とパラメーターは、以下の表のとおりです。
関数/パラメーター | 説明 | 必須? |
---|---|---|
USE_EXISTING_CONNECTION |
定義済みの接続情報を再利用する場合は、このパラメーターをtrueに設定して、CONNECTIONパラメーターを使って、関連接続コンポーネント名を指定します。 |
いいえ |
DISTRIBUTION |
クラスターディストリビューションを指定します。使用できる値は次のとおりです。
このパラメーターを指定しない場合、デフォルトのクラスターディストリビューションはAmazon EMRになります。 |
いいえ |
HBASE_VERSION |
使用しているHadoopディストリビューションのバージョンを指定します。使用できる値は次のとおりです。
デフォルト値はEMR_5_5_0です。 |
いいえ |
HADOOP_CUSTOM_VERSION |
カスタムクラスターを使用している場合、このパラメーターを使ってカスタムクラスターのHadoopバージョンを指定します。HADOOP_1 (デフォルト)またはHADOOP_2になります。 |
いいえ |
ZOOKEEPER_QUORUM |
Studioとデータベース間のトランザクションを調整するZookeeperサービスの名前またはURLを入力します。 Zookeeperを設定する場合は、SET_ZNODE_PARENTパラメーターとZNODE_PARENTパラメーターを使用して、ルートznodeへのパスを明示的に定義する必要があります。ルートznodeには、データベースによって作成および使用されるすべてのznodeが含まれます。 |
はい |
ZOOKEEPER_CLIENT_PORT |
使用しているZookeeperサービスのクライアントリスニングポートの数を指定します。 |
はい |
SET_ZNODE_PARENT |
必要に応じて、このパラメーターをtrueに設定して、ZNODE_PARENTパラメーターによりルートznodeのパスを指定します。 |
いいえ |
USE_KRB |
使用データベースがKerberosで保護されている場合、このパラメーターをtrueに設定し、HBASE_MASTER_PRINCIPALパラメーターとHBASE_REGIONSERVER_PRINCIPAパラメーターによってプリンシパル名を指定します。 |
いいえ |
USE_KEYTAB |
Kerberos keytabファイルを使ってログインする必要がある場合、このパラメーターをtrueに設定し、PRINCIPALパラメーターを使ってプリンシパルを、KEYTAB_PATHパラメーターを使ってkeytabファイルのアクセスパスを指定します。 |
いいえ |
USE_MAPRTICKET |
クラスターがバージョン4.0.1以上のMapRクラスターである場合、このパラメーターをtrueに設定して、MAPRTICKET_CLUSTER、MAPRTICKET_DURATION、USERNAME、MAPRTICKET_PASSWORDの各パラメーターを使って関連情報を指定することによって、MapRチケット認証設定することが必要になります。詳細は、MapRで、セキュリティが有効になっているMapRクラスターへの接続に関するセクションをご覧ください。 |
いいえ |
TABLE |
データを書き込むHBaseテーブルの名前を入力します。 |
はい |
SET_TABLE_NS_MAPPING |
必要に応じて、このパラメーターをtrueに設定し、TABLE_NS_MAPPINGを使って、Apache HBaseテーブルとMapRテーブル間のマッピングを構成するのに使用される文字列を指定します。 |
いいえ |
TABLE_ACTION |
指定テーブル上で実行するアクションを入力します。使用できる値は次のとおりです。
|
いいえ |
FAMILIES {} |
この関数に次のパラメーターを含めて、処理するデータフロー用に定義されているスキーマカラムに、テーブルのカラムをマッピングします。
カラムファミリーの詳細は、Column familiesでApacheのドキュメンテーションをご覧ください。 |
はい |
DIE_ON_ERROR |
エラー発生時、ジョブの実行を停止する場合は、このパラメーターをtrueに設定します。 デフォルトでは、このパラメーターはfalseに設定されます。 |
いいえ |
USE_BATCH_MODE |
データをバッチ処理する場合は、このパラメーターをtrueに設定して、BATCH_SIZEを使って、各バッチで処理するレコード数を指定します。 |
いいえ |
HBASE_PARAMETERS {} |
データベースのカスタム設定を使用する必要がある場合、この関数に、次のパラメーターセットを1つ以上含めて、カスタマイズするプロパティを指定します。カスタマイズされたプロパティは、ランタイムに、Studioによって使用される対応するプロパティを上書きします。
|
いいえ |
FAMILY_PARAMETERS {} |
カラムファミリー、または作成されるファミリーの名前、および必要に応じてカスタムパフォーマンスオプションを、次の1つ以上のパラメーターセットを使って指定します。これらのオプションはすべてHBaseデータモデルによって定義されている属性なので、これらのオプションの詳細の詳細は、Apache HBaseドキュメントをご覧ください。
|
はい |
SET_MAPR_HOME_DIR |
MapR設定ファイルのロケーションがクラスター内のどこかに変更されている場合、つまり、MapRホームディレクトリーが変更されている場合、このパラメーターをtrueに設定し、MAPR_HOME_DIRパラメーターを使って新しいホームディレクトリーを指定します。 |
いいえ |
SET_HADOOP_LOGIN |
mapr.login.conf ファイルで使用されるログインモジュールが変更されている場合、このパラメーターをtrueに設定して、HADOOP_LOGINパラメーターを使って、mapr.login.confファイルから呼び出されるモジュールを指定します。 |
いいえ |
TSTATCATCHER_STATS |
各コンポーネントレベルおよびジョブレベルで処理メタデータを収集する場合、このパラメーターをtrueに設定します。 デフォルトでは、このパラメーターはfalseに設定されます。 |
いいえ |
LABEL |
このパラメーターを使って、コンポーネントのテキストラベルを指定します。 |
いいえ |