tMapの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtMapROjaiInputを設定するために使われます。
標準のtMapROjaiInputコンポーネントは、データベースNoSQLファミリーに属しています。
このフレームワークのコンポーネントは、すべてのビッグデータ対応のTalend製品およびTalend Data Fabricで使用できます。
基本設定
[Distribution] (ディストリビューション)と[Version] (バージョン) |
MapRクラスターのバージョンを選択します。このクラスターは、使用するMapR-DBデータベースをホストしている必要があります。 |
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。
スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。変更を加えると、スキーマは自動的に組み込みになります。
このコンポーネントは、ドキュメントタイプをサポートしています。ドキュメント全体に対してフィールドがある場合は、スキーマエディターで、このフィールドの[Type] (タイプ)カラムの[Document] (ドキュメント)を選択します。 ジョブで接続している先行コンポーネントからスキーマを取得するためには、[Sync columns] (カラムを同期)をクリックします。 |
[Use Kerberos authentication] (Kerberos認証を使用) |
Kerberosセキュリティを実行しているOJAIデータベースとしてのMapR-DBにアクセスする場合は、このチェックボックスを選択し、表示されたフィールドにKerberosのプリンシパル名とパスワードを入力します。 ジョブを起動するたびに、新しいkinitチケットを得るため、コンポーネントによってこの認証情報がKerberosに送信されます。 |
[Use a key tab to authenticate] (キータブを認証に使用) |
[Use a keytab to authenticate] (Keytabを認証に使用)チェックボックスをオンにして、所定のkeytabファイルを使ってKerberos対応のシステムにログインします。keytabファイルには、Kerberosのプリンシパルと暗号化されたキーのペアが含まれています。使用するプリンシパルを[Principal] (プリンシパル)フィールドに入力し、keytabファイルへのアクセスパスを[Keytab] フィールドに入力します。このキータブファイルは、ジョブが実際に実行されているマシン(Talend JobServerなど)に保存する必要があります。 keytabが有効なジョブは、プリンシパルに任命されたユーザーでなくても実行できますが、使用するkeytabファイルの読み取り権限が必要です。たとえばuser1というユーザー名でジョブを実行し、使用するプリンシパルがguestの場合、user1に使用するキータブファイルの読み取り権限があることをご確認ください。 |
[Restrict partial sorts with Secondary Indexes] (部分ソートをセカンダリーインデックスで制限) |
このチェックボックスをオンにすると、実際のデータでクエリーが明示的にソートされます。これにより、クエリー内で非同期セカンダリーインデックスが原因で発生する可能性がある部分的なソートを回避できます。 MapR OJAIのこの部分的なソートの問題については、MapRドキュメントの非同期セカンダリーインデックスのアップデートをご覧ください。 非同期インデックスで遅延が発生しないと予想される場合、または遅延の影響が軽微であることがわかっている場合は、このチェックボックスをオンにしないでください。このチェックボックスをオフにしておくことで、クエリーはMapR-DB JSONテーブルのセカンダリーインデックスによって提供される順序付けの利点を活用できます。 |
テーブル名 |
処理するテーブルの名前を入力します。 |
クエリー |
tMapROjaiInputによって実行されるクエリーのwhere句を指定します。 たとえば、"{id:{$eq: 4}}"または"{id:4}}"と入力して、idが4となっているレコードを取得します。 OJAIはクエリーにMongoDBクエリー形式を使うため、使用可能な演算子については、MongoDBドキュメントのクエリー演算子をご覧ください。 |
[Mapping] (マッピング) |
このコンポーネント用に定義されたスキーマの各カラムは、読み取るドキュメントのフィールドを表します。このテーブルで、これらのフィールドの親ノードがあればそれを指定する必要があります。 たとえば、次のようなドキュメントがあるとします。
{ _id: ObjectId("5099803df3f4948bd2f98391"), person: { first: "Joe", last: "Walker" } }フィールドfirstおよびlastには親ノードpersonがありますが、_idフィールドには親ノードがありません。したがって、完了すると、この[Mapping]テーブルは次のようになります。 Column Parent node path _id first "person" last "person" |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
tMapROjaiInputはクエリーを実行して、指定されたMapR-DBデータベースからデータを読み取ります。これはジョブの開始コンポーネントであり、次のコンポーネントにデータを送信するには送信リンクが必要です。 |