tCosmosDBBulkLoadの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtCosmosDBBulkLoadを設定するために使われます。
標準のtCosmosDBBulkLoadコンポーネントは、Cloudファミリーとデータベースファミリーに属しています。
このフレームワークのコンポーネントは、すべてのビッグデータ対応のTalend製品およびTalend Data Fabricで使用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
|
[MongoDB directory] (MongoDBディレクトリー) | このフィールドにMongoDBホームディレクトリーを入力します。 |
[Use replica set address or multiple query routers] (レプリカセットのアドレスまたは複数クエリールーターを使用します) |
このチェックボックスを選択して[Server addresses] (サーバーアドレス)テーブルを表示します。 [Server addresses] (サーバーアドレス)テーブルで、接続先とする共有のMongoDBデータベースまたはMongoDBレプリカセットを定義します。 |
[Server] (サーバー)と[Port] (ポート) |
データベースサーバーのIPアドレスとリスニングポート番号を入力します。 [Use replica set address or multiple query routers] (レプリカセットのアドレスまたは複数クエリールーターを使用します)チェックボックスがオフの時に利用できます。 |
[Database] (データベース) |
接続先とするMongoDBデータベースの名前を入力します。 |
[Collection] (コレクション) | データのインポート先となるコレクションの名前を入力します。 |
[Drop collection if exist] (存在する場合はコレクションをドロップ) | このチェックボックスをオンにすると、既に存在する場合はコレクションが削除されます。 |
[Authentication mechanism] (認証メカニズム) |
Kerberosを使用していない場合は、[Authentication mechanism] (認証メカニズム)ドロップダウンリストにリスト表示されているメカニズムのうち、[NEGOTIATE]が推奨されます。使用しているMongoデータベースバージョンに最もよく対応している認証メカニズムが自動的に選択されるためです。 このリスト内の他のメカニズムについては、MongoDBのドキュメンテーションでMongoDB Authenticationをご覧ください。 |
[Set Authentication database] (認証データベースの設定) |
MongoDBへの接続に使用するユーザー名がMongoDBの特定の認証データベース内で作成済みの場合は、このチェックボックスを選択して、表示される[Authentication database] (認証データベース)フィールドに、この認証データベースの名前を入力します。 MongoDB認証データベースについては、User Authentication databaseをご覧ください。 |
[Username] (ユーザー名)と[Password] (パスワード) |
DBユーザー認証データ。 パスワードを入力するためには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。 [Required authentication] (必要な認証)チェックボックスが選択されている場合に利用できます。 [Authentication mechanism] (認証方式)ドロップダウンリストから、Kerberosをセキュリティシステムに選択した場合は、[Username] (ユーザー名)と[Password] (パスワード)のフィールドではなく、[User principal] (プリンシパルを使用)、[Realm] (レルム)、[KDC server] (KDCサーバー)のフィールドに入力します。 |
[Data file] (データファイル) | データのインポート元ファイルの完全パスを入力するか、[...]ボタンをクリックして目的のデータファイルを参照します。 データファイルが標準形式になっていることを確認します。たとえば、CSVファイルのフィールドはコンマで区切る必要があります。 |
[File type] (ファイルタイプ) | リストから適切なファイルの種類を選択します。CSV、TSV、JSONがサポートされています。 |
[The JSON file starts with an array] (JSONファイルは配列で始まる) | このチェックボックスをオンにすると、tCosmosDBBulkloadでは配列で始まるJSONファイルを読み取れます。 このチェックボックスは、選択した[File type] (ファイルタイプ)がJSONの場合に表示されます。 |
[Action on data] (データでのアクション) | データに対して実行する操作を選択します。
|
[Upsert fields] (アップサートフィールド) | 必要に応じてアップサートするフィールドをカスタマイズします。 このテーブルは[Action on data] (データでのアクション)リストから[Upsert] (アップサート)を選択した場合に利用できます。 |
[First line is header] (最初の行をヘッダーにする) | このチェックボックスをオンにすると、CSVまたはTSVファイルの最初の行をヘッダーとして利用できます。 このチェックボックスは、[File type] (ファイルタイプ)リストからCSVまたはTSVを選択した場合のみ利用できます。 |
[Ignore blanks] (空白を無視) | このチェックボックスをオンにすると、CSVまたはTSVファイルの空のフィールドを無視できます。 このチェックボックスは、[File type] (ファイルタイプ)リストからCSVまたはTSVを選択した場合のみ利用できます。 |
[Print log] (ログを印刷) | このチェックボックスをオンにすると、ログを印刷できます。 |
詳細設定
[Additional arguments] (追加の引数) | 必要に応じて、追加の引数を使用するには、このテーブルの入力を完了します。 たとえば、引数--jsonArrayを使用して、単一のJSON配列内の複数のMongoDBドキュメントで表されるデータのインポートを受け入れることができます。追加の引数の詳細は、http://docs.mongodb.org/manual/reference/program/mongoimport/に移動し、オプションの説明をご覧ください。 |
[Disable retryable writes] (再試行可能な書き込みを無効化) | このチェックボックスを選択すると、書き込み操作の自動再試行を無効にできます。このオプションの詳細は、MongoDBのドキュメンテーションをご覧ください。 このオプションはバージョン100.9.5以降のmongoimportでのみサポートされています。 |
[tStatCatcher Statistics] (tStatCatcher統計) | このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
使用方法
使用ルール | このコンポーネントは、tCosmosDBInputコンポーネントと共に使い、データが正しくインポートされたかどうかを確認できます。 |
制限事項 | MongoDBクライアントツールは、このコンポーネントを使用するジョブが実行されるマシンにインストールしておく必要があります。 |