tDepartitioner
tRecollectorがキャプチャーできるように、並列実行プロセスの出力をアセンブルします。
Talend Studioではまた、並列コンポーネントを使用せずにジョブ全体に並列の自動実装を行うことができます。Talendでは、この方式をお勧めします。詳細は、データフローの並列化を有効にするをご覧ください。ただし、これらの特定の並列コンポーネントの使い方を理解する必要がある場合は、並列コンポーネントが互いに密接に連携して特定の処理を並列実行することを考慮しておく必要があります:tPartitionerコンポーネントは、入力レコードを特定数のスレッドに転送します。tCollectorコンポーネントは、それらのスレッドを並列実行のために後続のコンポーネントに送信します。tDepartitionerコンポーネントは、処理された並列スレッドの出力を再グルーピングします。tRecollectorコンポーネントは、特定のtDepartitionerコンポーネントの出力をキャプチャーし、キャプチャーしたデータを次のコンポーネントに送信します。
このコンポーネントは、前のコンポーネントによって実行された並列プロセスの出力結果を再グルーピングします。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tDepartitionerの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtDepartitionerを設定するために使われます。
標準のtDepartitionerコンポーネントは、オーケストレーション化ファミリーに属しています。
このコンポーネントは、Big Data、Talend Data Management PlatformTalend Data Services Platform、Talend MDM PlatformTalend Data Fabric対応のTalendで利用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
ジョブで接続している先行コンポーネントからスキーマを取得するためには、[Sync columns] (カラムを同期)をクリックします。 |
[Buffer Size] (バッファーサイズ) |
この行数を超えるとメモリが解放されます。 |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、ジョブの並列実行プロセスの終了コンポーネントです。 このコンポーネントは、実行結果を出力するためにtRecollectorを必要とします 。 |
[Connections] (接続) |
外部リンク(このコンポーネントから別のコンポーネントへのリンク): 該当せず
受信リンク(あるコンポーネントからこのコンポーネントへのリンク): [Row] (行): メイン。
接続の詳細は、ジョブにおける接続の使い方をご覧ください。 |