tRecollector
tDepartitionerによる並列実行結果の出力。
Talend Studioではまた、並列コンポーネントを使用せずにジョブ全体に並列の自動実装を行うことができます。Talendでは、この方式をお勧めします。詳細は、データフローの並列化を有効にするをご覧ください。ただし、これらの特定の並列コンポーネントの使い方を理解する必要がある場合は、並列コンポーネントが互いに密接に連携して特定の処理を並列実行することを考慮しておく必要があります:tPartitionerコンポーネントは、入力レコードを特定数のスレッドに転送します。tCollectorコンポーネントは、それらのスレッドを並列実行のために後続のコンポーネントに送信します。tDepartitionerコンポーネントは、処理された並列スレッドの出力を再グルーピングします。tRecollectorコンポーネントは、特定のtDepartitionerコンポーネントの出力をキャプチャーし、キャプチャーしたデータを次のコンポーネントに送信します。
このコンポーネントは、特定のtDepartitionerが再グルーピングした並列実行結果をキャプチャーし、出力します。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tRecollectorの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtRecollectorを設定するために使われます。
標準のtRecollectorコンポーネントは、オーケストレーション化ファミリーに属しています。
このコンポーネントは、Big Data、Talend Data Management PlatformTalend Data Services Platform、Talend MDM PlatformTalend Data Fabric対応のTalendで利用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
|
[Linked Departitioner] (リンクされたDepartitioner) |
再グルーピングされた並列実行結果を受け取るtDepartitionerコンポーネントを選択します。 |
[Merge sort partitions] (パーティションのマージ/ソート) |
このチェックボックスをオンにし、マージ/ソートアルゴリズムを実装してデータの一貫性を保証します。 |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、開始コンポーネントであり、tPartitionerコンポーネントによってトリガーされ、選択されたtDepartitionerコンポーネントが返す並列実行結果をキャプチャーします。 このコンポーネントは、tPartitionerからの[Trigger] (トリガー) > [Start] (開始)リンクを使って接続します。 |
[Connections] (接続) |
外部リンク(このコンポーネントから別のコンポーネントへのリンク): [Row] (行): メイン。
受信リンク(あるコンポーネントからこのコンポーネントへのリンク): [Trigger] (トリガー): 開始。
接続の詳細は、ジョブにおける接続の使い方をご覧ください。 |