tCollector
tPartitionerによって生成されたスレッドを使用して、並列実行プロセスにフィードします。
Talend Studioではまた、並列コンポーネントを使用せずにジョブ全体に並列の自動実装を行うことができます。Talendでは、この方式をお勧めします。詳細は、データフローの並列化を有効にするをご覧ください。ただし、これらの特定の並列コンポーネントの使い方を理解する必要がある場合は、並列コンポーネントが互いに密接に連携して特定の処理を並列実行することを考慮しておく必要があります:tPartitionerコンポーネントは、入力レコードを特定数のスレッドに転送します。tCollectorコンポーネントは、それらのスレッドを並列実行のために後続のコンポーネントに送信します。tDepartitionerコンポーネントは、処理された並列スレッドの出力を再グルーピングします。tRecollectorコンポーネントは、特定のtDepartitionerコンポーネントの出力をキャプチャーし、キャプチャーしたデータを次のコンポーネントに送信します。
このコンポーネントは、tPartitionerから並列スレッドを受け取り、並列実行するためにそのスレッドを以降のコンポーネントに送ります。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tCollectorの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtCollectorを設定するために使われます。
標準のtCollectorコンポーネントは、オーケストレーション化ファミリーに属しています。
このコンポーネントは、Big Data、Talend Data Management PlatformTalend Data Services Platform、Talend MDM PlatformTalend Data Fabric対応のTalendで利用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
|
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。 THREAD_ID: このコンポーネントが処理しているスレッドのID。Flow変数として利用できます。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、相互に接続する[Start] (開始) リンクを持つtPartitionerの後ろに配置する必要があります。 このコンポーネントは、他のコンポーネントを使って設計した並列プロセスをジョブで開始します。 |
[Connections] (接続) |
外部リンク(このコンポーネントから別のコンポーネントへのリンク): [Row] (行): メイン。
受信リンク(あるコンポーネントからこのコンポーネントへのリンク): [Trigger] (トリガー): 開始。
接続の詳細は、ジョブにおける接続の使い方をご覧ください。 |