tPartitionerの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtPartitionerを設定するために使われます。
標準のtPartitionerコンポーネントは、オーケストレーション化ファミリーに属しています。
このコンポーネントは、ビッグデータ対応のTalend製品、Talend Data Management Platform、Talend Data Services Platform、Talend MDM Platform およびTalend Data Fabricで利用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明で、処理された後に次のコンポーネントに渡されるフィールドの数を定義するものです。スキーマは[Built-in] (組み込み)か、[Repository] (リポジトリー)にリモートで保存されます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
ジョブで接続している先行コンポーネントからスキーマを取得するためには、[Sync columns] (カラムを同期)をクリックします。 |
[Number of Child Threads] (子スレッドの数) |
入力レコードを複数スレッドに分割する場合のスレッド数を入力します。 この数字はN-1にすることを推奨します。ここで、Nはデータを処理するマシンのCPU数またはコア数を表します。 |
[Buffer Size] (バッファーサイズ) |
この行数を超えるとメモリが解放されます。 生成された個別のスレッドでキャッシュする行数です。 |
[Use a key hash for partitions] (分割用にキーハッシュを使用) |
ハッシュモードを使って入力レコードをスレッドに転送するには、このチェックボックスを選択します。 これを選択すると、[Key Columns] (キーカラム)テーブルが表示されるため、ハッシュモードを適用するカラムをこのテーブルに設定します。ハッシュモードでは、同じ条件を満たすレコードが同じスレッドに転送されます。 このチェックボックスをオフにすると、転送モードは総当たり方式となり、レコードはローテーションで1件ずつ処理されて各スレッドに転送され、最後のレコードが転送されるまで続きます。このモードでは、同じ条件を満たすレコードが必ずしも同じスレッドに入らないことにご注意ください。 |
詳細設定
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、入力コンポーネントの後ろに、そしてtCollectorの前に置きます。 このコンポーネントは、tCollectorへの接続に[Trigger] (トリガー) > [Start] (開始)リンクのみを使用できます。 |
[Connections] (接続) |
外部リンク(このコンポーネントから別のコンポーネントへのリンク): [Trigger] (トリガー): 開始。
受信リンク (あるコンポーネントからこのコンポーネントへのリンク): [Row] (行): メイン。
接続に関する詳細は、 Talend Studioユーザーガイドをご覧ください。 |