tRuleSurvivorshipの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtRuleSurvivorshipを設定するために使われます。
標準のtRuleSurvivorshipコンポーネントは、データクオリティファミリーに属しています。
このフレームワーク内のコンポーネントは、Talend Data Management PlatformTalend Big Data Platform、Talend Real-Time Big Data PlatformTalend Data Services Platform、およびTalend Data Fabricで使用できます。
基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 このコンポーネントには次の2つの読み取り専用カラムがあります。
サバイバーレコードが作成されると、競合が競合ルールによって解決済みである場合、[CONFLICT] (競合)カラムに競合するカラムが表示されません。 |
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Group identifier] (グループ識別コード) |
必要なグループIDをコンテンツが示しているカラムを、入力スキーマから選択します。 |
[Group size] (グループサイズ) |
入力スキーマから必要なグループサイズを示しているコンテンツを含むカラムを選択します。 |
[Rule package name] (ルールパッケージ名) |
このコンポーネントで作成するルールパッケージの名前を入力します。 |
[Generate rules and survivorship flow] (ルールおよびサバイバーシップフローの生成) |
このコンポーネントで、ルールパッケージのルールをすべて定義するか、またはその一部を変更したら、アイコンをクリックし、このルールパッケージを、Talend StudioのパースペクティブのIntegrationにある[Repository] (リポジトリー)内の[Metadata] (メタデータ)の下で、[Rules Management] (ルール管理)の[Survivorship Rules] (サバイバーシップルール)ノード内に生成します。 情報メモ注:
このステップは、変更を確定し、ランタイムで有効にするために必要なものです。同じ名前のルールパッケージが[Repository] (リポジトリー)内に既に存在する場合は、変更を確定すると上書きされます。それ以外の場合は、実行中に[Repository] (リポジトリー)のルールパッケージが優先します。 情報メモ警告: ルールパッケージ内で、2つのルールに同じ名前を使用することはできません。
|
[Rule table] (ルールテーブル) |
このテーブルに入力して、完全なサバイバー検証フローを作成します。基本的に、各ルールは実行ステップとして定義されます。したがって、このテーブル内で上から下に順番に、これらのルールがシーケンスを形成し、したがって、フローが形成されます。このテーブルのカラムは、以下のとおりです。 Order: サバイバー検証フローを定義するために、作成するルールの実行順序をリストから選択します。順序のタイプは以下の場合があります。
[Rule Name] (ルール名): 作成する各ルールの名前を入力します。このカラムは[Sequential] (順次)ルールでのみ利用できます。[Sequential] (順次)ルールはサバイバー検証フローのステップを定義するからです。ルール名に特殊文字を使用しないでください。特殊文字を使用すると、ジョブが正しく実行されない場合があります。ルール名では大文字と小文字が区別されません。 [Reference column] (参照カラム): 特定のルールを適用する必要のあるカラムを選択します。このコンポーネントのスキーマで定義したカラムです。このカラムは[Multi-target] (マルチターゲット)ルールでは利用できません。このルールは[Target column] (ターゲットカラム)のみを定義するためです。 [Function] (ファンクション): 特定の[Reference column] (参照カラム)を対象に実行する検証オペレーションのタイプを選択します。利用できるタイプは次のとおりです。
[Value] (値): [Function] (ファンクション)カラムで選択した[Match regex] (正規表現にマッチング)または[Expression] (式)ファンクションに対応する、目的の式を入力します。 [Target column] (ターゲットカラム): ステップが実行されると、特定の[Reference column] (参照カラム)からレコードフィールド値を検証し、特定の[Target column] (ターゲットカラム)から対応する値をベストとして選択します。このコンポーネントのスキーマカラムから、この[Target column] (ターゲットカラム)を選択します。 [Ignore blanks] (空白を無視する): 空白の値が無視されるようにしたいカラムの名前に対応するチェックボックスをオンにします。 |
[Define conflict rule] (競合ルールの定義) |
競合を解決するルールを[Conflict rule table] (競合ルールテーブル)内に作成できるようにする場合は、このチェックボックスを選択します。 |
[Conflict rule table] (競合ルールテーブル) |
このテーブルに入力して、競合を解決するルールを作成します。このテーブルのカラムは、以下のとおりです。 [Rule name] (ルール名): 作成する各ルールの名前を入力します。ルール名に特殊文字を使用しないでください。特殊文字を使用すると、ジョブが正しく実行されない場合があります。 [Conflicting column] (競合するカラム): ステップが実行されると、特定の[Reference column] (参照カラム)からレコードフィールド値を検証し、特定の[Conflicting column] (競合するカラム)から対応する値をベストとして選択します。このコンポーネントのスキーマカラムから、この[Conflicting column] (競合するカラム)を選択します。 [Function] (ファンクション): 特定の[Conflicting column] (競合するカラム)を対象に実行する検証オペレーションのタイプを選択します。利用できるタイプは、[Rule table] (ルールテーブル)内のタイプと、以下のタイプです。
[Value] (値): [Function] (ファンクション)カラムで選択した[Match regex] (正規表現にマッチング)または[Expression] (式)ファンクションに対応する、目的の式を入力します。 [Reference column] (参照カラム): 特定の競合ルールを適用する必要のあるカラムを選択します。このコンポーネントのスキーマで定義したカラムです。 [Ignore blanks] (空白を無視する): 空白の値が無視されるようにしたいカラムの名前に対応するチェックボックスをオンにします。 [Disable] (無効化): 対応するルールを無効にするには、チェックボックスをオンにします。 |
詳細設定
[Input data generated with t-Swoosh algorithm] (T-Swooshアルゴリズムによって生成された入力データ) |
tMatchGroupコンポーネントによるT-Swooshアルゴリズムを使用して、入力データが生成される場合は、このチェックボックスを選択してください。それ以外の場合は、チェックボックスをオフにします。 |
[Ignore the new master record from tMatchGroup] (tMatchGroupからのマスターレコードを無視) |
このチェックボックスは、[Input data generated with T-Swoosh algorithm] (T-Swooshアルゴリズムによって生成された入力データ)が選択されている場合に表示されます。新しいマスターレコードは tMatchGroup + T-Swooshアルゴリズムの結果です。元の入力データからのものではありません。このマスターレコードが必要である場合は、チェックボックスをオフにします。 グループ内にレコードが1つのみある時は、マスターレコードであり、無視されません。チェックボックスが選択されている場合も同様です。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。 このコンポーネントではグルーピングされたデータを処理する必要があるため、tMatchGroupなどのコンポーネントと直接連携させてグループ識別コードのカラムおよびグループサイズのカラムを使用します。 入力データはグループ識別コードによってソートされ、グループの最初の行にグループサイズが含まれている必要があります。 tRuleSurvivorshipを使用してジョブをエクスポートする場合、[Export dependencies] (依存関係のエクスポート)チェックボックスをオンにし、生成されたサバイバー検証ルールをまとめてエクスポートする必要があります。ジョブをエクスポートする方法は、項目をエクスポートをご覧ください。 |