tPatternCheck
次の2つの出力フローを与えます: 一致データおよび非一致データ。前者は特定のパターンに一致するすべてのデータを収集し、後者は特定のパターンに一致しないすべてのデータを収集します。その後、必要な修正を行うことができます。
tPatternCheckは、特定のJava正規表現に基づいてカラム内の既存データすべてをチェックします。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tPatternCheckの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtPatternCheckを設定するために使われます。
標準のtPatternCheckコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real-Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。
基本設定
プロパティ | 説明 |
---|---|
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
|
[Column to check] (チェックするカラム) | 分析するカラムを選択します。String型のカラムのみを分析できます。 |
[PROPERTY] (プロパティ) |
データチェックのベースとするパターンは、[Built-in] (組み込み)か、または[Repository] (リポジトリー)にリモートで保管されています。
|
詳細設定
プロパティ | 説明 |
---|---|
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
変数 | 説明 |
---|---|
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 NB_LINE_OK: 特定のパターンにマッチングする行の数。これはAfter変数で、整数を返します。 NB_LINE_REJECT: 特定のパターンにマッチングしない行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用方法のガイダンス | 説明 |
---|---|
使用ルール |
このコンポーネントは、通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。 |
[Limitation] (制限事項) |
[DQ Repository] (DQリポジトリー)に保存されているユーザー定義のパターンでtPatternCheckを使用してジョブをエクスポートする時は、パターンをジョブと一緒にエクスポートする必要があります。あるいは、別のプロジェクトにジョブをインポートする場合は、パターンは組み込みモードに切り替わります。 tPatternCheckとシステムパターンを使用してジョブをインポートする時は、組み込みモードに切り替わります。 Talend Studio内のパターンと共にジョブをインポートするオペレーションについては、「データプロファイリング項目またはプロジェクトのインポート」をご覧ください。 |