tPatternExtract
指定されたパターンにマッチするすべてのデータを出力します。その後、抽出されたデータに対して必要な操作を実装できます。
tPatternExtractは、指定されたJava正規表現に一致するすべてのデータ文字列をカラムから抽出します。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
tPatternExtractの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているctPatternExtractを設定するために使われます。
標準のtPatternExtractコンポーネントは、データクオリティファミリーに属しています。
このコンポーネントは、Talend Data Management Platform、Talend Big Data Platform、Talend Real-Time Big Data Platform、Talend Data Services Platform、Talend Data Fabricで利用できます。
基本設定
| プロパティ | 説明 |
|---|---|
|
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
|
|
[Column to check] (チェックするカラム) |
分析するカラムを選択します。 |
|
[PROPERTY] (プロパティ) |
データチェックのベースとするパターンは、[Built-in] (組み込み)か、または[Repository] (リポジトリー)にリモートで保管されています。
|
詳細設定
| プロパティ | 説明 |
|---|---|
|
[tStat Catcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
| 変数 | 説明 |
|---|---|
|
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 NB_LINE_OK: 特定のパターンにマッチングする行の数。これはAfter変数で、整数を返します。 NB_LINE_REJECT: 特定のパターンにマッチングしない行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
| 使用方法のガイダンス | 説明 |
|---|---|
|
使用ルール |
このコンポーネントは、通常、中間コンポーネントとして使用されます。入力コンポーネントと出力コンポーネントが必要です。 |
|
制限事項 |
[DQ Repository] (DQリポジトリー)に保管されているユーザー定義のパターンでtPatternExtractを使ってジョブをエクスポートする時は、パターンをジョブと一緒にエクスポートする必要があります。そうしないと、パターンはジョブを別のプロジェクトにインポートする時に組み込みモードに切り替わります。 tPatternExtractとシステムパターンを使ってジョブをインポートする時は、組み込みモードに切り替わります。 Talend Studio内のパターンと共にジョブをインポートするオペレーションについては、「データプロファイリング項目またはプロジェクトのインポート」をご覧ください。 |