区切り付きファイルから、定義されたパターンに対応するデータのみを抽出する
このシナリオはTalend Data Management Platform、Talend Big Data PlatformTalend Real-Time Big Data Platform、Talend MDM PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
このシナリオでは、tExtractPatternコンポーネントを使って、さまざまな顧客データを保持する区切り付きファイルから顧客のメールアドレス([Email address] (メールアドレス)パターンに一致する)のみを抽出するコンポーネント4つのジョブについて説明します。次に、抽出されたデータが別の区切り付きファイルに書き込まれます。出力スキーマを適合させるためにtFilterColumnsコンポーネントが使われます。
このシナリオでは、区切り付きファイルには、名前、メールアドレス、電話番号がすべて、Name_Telephone_Addressという1つのカラムに含まれています。以下は入力ファイルからの抽出です。