2つのカラムであいまいマッチングを行って、メインデータとリジェクトデータを出力
情報メモ重要: 6.0の一般公開リリース以降、tFuzzyJoinコンポーネントは非推奨となっており、Talend Studio 8.0 R2024-05以降は削除されています。Talendは、tRecordMatchingコンポーネントの使用をお勧めします。
このシナリオはTalend Data Management Platform、Talend Big Data PlatformTalend Real-Time Big Data Platform、Talend MDM PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
このシナリオでは、次の処理を実行する5コンポーネントジョブについて説明します。まずは、参照入力ファイルのデータに対して入力ファイルのIdClientカラムの間の編集距離をチェックして、次に参照入力ファイルのデータに対してEmailカラムで発音ごとにメールアドレスをすべてチェック。これらの2つのマッチングタイプの出力は、2つの別々のファイルに書き込まれます。
このシナリオでは、入力ファイルと参照ファイルの入力スキーマがリポジトリーに保存済みであることが前提になっています。[Repository] (リポジトリー)ツリービューにスキーマメタデータを保管する方法については、Talend Studioでメタデータを管理をご覧ください。