重複値を分析
Talend StudioのProfilingパースペクティブで一致分析を使用して、データベースまたは区切り付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。
この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールのテストが終わったら、エディターからエクスポートしてTalend Studioリポジトリーに保存し、tMatchGroup、tRecordMatching、tGenKey、Hadoopなどの一致コンポーネントにインポートすれば、後で使用できるようになります。
また、Profilingパースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。