重複除去コンポーネントの使用
Data Qualityコンポーネントの中には、データベースのカラムを分析し、マッチングルールや比較アルゴリズムを使用して、重複をグルーピングするか、値を照合できるコンポーネントがあります。コンポーネントの例としては、tMatchGroup、tRecordMatching、tGenKey、tRuleSurvivorshipがあります。
存続ルールパッケージの管理の詳細は、サバイバーシップルールパッケージを管理をご覧ください。
重複除去コンポーネントの詳細とサンプルジョブについては、Talendコンポーネントリファレンスガイドと区切り付きファイル(CSVファイル)をクレンジングをご覧ください。
データクオリティのデモプロジェクトにも、重複除去コンポーネントを使用できる既製ジョブがあります。詳細は、データクオリティのデモプロジェクトをインポートをご覧ください。