Scénarios pour les composants de dédoublonnage (Deduplication)
- Conversion d'un Job standard en un Job Spark Batch
- Créer un jeu de données nettoyées à partir des paires suspectes libellées par le tMatchPredict et les enregistrements uniques calculés par le tMatchPairing
- Dédoublonner des données
- Dédoublonnage d'entrées en se basant sur le schéma dynamique
- Dédoublonnage d'entrées en utilisant des composants Map/Reduce
- Fusionner le contenu de plusieurs lignes en utilisant différentes colonnes comme valeur de rang
- Modification manuelle du fichier de règle afin de coder les conditions à utiliser pour créer un enregistrement consolidé
- Sélection des meilleures données d'un groupe de doublons afin de créer un enregistrement consolidé