Scénarios pour les composants de dédoublonnage (Deduplication)

Conversion d'un Job standard en un Job Spark Batch
Créer un jeu de données nettoyées à partir des paires suspectes libellées par le tMatchPredict et les enregistrements uniques calculés par le tMatchPairing
Dédoublonner des données
Dédoublonnage d'entrées en se basant sur le schéma dynamique
Fusionner le contenu de plusieurs lignes en utilisant différentes colonnes comme valeur de rang
Modification manuelle du fichier de règle afin de coder les conditions à utiliser pour créer un enregistrement consolidé
Sélection des meilleures données d'un groupe de doublons afin de créer un enregistrement consolidé

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.

Laissez vos commentaires ici