Supprimer les valeurs en doublon
Les résultats de profiling de l'analyse de colonnes montrent qu'il existe des enregistrements en doublon dans les colonnes Email et Phone. Consultez Afficher les résultats d'analyse pour plus d'informations.
À partir des résultats d'analyse, vous pouvez générer des Jobs prêts à l'emploi séparant les enregistrements uniques des enregistrements en doublon dans les colonnes sélectionnées. Ces Jobs produisent en sortie tous les doublons dans un fichier de rejet délimité par défaut et écrivent les valeurs uniques dans la base de données utilisée dans l'analyse.
Vous pouvez suivre la même procédure pour la suppression des doublons dans les colonnes Email or Phone.
Avant de commencer
-
Vous avez ouvert la perspective Profiling dans le Studio.
-
Vous avez créé et exécuté une analyse de colonnes. Pour plus d'informations, consultez Identifier les anomalies dans les données.
Procédure
Résultats
Les valeurs en doublon sont écrites dans le fichier de sortie et les enregistrements uniques sont écrits dans une nouvelle table de la base de données gettingstarted dans MySQL.