Identifier les anomalies dans les données
Ce cas d'utilisation explique comment utiliser la perspective Profiling du Studio pour analyser les adresses e-mail et les numéros de téléphone des clients. Il utilise des indicateurs et des modèles prêts à l'emploi sur les colonnes et montre les données d'adresse correspondantes et ne correspondant pas.
Les Jobs Profiling sont ensuite générés dans les résultats d'analyse afin de nettoyer les données clients et monitorer leur évolution.Vous pouvez utiliser la perspective Data Explorer pour parcourir les données ne correspondant pas.
La séquence de profiling et de nettoyage des données clients comprend les étapes suivantes :
Procédure
- Création d'une analyse de colonnes sur les adresses e-mail et les numéros de téléphone des clients.
- Connexion à la base de données comprenant les données clients dans l'éditeur d'analyse.
- Ajout d'indicateurs fournissant des statistiques simples sur les données comme le nombre de lignes, de valeurs vides et de valeurs en doublon.
- Ajout de modèles standard d'adresses e-mail et de numéros de téléphone pour l'analyse de correspondance.
- Exécution de l'analyse afin que les résultats s'affichent dans les tables et les graphiques.
- Accès à une vue des données analysées pour consulter les enregistrements invalides.
- Génération de Jobs prêts à l'emploi à partir des résultats d'analyse pour supprimer les valeurs en doublon des colonnes Email et Phone.
- Génération de Jobs prêts à l'emploi à partir des résultats d'analyse pour supprimer les valeurs qui ne respectent pas le format d'e-mail ou de numéro de téléphone standard, respectivement des colonnes Email et Phone.