L'exemple suivant vous montre comment améliorer le Talend Trust Score™ à l'aide de Talend Cloud Data Inventory et Talend Cloud Data Preparation.
Dans cet exemple, vous travaillez dans une entreprise de e-commerce. Certaines commandes n'ont pas été expédiées. En regardant l'avancement des commandes, vous avez remarqué que certains noms de pays et Numéros d'Identification Fiscale sont incorrects.
Voici un échantillon du jeu de données :
Vérifier le Talend Trust Score™ courant
Procedure
Allez dans l'onglet Datasets (Jeux de données).
Pour trouver le jeu de données duquel améliorer le Talend Trust Score™, filtrez les jeux de données.
Dans cet exemple, utilisez les mots-clés pour filtrer les jeux de données.
La liste des jeux de données est filtrée. Le Talend Trust Score™ est de 3.38/5.
Dans Talend Cloud Data Inventory, allez dans l'onglet Datasets (Jeux de données).
Votre liste de jeux de données est filtrée selon le filtre appliqué dans la section précédente.
Passez votre curseur et cliquez sur l'icône Preparations (Préparations).
L'assistant Preparations (Préparations) s'ouvre.
Cliquez sur Add (Ajouter).
Vous êtes redirigé·e vers Talend Cloud Data Preparation et la préparation est créée.
What to do next
Vous pouvez à présent configurer la préparation.
Configurer la préparation
About this task
Cet exemple vous fait utiliser les fonctions depuis Talend Cloud Data Preparation.
Procedure
Pour corriger les noms de pays, utilisez la fonction de rapprochement flou.
Sélectionnez la colonne : delivery_country.
Dans le panneau de droite, sélectionnez Column et commencez à saisir fuzzy matching.
Sélectionnez la fonction Standardize value (fuzzy matching) (Standardiser la valeur (rapprochement flou)).
Configurez le seuil de rapprochement Match threshold à Default (Par défaut) (> 80%).
Cliquez sur Submit. L'étape est ajoutée aux étapes de préparation dans le panneau de gauche et les noms de pays sont corrigés. Par exemple, United Staates est remplacé par United States.
Pour convertir les codes pays, utilisez une fonction de conversion. La colonne delivery_country est toujours sélectionnée.
Dans le panneau de droite, sélectionnez Column et commencez à saisir convert.
Sélectionnez la fonction Convert country names and codes (Convertir des noms de pays et des codes pays).
Configurez From (De) à ISO country code (Code pays ISO) et To (À) à English country name (Nom de pays anglais).
Cliquez sur Submit. Les noms de pays sont convertis. Par exemple, CA est remplacé par Canada.
Pour corriger le NIF, utilisez la fonctionnalité de lookup.
Vous devez associer les colonnes qui correspondent.
Sélectionnez la colonne : customer_id. Dans cet exemple, cette colonne est celle qui correspond.
Cliquez sur l'icône de lookup au-dessus du panneau de droite.
Le panneau Lookup s'ouvre à droite.
Cliquez sur Select dataset (Sélectionner un jeu de données).
Sélectionnez le jeu de données de référence et cliquez sur Select (Sélectionner). Vous êtes de retour dans le panneau Lookup et le jeu de données de référence est affiché sous la préparation.
Dans Current preparation (Préparation courante) et Lookup dataset (Jeu de données de lookup), sélectionnez customer_id.
Sélectionnez la colonne du jeu de données de référence à ajouter à la préparation.
Dans cet exemple, vous souhaitez corriger le NIF. Vous devez sélectionner customer_tax_id.
Cliquez sur Submit. L'étape est ajoutée aux étapes de préparation dans le panneau de gauche.
Exécuter la préparation
Procedure
Cliquez sur Run.
Sélectionnez le jeu de données courant pour écrire en sortie les données préparées.
Lorsque vous avez sélectionné le jeu de données, les paramètres supplémentaires (Additional parameters) s'affichent.
Sélectionnez Update (Mise à jour) dans la liste Action.
Dans le champ Operation keys (Clés des opérations), saisissez order_id.
Sélectionnez (Create entry) (Créer l'entrée) et cliquez sur Next (Suivant).
Mappez customer_tax_id à customer_tin.
Si la préparation contient davantage de colonnes que le jeu de données de référence, vous pouvez ne pas mapper certaines colonnes.
Cliquez sur Next.
Sélectionnez le profil d'exécution et cliquez sur Run (Exécuter).
L'exécution de la préparation peut prendre plusieurs minutes. Vous pouvez voir la progression de l'exécution dans Run history (Historique des exécutions), au-dessus du panneau de droite.
Pour voir les améliorations apportées à votre jeu de données, retournez dans Talend Cloud Data Inventory.
Consulter le nouveau Talend Trust Score™
Procedure
Pour voir les améliorations de la préparation, ouvrez le jeu de données et actualisez l'échantillon dans la vue Sample (Échantillon).
Vous pouvez voir que les noms de pays sont tous corrects et que les NIF ont été renseignés.
Pour voir les effets sur la qualité du jeu de données, allez dans la vue d'ensemble du jeu de données.
Le Talend Trust Score™ est passé de 3.38/5 à 3.57/5.
What to do next
Les règles de qualité de données vous permettant d'améliorer le Talend Trust Score™. Pour plus d'informations, consultez Gérer les règles de qualité de données.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.