Accéder au contenu principal Passer au contenu complémentaire

Améliorer le Talend Trust Score™

L'exemple suivant vous montre comment améliorer le Talend Trust Score™ à l'aide de Talend Cloud Data Inventory et Talend Cloud Data Preparation.

Dans cet exemple, vous travaillez dans une entreprise de e-commerce. Certaines commandes n'ont pas été expédiées. En regardant l'avancement des commandes, vous avez remarqué que certains noms de pays et Numéros d'Identification Fiscale sont incorrects.

Voici un échantillon du jeu de données :
Échantillon d'un jeu de données contenant des informations relatives à une entreprise d'e-commerce.

Vérifier le Talend Trust Score™ courant

Procedure

  1. Allez dans l'onglet Datasets (Jeux de données).
  2. Pour trouver le jeu de données duquel améliorer le Talend Trust Score™, filtrez les jeux de données.
    Option Add filter (Ajouter un filtre) sélectionnée.
  3. Dans cet exemple, utilisez les mots-clés pour filtrer les jeux de données.
    Mot-clé dans "orders" sélectionné pour filtrer les jeux de données.
    La liste des jeux de données est filtrée. Le Talend Trust Score™ est de 3.38/5.

What to do next

Pour améliorer le Talend Trust Score™, vous pouvez créer une préparation à partir de ce jeu de données. Consultez Créer une préparation à partir du jeu de données.

Pour plus d'informations concernant les préparations, consultez le Guide d'utilisation de Talend Cloud Data Preparation.

Créer une préparation à partir du jeu de données

Procedure

  1. Dans Talend Cloud Data Inventory, allez dans l'onglet Datasets (Jeux de données).
    Votre liste de jeux de données est filtrée selon le filtre appliqué dans la section précédente.
  2. Passez votre curseur et cliquez sur l'icône Preparations (Préparations).
    Icône Preparations (Préparations) sélectionnée.
    L'assistant Preparations (Préparations) s'ouvre.
  3. Cliquez sur Add (Ajouter).
    Vous êtes redirigé·e vers Talend Cloud Data Preparation et la préparation est créée.

What to do next

Vous pouvez à présent configurer la préparation.

Configurer la préparation

About this task

Cet exemple vous fait utiliser les fonctions depuis Talend Cloud Data Preparation.

Procedure

  1. Pour corriger les noms de pays, utilisez la fonction de rapprochement flou.
    1. Sélectionnez la colonne : delivery_country.
    2. Dans le panneau de droite, sélectionnez Column et commencez à saisir fuzzy matching.
    3. Sélectionnez la fonction Standardize value (fuzzy matching) (Standardiser la valeur (rapprochement flou)).
    4. Configurez le seuil de rapprochement Match threshold à Default (Par défaut) (> 80%).
    5. Cliquez sur Submit. L'étape est ajoutée aux étapes de préparation dans le panneau de gauche et les noms de pays sont corrigés. Par exemple, United Staates est remplacé par United States.
  2. Pour convertir les codes pays, utilisez une fonction de conversion. La colonne delivery_country est toujours sélectionnée.
    1. Dans le panneau de droite, sélectionnez Column et commencez à saisir convert.
    2. Sélectionnez la fonction Convert country names and codes (Convertir des noms de pays et des codes pays).
    3. Configurez From (De) à ISO country code (Code pays ISO) et To (À) à English country name (Nom de pays anglais).
    4. Cliquez sur Submit. Les noms de pays sont convertis. Par exemple, CA est remplacé par Canada.
  3. Pour corriger le NIF, utilisez la fonctionnalité de lookup.
    Elle vous permet de rapprocher les données de la préparation courante à celles d'un jeu de données de référence. Pour plus d'informations, consultez Utilisation dynamique des données d'un autre jeu de données.
    Vous devez associer les colonnes qui correspondent.
    1. Sélectionnez la colonne : customer_id. Dans cet exemple, cette colonne est celle qui correspond.
    2. Cliquez sur l'icône de lookup au-dessus du panneau de droite.
      Icône Lookup sélectionnée.
      Le panneau Lookup s'ouvre à droite.
    3. Cliquez sur Select dataset (Sélectionner un jeu de données).
    4. Sélectionnez le jeu de données de référence et cliquez sur Select (Sélectionner). Vous êtes de retour dans le panneau Lookup et le jeu de données de référence est affiché sous la préparation.
      Panneau Lookup avec le jeu de données de référence affiché sous la préparation.
    5. Dans Current preparation (Préparation courante) et Lookup dataset (Jeu de données de lookup), sélectionnez customer_id.
    6. Sélectionnez la colonne du jeu de données de référence à ajouter à la préparation.
      Dans cet exemple, vous souhaitez corriger le NIF. Vous devez sélectionner customer_tax_id.
      customer_tax_id sélectionnée dans l'option Import columns (Importer des colonnes).
    7. Cliquez sur Submit. L'étape est ajoutée aux étapes de préparation dans le panneau de gauche.

Exécuter la préparation

Procedure

  1. Cliquez sur Run.
  2. Sélectionnez le jeu de données courant pour écrire en sortie les données préparées.
    Lorsque vous avez sélectionné le jeu de données, les paramètres supplémentaires (Additional parameters) s'affichent.
  3. Sélectionnez Update (Mise à jour) dans la liste Action.
  4. Dans le champ Operation keys (Clés des opérations), saisissez order_id.
  5. Sélectionnez (Create entry) (Créer l'entrée) et cliquez sur Next (Suivant).
    order_id affichée dans la liste déroulante Operation keys (Clés des opérations).
  6. Mappez customer_tax_id à customer_tin.
    customer_tax_id mappée vers custom_tin.

    Si la préparation contient davantage de colonnes que le jeu de données de référence, vous pouvez ne pas mapper certaines colonnes.

  7. Cliquez sur Next.
  8. Sélectionnez le profil d'exécution et cliquez sur Run (Exécuter).
    L'exécution de la préparation peut prendre plusieurs minutes. Vous pouvez voir la progression de l'exécution dans Run history (Historique des exécutions), au-dessus du panneau de droite.
    Bouton Run history (Historique de l'exécution) sélectionné.
  9. Pour voir les améliorations apportées à votre jeu de données, retournez dans Talend Cloud Data Inventory.

Consulter le nouveau Talend Trust Score™

Procedure

  1. Pour voir les améliorations de la préparation, ouvrez le jeu de données et actualisez l'échantillon dans la vue Sample (Échantillon).
    Bouton Refresh (Actualiser) dans la vue de l'échantillon de début (Head).
    Vous pouvez voir que les noms de pays sont tous corrects et que les NIF ont été renseignés.
  2. Pour voir les effets sur la qualité du jeu de données, allez dans la vue d'ensemble du jeu de données.
    Le Talend Trust Score™ est passé de 3.38/5 à 3.57/5.
    Illustration du Talend Trust Score™ de 3.57/5.

What to do next

Les règles de qualité de données vous permettant d'améliorer le Talend Trust Score™. Pour plus d'informations, consultez Gérer les règles de qualité de données.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.