Accéder au contenu principal Passer au contenu complémentaire

Préparation des données clients à charger dans une solution marketing

Le jeu de données Customer Contact Data représente un fichier contenant une liste de client·es avec différentes informations telles que leur nom, leur entreprise ou leur pays.

Vous allez préparer ce jeu de données pour pouvoir le charger dans une solution marketing.

Téléchargez le fichier : customer_contact_data.csv.

Ajout d'une préparation pour le jeu de données Customers Contact Data

Ajoutez une préparation afin de commencer à préparer et nettoyer vos données.

Vous pouvez créer une préparation à partir d'un jeu de données disponible dans Talend Data Preparation ou dans l'un de vos fichiers locaux. Lorsque vous ajoutez une préparation via le bouton correspondant, elle sera créée dans le dossier dans lequel vous travaillez actuellement. De plus, votre préparation sera automatiquement sauvegardée dans la liste des préparations, et toutes les modifications seront également sauvegardées automatiquement.

Before you begin

Vous avez créé le jeu de données customer_contact_data dans Talend Cloud Data Preparation en utilisant le fichier précédemment téléchargé.

Procedure

  1. Dans la page d'accueil, cliquez sur Preparations pour ouvrir la liste des préparations.
  2. Cliquez sur le bouton Add Preparation (Ajouter une préparation).
  3. Dans la liste Datasets (Jeux de données), sélectionnez customer_contact_data pour l'utiliser comme matériel source.
    Fenêtre Add a preparation (Ajouter une préparation) avec la liste des jeux de données disponibles pour la création d'une préparation, notamment customer_contact_data.
    Le champ Preparation name (Nom de la préparation) est automatiquement renseigné mais vous pouvez modifier le nom de la préparation.
  4. Cliquez sur Submit.

Results

Votre jeu de données s'ouvre, avec une recette vide. Toutes vos modifications sont automatiquement sauvegardées.

Supprimer les lignes vides et invalides des données client·es

Vous pouvez supprimer toutes les entrées vides et invalides d'un jeu de données en une fois.

Comme vous pouvez le voir dans la barre de statistiques sous chaque colonne, customer_contact_data.csv contient plusieurs lignes avec des cellules vides ou invalides. Vous allez supprimer toutes ces lignes. Utiliser la barre de statistiques est un moyen rapide de supprimer des enregistrements vides et invalides pour une colonne donnée, mais vous souhaitez effectuer cette opération sur le jeu de données complet.

Colonnes de la grille ayant une barre de statistiques indiquant des cellules invalides ou vides.

Procedure

  1. Cliquez sur l'icône de menu en haut à gauche de la grille.
  2. Sélectionnez Display rows with invalid or empty values (Afficher les lignes ayant des valeurs non valides ou vides).
    Options de filtre pour les lignes vides et invalides dans le jeu de données entier.

    Vous avez appliqué un filtre sur vos données et seules les valeurs vides et invalides présentes dans le jeu de données sont affichées.

  3. Dans le panneau des fonctions, saisissez Delete these filtered rows et cliquez sur le résultat pour appliquer la fonction associée.

    Assurez-vous de sélectionner le bouton radio Filtered Rows (Lignes filtrées), devant le champ Apply changes to (Appliquer des modifications sur).

    Les lignes contenant des entrées vides ou invalides sont supprimées du jeu de données.

  4. Dans la barre de filtre, cliquez sur l'icône représentant une poubelle pour annuler le filtre et afficher à nouveau le jeu de données complet.

Results

Toutes les lignes contenant des enregistrements vides sont supprimées du jeu de données et la barre de statistiques de chaque colonne est entièrement verte.

Extraire les parties locale et de domaine des adresses e-mail.

Une adresse e-mail, comme user@talend.com, se compose de deux parties séparées par le symbole @ : la partie locale (user dans cet exemple) et la partie du domaine (talend.com dans cet exemple).

Les deux parties d'une adresse e-mail peuvent être extraites et copiées dans deux nouvelles colonnes.

Vous allez extraire les deux parties des adresses e-mail afin de les charger plus facilement dans la solution marketing.

Procedure

  1. Sélectionnez la colonne email.
  2. Dans le panneau des fonctions, saisissez Extract email parts (Extraire des parties d'adresses e-mail).
    Aperçu de la fonction Extract email parts (Extraire des parties d'adresses e-mail) dans laquelle la colonne email est scindée en deux parties.
  3. Cliquez sur le bouton Submit (Soumettre) pour exécuter la fonction Extract email parts (Extraire des parties d'adresses e-mail).

Results

La partie locale et la partie du domaine sont extraites des adresses e-mail. Les données extraites sont placées dans deux nouvelles colonnes.

Supprimer les espaces blancs des noms de clients

Des espaces blancs peuvent se trouver avant et après le contenu de chaque cellule.

Cela est particulièrement vrai lorsqu'il s'agit de colonnes contenant des données saisies manuellement, comme un nom ou un numéro de téléphone. Ces espaces sont affichés comme carrés gris.

Vous pouvez voir que la colonne first_name contient des entrées ayant des espaces blancs.

Données contenant des espaces blancs.

Procedure

  1. Sélectionnez la colonne first_name.
  2. Dans le panneau des fonctions, saisissez Remove trailing and leading characters, puis cliquez sur le résultat pour ouvrir les options de la fonction associée.
  3. Dans la liste déroulante Padding character, sélectionnez Whitespace et cliquez sur Submit (Soumettre).

    Vous avez la possibilité de cocher la case Create new column (Créer une nouvelle colonne) pour que le résultat de la fonction s'affiche dans une nouvelle colonne.

  4. Répétez cette action pour chaque colonne contenant des espaces blancs.

Results

Les espaces blancs sont supprimés de la colonne sélectionnée.

Exporter les données nettoyées

Une fois la préparation achevée, vous pouvez décider d'exporter les données nettoyées.

Vous avez nettoyé les lignes vides et invalides de votre jeu de données, supprimé les espaces blancs inutiles et extrait les informations relatives aux adresses e-mail des client·es. Le jeu de données préparé est à présent compatible avec votre solution marketing et vous pouvez l'exporter.

Procedure

  1. Cliquez sur le bouton Export (Exporter).
  2. Choisissez le format de fichier à utiliser pour exporter vos données.
    • Si vous choisissez Local CSV file, choisissez le séparateur, ainsi que les caractères d'échappement et d'entourage du texte à utiliser et saisissez un nom pour le fichier à exporter.
    • Si vous choisissez Local XLSX file (Fichier XLSX local), choisissez un nom pour le fichier à exporter.
    • Si vous choisissez Amazon S3, saisissez vos identifiants et autres informations afin de stocker votre fichier sur Amazon S3.

Results

Les données nettoyées à l'aide de votre préparation sont exportées dans un fichier local.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.