Accéder au contenu principal Passer au contenu complémentaire

Nouvelle création d'adresses e-mail avant chargement dans une solution marketing

Le jeu de données Marketing leads représente un fichier reçu d'une campagne marketing où les adresses e-mails sont manquantes.

Pour que ce fichier soit chargé dans votre solution marketing, vous devez créer ces adresses e-mail. Vous allez les deviner à partir du nom, de l'entreprise des prospects et du format d'adresse e-mail généralement utilisé par ces entreprises.

Téléchargez les fichiers marketing_leads.zip et emails_reference.zip.

Ajout d'une préparation pour le jeu de données Marketing leads

Ajoutez une préparation afin de commencer à préparer et nettoyer vos données.

Vous pouvez créer une préparation à partir d'un jeu de données disponible dans Talend Data Preparation ou dans l'un de vos fichiers locaux. Lorsque vous ajoutez une préparation via le bouton correspondant, elle sera créée dans le dossier dans lequel vous travaillez actuellement. De plus, votre préparation sera automatiquement sauvegardée dans la liste des préparations et toutes les modifications effectuées sur cette préparation seront également automatiquement sauvegardées.

Before you begin

Vous avez créé le jeu de données marketing_leads dans Talend Cloud Data Preparation en utilisant le fichier précédemment téléchargé.

Procedure

  1. Dans la page d'accueil, cliquez sur Preparations pour ouvrir la liste des préparations.
  2. Cliquez sur le bouton Add Preparation (Ajouter une préparation).
  3. Dans la liste Datasets (Jeux de données), sélectionnez marketing_leads pour l'utiliser comme matériel source.
    Fenêtre Add a preparation (Ajouter une préparation) avec la liste des jeux de données disponibles pour la création d'une préparation, notamment marketing_leads.
    Le champ Preparation name (Nom de la préparation) est automatiquement renseigné mais vous pouvez modifier le nom de la préparation.
  4. Cliquez sur Submit.

Results

Votre jeu de données s'ouvre, avec une recette vide. Toutes vos modifications sont automatiquement sauvegardées.

Suppression d'enregistrements vides d'un jeu de données

La partie grise de la barre de statistiques indique qu'une colonne contient des enregistrements vides. Vous pouvez supprimer ces lignes contenant des enregistrements vides.

Colonnes de la grille ayant une barre de statistiques indiquant des cellules vides.

Dans la barre de statistiques, les données qui correspondent au type de la colonne apparaissent en vert, tandis que les données invalides, qui ne correspondent pas au type de la colonne apparaissent en rouge.

Procedure

  1. Dans la colonne first_name, cliquez sur la partie grise de la barre de statistiques.
  2. Cliquez sur Delete the rows with empty cell (Supprimer les lignes ayant une cellule vide) pour supprimer les lignes contenant des données manquantes.

    Vous pouvez effectuer cette action pour toute colonne donnée, mais il y a un moyen plus simple de supprimer toutes les lignes vides de votre jeu de données.

  3. En haut à gauche de la grille, cliquez sur la flèche blanche et sélectionnez Display rows with empty values (Sélectionner les lignes ayant des valeurs vides).

    Cette action applique un filtre sur toutes les entrées vides du jeu de données.

    Le filtre rows with empty values (lignes avec des valeurs vides) est appliqué au jeu de données.
  4. Dans le panneau des fonctions, en haut à droite de votre écran, saisissez Delete these filtered rows et cliquez sur le résultat pour exécuter la fonction associée.

    Les lignes restantes contenant des cellules vides sont supprimées du jeu de données.

  5. Dans la barre de filtre, cliquez sur l'icône représentant une poubelle pour annuler le filtre et afficher à nouveau le jeu de données complet.

Results

Toutes les lignes contenant des enregistrements vides sont supprimées du jeu de données et la barre de statistiques de chaque colonne est entièrement verte.

Supprimer les espaces blancs des noms de prospects

Des espaces blancs peuvent se trouver avant et après le contenu de chaque cellule.

Cela est particulièrement vrai lorsqu'il s'agit de colonnes contenant des données saisies manuellement, comme un nom ou un numéro de téléphone. Ces espaces sont affichés comme carrés gris.

Vous pouvez voir que les colonnes first_name et last_name contiennent des entrées ayant des espaces blancs.

Données contenant des espaces blancs.

Procedure

  1. Sélectionnez la colonne first_name.
  2. Tout en appuyant sur la touche Ctrl, cliquez sur l'en-tête de la colonne last_Name.

    Les deux colonnes sont maintenant sélectionnées et vous pouvez leur appliquer une fonction en une seule action.

  3. Dans le panneau des fonctions, saisissez Remove trailing and leading characters, puis cliquez sur le résultat pour ouvrir les options de la fonction associée.
  4. Dans la liste déroulante Padding character, sélectionnez Whitespace et cliquez sur Submit (Soumettre).

    Vous avez la possibilité de cocher la case Create new column (Créer une nouvelle colonne) pour que le résultat de la fonction s'affiche dans une nouvelle colonne.

Results

Les espaces blancs sont supprimés des colonnes sélectionnées.

Duplication de colonnes

Si vous souhaitez une copie d'une colonne donnée, vous pouvez dupliquer cette colonne.

Vous allez dupliquer deux colonnes et les utiliser comme base pour recréer les adresses e-mail.

Procedure

  1. Cliquez sur la colonne à dupliquer, first_name dans cet exemple.
  2. Cliquez sur l'icône de menu ou cliquez-droit sur la colonne pour ouvrir le menu contextuel.
  3. Cliquez sur Duplicate column (Dupliquer la colonne).
    Le menu de la colonne First Name est ouvert, avec l'option Duplicate column (Dupliquer la colonne) sélectionnée.

    Une copie de la colonne, first_name_copy, est créée, avec les mêmes données que la colonne originale.

  4. Répétez ces actions pour dupliquer la colonne last_name.

Results

Les deux colonnes sont dupliquées. Les informations contenues dans ces deux colonnes seront utilisées pour créer la partie locale des adresses e-mail à créer.

Renommage de colonnes

Pour mieux identifier une colonne, vous pouvez la renommer.

Vous allez renommer les deux colonnes précédemment créées et leur donner un nom significatif. Ces nouvelles colonnes seront utilisées pour créer la partie locale des adresses e-mail.

Procedure

  1. Cliquez sur la colonne que vous souhaitez renommer, first_name_copy dans cet exemple.
  2. Utilisez l'option Rename column (Renommer la colonne) du menu contextuel de la colonne.
    Le menu de la colonne fisrt_name_copy est ouvert, avec l'option Rename column (Renommer la colonne) sélectionnée.
  3. Saisissez email_first_name comme nouveau nom de colonne et appuyez sur Entrée pour l'appliquer.
  4. Répétez ces étapes pour renommer la colonne last_name_copy en email_last_name.

Results

Les colonnes sélectionnées sont renommées.

Mettre les noms en minuscules

Parfois, vous devez modifier la casse de certains textes et les passer en minuscules. Cela peut être utile si vous souhaitez écrire ce texte à la suite d'un autre texte.

Les données contenues dans les deux colonnes renommées commencent par une majuscule. Vous allez mettre tout le texte en minuscules, afin de fusionner les deux colonnes.

Deux colonnes contenant des noms en majuscules.

Procedure

  1. Sélectionnez la colonne contenant le texte que vous souhaitez passer en minuscules, email_first_name dans cet exemple.
  2. Dans le panneau des fonctions, saisissez Change to lower case et cliquez sur le résultat pour exécuter la fonction associée.

    Vous avez la possibilité de cocher la case Create new column (Créer une nouvelle colonne) pour que le résultat de la fonction s'affiche dans une nouvelle colonne.

  3. Répétez ces étapes pour passer la colonne email_last_name en minuscules.

Results

Le texte contenu dans les deux colonnes est à présent en minuscules.
Deux colonnes contenant des noms en minuscules.

Utiliser les domaines d'e-mail d'un autre jeu de données

La fonctionnalité de lookup rapproche des données du jeu de données courant de leur équivalent dans le jeu de données de référence.

D'un côté, vous avez le jeu de données marketing_leads, sur lequel vous travaillez qui contient des informations relatives à l'entreprise où travaillent les client·es listé·es. De l'autre côté, emails_reference contient une liste d'entreprises et le domaine d'e-mail qu'elles utilisent.

Vous allez effectuer un lookup sur le jeu de données emails_reference et extraire les informations concernant les domaines des adresses e-mail afin de les rapprocher des entreprise du jeu de données marketing_leads.

Before you begin

Pour effectuer une opération de lookup sur emails_reference, vous devez l'importer à l'aide du bouton Add dataset (Ajouter un jeu de données), dans la vue Datasets (Jeux de données) de la page d'accueil.

Jeu de données Emails reference visible dans la vue Datasets (Jeux de données).

Procedure

  1. Ouvrez la préparation marketing_leads.
  2. Cliquez sur le bouton de lookup dans la partie supérieure droite de l'écran pour ouvrir le panneau de lookup.
    Curseur pointant sur le bouton Lookup.
  3. Cliquez sur Select dataset (Sélectionner un jeu de données) pour sélectionner un jeu de données existant.
    Première étape du menu de configuration du lookup.
  4. Sélectionnez le jeu de données à utiliser pour effectuer le lookup, ici le jeu de données emails_reference.
  5. Dans les listes déroulantes Current preparation (Préparation courante) et Lookup dataset (Jeu de données de lookup), sélectionnez les colonnes correspondant à celles de votre préparation principale et de votre jeu de données de référence, les colonnes company et company_name dans cet exemple.
    Pour effectuer un lookup, au moins une colonne avec des données correspondantes doit être présente dans la préparation et le jeu de données à mélanger.
    Deuxième étape du menu de configuration du lookup.
  6. Dans la liste déroulante Columns to add (Colonnes à ajouter), sélectionnez la colonne contenant les adresses e-mail, afin de l'ajouter au jeu de données courant, la colonne email_domain dans cet exemple.
    Troisième étape du menu de configuration du lookup.
  7. Choisissez d'appliquer ces modifications uniquement sur les lignes filtrées ou sur toutes les lignes.
  8. Cliquez sur Submit (Soumettre) pour appliquer les modifications.

Results

La colonne email_domain est ajoutée au jeu de données marketing_leads, à côté de la colonne company.
Vue Grille du jeu de données incluant la colonne email_domain.

Ces informations concernant les domaines d'adresses e-mail seront ajoutées aux prénoms et noms de famille des colonnes dupliquées, afin de créer des adresses e-mail complètes.

Fusion du contenu de plusieurs colonnes

Dans certains cas, les données que vous souhaitez utiliser sont divisées en plusieurs colonnes. Vous pouvez grouper ces colonnes en utilisant la concaténation.

Toutes les informations dont vous avez besoin pour créer les adresses e-mail sont prêtes et vous devez seulement les assembler. Vous allez fusionner les trois colonnes créées depuis le début de ce scénario.

Les trois colonnes à fusionner

Procedure

  1. Sélectionnez la colonne email_first_name.
    Lorsque vous fusionnez plusieurs colonnes, celle que vous sélectionnez au début, email_first_name dans ce cas, sera la première partie de la colonne fusionnée qui sera créée.
  2. Dans le panneau des fonctions, saisissez Concatenate with et cliquez sur le résultat pour afficher les options de la fonction associée.
  3. Configurez la fonction comme suit :
    • Cochez la case Create new column (Créer une colonne).
    • Laissez le champ Prefix (Préfixe) vide.
    • Dans le champ Use with (Utiliser avec), sélectionnez Other column (Autre colonne).
    • Dans le champ Column (Colonne), sélectionnez email_last_name.
    • Dans le champ Separator (Séparateur), saisissez ..
    • Dans le champ Add separator (Ajouter un séparateur), sélectionnez Both values not empty (Les deux valeurs ne sont pas vides).

    Vous ne pouvez concaténer que deux colonnes en même temps. Commencez par fusionner la colonne email_first_name et la colonne email_last_name, avec un séparateur ..

  4. Cliquez sur Submit (Soumettre) pour appliquer la fonction.

    Une nouvelle colonne est créée, avec le contenu fusionné des deux colonnes.

  5. Procédez de la même manière pour fusionner la colonne créée et la colonne email_domain, cette fois en utilisant le symbole @ comme séparateur.

Results

Le contenu des trois colonnes a été fusionné. Vous avez créé une colonne contenant les adresses e-mail valides, basées sur les prénoms, les noms et un domaine Web pour chaque entreprise.

Colonne de résultat avec les nouvelles adresses e-mail.

Supprimer la colonne en doublon

Si vous souhaitez supprimer une colonne dont vous n'avez pas besoin, vous pouvez.

Vous avez utilisé les colonnes pour la concaténation, vous pouvez les supprimer et conserver uniquement le résultat.

Procedure

  1. Cliquez sur la colonne que vous souhaitez supprimer, email_first_name par exemple.
  2. Cliquez sur l'icône de menu ou cliquez-droit sur la colonne pour ouvrir le menu contextuel.
  3. Cliquez sur Delete column (Supprimer la colonne).
    Le menu de la colonne email_first_name est ouvert, avec l'option Delete column (Supprimer la colonne) sélectionnée.
  4. Procédez de la même manière pour supprimer les colonnes email_last_name et email_domain.

Results

Les colonnes sélectionnées sont supprimées.

Exporter les adresses e-mail préparées

Une fois la préparation achevée, vous pouvez décider d'exporter les données nettoyées.

Vous avez préparé votre jeu de données pour recréer les informations manquantes d'origine, les adresses e-mail des client·es dans ce cas.

Procedure

  1. Cliquez sur le bouton Export (Exporter).
  2. Choisissez le format de fichier à utiliser pour exporter vos données.
    • Si vous choisissez Local CSV file, choisissez le séparateur, ainsi que les caractères d'échappement et d'entourage du texte à utiliser et saisissez un nom pour le fichier à exporter.
    • Si vous choisissez Local XLSX file (Fichier XLSX local), choisissez un nom pour le fichier à exporter.
    • Si vous choisissez Amazon S3, saisissez vos identifiants et autres informations afin de stocker votre fichier sur Amazon S3.

Results

Les données nettoyées à l'aide de votre préparation sont exportées dans un fichier local.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.