Accéder au contenu principal Passer au contenu complémentaire

Répliquer une liste de prospects et traiter les deux flux de sortie différemment

Un pipeline avec une source, un processeur Replicate, un processeur Filter et deux destinations.

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion à une base de données.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Téléchargez et extrayez le fichier filter-python-customers.zip. Il contient les données des prospects, notamment leur ID, leur nom ou leur salaire.

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un fichier stocké dans Amazon S3 et un fichier stocké dans HDFS.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Replicate and Process Leads
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici une liste de prospects.
  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur le bouton + et ajoutez un processeur Replicate au pipeline. Le flux est dupliqué et le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    replicate leads
  7. Cliquez sur l'élément ADD DESTINATION en haut du pipeline pour ouvrir le panneau vous permettant de sélectionner le jeu de données qui contiendra les données dans le Cloud (Amazon S3).
  8. Donnez un nom significatif à la Destination.

    Exemple

    store in cloud
  9. Cliquez sur + près de l'élément ADD DESTINATION (Ajouter une destination) au bas du pipeline et ajoutez un processeur Filter.
  10. Donnez un nom significatif au processeur.

    Exemple

    filter on lead revenues
  11. Dans la zone Filters (Filtres) :
    1. Sélectionnez .Revenue dans la liste Input, pour filtrer les prospects en se basant sur cette valeur.
    2. Sélectionnez None dans la liste Optionally select a function to apply, car vous ne souhaitez pas appliquer de fonction lors du filtre des enregistrements.
    3. Sélectionnez >= dans la liste Operator et saisissez 70000 dans la liste Value, puisque vous souhaitez filtrer les prospects ayant un salaire supérieur à 70 000 dollars.
  12. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.
  13. (Facultatif) Consultez l'aperçu du processeur Filter pour voir les données après l'opération de filtre.

    Exemple

    Aperçu du processeur Filter après filtrage sur les enregistrements liés aux salaires supérieurs à 70 000 dollars.
  14. Cliquez sur l'élément ADD DESTINATION au bas du pipeline pour ouvrir le panneau vous permettant de sélectionner le jeu de données qui contiendra vos données on-premises (HDFS) et donnez-lui un nom significatif.

    Exemple

    store on premises
  15. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
  16. Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d’exécution, les enregistrements sont dupliqués et filtrés et les flux de sortie sont envoyés dans les systèmes cible définis.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.