Accéder au contenu principal Passer au contenu complémentaire

Filtrer une liste de clients en se basant sur leur date d'inscription et leur salaire

Un pipeline complexe incluant un jeu de données source, deux processeurs Filter et trois destinations.

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion à une base de données.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Téléchargez et extrayez le fichier filter-python-customers.zip. Il contient une liste de client·es ayant un champ relatif à leur date d'inscription. Vous pouvez trouver ce fichier en pièce jointe à ce document.

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, les fichiers sont stockés dans HDFS.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Filter on Registration and Revenue
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau permettant de sélectionner vos données source, ici une liste de clients, stockée dans une base de données.

    Exemple

    Aperçu d'un échantillon de données concernant des client·es.
  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur le bouton + et ajoutez un processeur Filter au pipeline. Le panneau de Configuration s’affiche.
  6. Donnez un nom significatif au processeur.

    Exemple

    customers registered in 2000
  7. Dans la zone Filters (Filtres) :
    1. Sélectionnez .RegistrationDate dans la liste Input,pour filtrer les clients en se basant sur cette valeur.
    2. Sélectionnez None dans la liste Optionally select a function to apply, car vous ne souhaitez pas appliquer de fonction lors du filtre des enregistrements.
    3. Sélectionnez Contains dans la liste Operator et saisissez 2000 dans la liste Value, puisque vous souhaitez filtrer les clients dont la date d'inscription contient l'année 2000.

      Vous pouvez utiliser la syntaxe avpath dans cette zone.

  8. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.
  9. Cliquez à nouveau sur le bouton + et ajoutez un autre processeur Filter au pipeline. Le panneau de Configuration s’affiche.
  10. Donnez un nom significatif au processeur.

    Exemple

    customers with revenue > 90000
  11. Dans la zone Filters (Filtres) :
    1. Sélectionnez .Revenue dans la liste Input, pour filtrer les clients en se basant sur cette valeur.
    2. Sélectionnez None dans la liste Optionally select a function to apply, car vous ne souhaitez pas appliquer de fonction lors du filtre des enregistrements.
    3. Sélectionnez > dans la liste Operator et saisissez 90000 dans la liste Value, puisque vous souhaitez filtrer les clients ayant un revenu supérieur à 90000.
  12. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.
  13. Cliquez sur le bouton Doesn't match filter (Ne correspond pas au filtre) près du premier processeur Filter pour ajouter et sélectionner le jeu de données qui contiendra les données qui ne répondent pas aux critères de filtre.
  14. Donnez un nom significatif à la Destination.

    Exemple

    other registration date
  15. Cliquez sur l'élément ADD DESTINATION près du processeur Filter et sélectionnez le jeu de données qui contiendra les données ne correspondant pas aux critères de filtre.
    Renommez-le si nécessaire.
  16. Cliquez sur le bouton Doesn't match filter (Ne correspond pas au filtre) près du second processeur Filter et sélectionnez le jeu de données qui contiendra vos données rejetées.
  17. Donnez un nom significatif à la Destination.

    Exemple

    other customers
  18. (Facultatif) Consultez l'aperçu du processeur Filter pour voir les données après l'opération de filtre.
    Aperçu du processeur Filter processor après application de l'opération de filtre.
  19. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
  20. Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d’exécution, les données sont filtrées selon les conditions spécifiées et la sortie est envoyée vers le système cible que vous avez indiqué.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.