Accéder au contenu principal Passer au contenu complémentaire

Comparer le nombre d'accidents d'avion et filtrer les compagnies aériennes

Un pipeline avec une source de test, un processeur Numbers, un processeur Filter et une destination Test.

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion de test.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Téléchargez et extrayez le fichier numbers-airlines.zip. Il contient un jeu de données relatives aux compagnies aériennes, avec notamment le nombre d'incidents et d'accidents, ainsi que le nombre de morts.

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un jeu de données Test.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Compare number of air crashes and filter airlines
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici les données relatives aux compagnies aériennes et aux crashs d'avions.

    Exemple

    Aperçu d'un échantillon de données concernant des compagnies aériennes et des crashs d'avion.
  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur le bouton + et ajoutez un processeur Number au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    compare number of fatal accidents
  7. Dans la zone Configuration :
    1. Sélectionnez Compare numbers dans la liste Function name.
    2. Sélectionnez .fatal_accidents_85_99 dans la liste Fields to process puisque vous souhaitez comparer cette valeur de champ (nombre d'accidents fatals) à votre valeur personnalisée.
    3. Activez l'option Create new column et nommez la colonne comparison.
    4. Sélectionnez greater or equals than dans la liste Compare mode, sélectionnez Value dans la liste Use with et saisissez 2 dans le champ Value. Vous pouvez comparer le nombre d'accidents fatals par compagnie aérienne et voir lesquelles ont subi au moins deux accidents fatals.
  8. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Vous pouvez prévisualiser vos données avant et après la comparaison.

    Les valeurs ont été comparées et un nouveau champ vous permet d'afficher les compagnies aériennes ayant subi au moins deux accidents fatals (true) et celles en ayant subi moins (false).

    Aperçu du processeur Numbers après application d'une règle de comparaison sur le nombre d'accidents.
  9. Cliquez sur le bouton + et ajoutez un processeur Filter au pipeline. Le panneau de configuration s'ouvre.
  10. Donnez un nom significatif au processeur.

    Exemple

    airlines with at least 2 fatal accidents
  11. Dans la zone Filters (Filtres) :
    1. Sélectionnez .comparison dans la liste Input, pour filtrer les compagnies aériennes en se basant sur cette valeur.
    2. Sélectionnez None dans la liste Optionally select a function to apply, car vous ne souhaitez pas appliquer de fonction lors du filtre des enregistrements.
    3. Sélectionnez == dans la liste Operator et saisissez true dans la liste Value, car vous souhaitez filtrer sur les compagnies aériennes ayant subi plusieurs accidents fatals.
  12. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération.

    Aperçu du processeur Filter après application d'un filtre sur les valeurs 'true'.
  13. Cliquez sur ADD DESTINATION (AJOUTER UNE DESTINATION) et sélectionnez le jeu de données qui contiendra les données traitées.
    Renommez-le si nécessaire.
  14. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
  15. Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution, les données sont comparées et filtrées selon les conditions définies. Vous pouvez voir que 19 compagnies aériennes ont subi plusieurs accidents fatals. La sortie est envoyée dans le système cible indiqué.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.