Accéder au contenu principal Passer au contenu complémentaire

Créer des conditions "ou" sur des données numériques

Lorsque vous travaillez sur des jeux de données contenant des données numériques, vous pouvez utiliser un filtre pour isoler des lignes comprenant une valeur spécifique, ou sélectionner une plage de valeurs via le panneau Chart afin de créer le filtre correspondant. Cependant, pour créer un filtre retournant les lignes correspondant à une liste de valeurs, en d'autres termes un filtre "ou", vous devez procéder différemment. Vous devez créer une expression régulière rapprochant toutes les valeurs numériques de votre choix et filtrer les lignes correspondant à cette expression régulière.

Avec le jeu de données de ventes de voitures, pour l'exemple, vous allez créer un filtre affichant les ventes des voitures sorties à des dates spécifiques. Vous pourrez ensuite exporter les informations clients correspondant à ce filtre uniquement.

Ajout d'une préparation pour le jeu de données de ventes de voitures

Ajoutez une préparation afin de commencer à préparer et nettoyer vos données.

Vous pouvez créer une préparation à partir d'un jeu de données disponible dans Talend Cloud Data Preparation ou dans l'un de vos fichiers locaux. Lorsque vous ajoutez une préparation via le bouton correspondant, elle sera créée dans le dossier dans lequel vous travaillez actuellement. De plus, votre préparation sera automatiquement sauvegardée dans la liste des préparations et toutes les modifications effectuées sur cette préparation seront également automatiquement sauvegardées.

Before you begin

Vous avez créé le jeu de données car_dealership dans Talend Cloud Data Preparation en utilisant le fichier précédemment téléchargé.

Procedure

  1. Dans la page d'accueil, cliquez sur Preparations pour ouvrir la liste des préparations.
  2. Cliquez sur le bouton Add Preparation (Ajouter une préparation).
  3. Dans la liste Datasets (Jeux de données), sélectionnez car_dealership pour l'utiliser comme matériel source.
    Fenêtre Add a preparation (Ajouter une préparation) avec la liste des jeux de données disponibles pour la création d'une préparation, notamment car_dealership.
    Le champ Preparation name (Nom de la préparation) est automatiquement renseigné mais vous pouvez modifier le nom de la préparation.
  4. Cliquez sur Submit.

Results

Votre jeu de données s'ouvre, avec une recette vide. Toutes vos modifications sont automatiquement sauvegardées.

Créer une expression régulière pour rapprocher les années des voitures

Vous allez créer une expression régulière pour rapprocher toutes les dates qui vous intéressent, à savoir 1950, 1960, 1970, 1980, 1990, 2000 et 2010.

Procedure

  1. Cliquez sur l'en-tête de la colonne car_year pour sélectionner son contenu.
  2. Dans le panneau des fonctions, à droite de l'écran, saisissez Match pattern (Correspondre au modèle) et cliquez sur le résultat pour ouvrir les options de la fonction associée.
  3. Dans la liste Pattern, sélectionnez Other (Autre).
  4. Dans la liste déroulante Manual pattern, sélectionnez RegEx.
  5. Dans le champ Manual pattern, saisissez l'expression régulière suivante :
    ^1950$|^1960$|^1970$|^1980$|^1990$|^2000$|^2010$

    Cette expression rapproche toutes les lignes avec des ventes concernant des voitures des années 1950, 1960, 1970, etc.

  6. Cliquez sur Submit.

Results

Une nouvelle colonne est créée, dans laquelle les lignes correspondant à l'expression régulière sont marquées comme true. Celles ne correspondant pas sont marquées comme false.
Une colonne est ajoutée à la préparation pour indiquer si les valeurs correspondent à l'expression.

Filtrer sur ces valeurs pour créer une condition "ou"

À présent que vous savez quelles lignes correspondent à l'expression régulière, vous pourrez toutes les récupérer en créant un filtre sur cette nouvelle colonne.

Procedure

  1. Cliquez sur l'en-tête de la colonne car_year_matching pour sélectionner son contenu.
    Dans la zone de profiling de données, en bas à droite de l'écran, vous pouvez voir un diagramme à barres horizontales affichant le nombre d'occurrences des valeurs true et false dans la colonne. Placez votre curseur que chaque barre pour afficher le nombre exact d'occurrences.
    Diagramme à barres affichant la répartition des valeurs true et false.
  2. Pour créer le filtre, cliquez sur la barre true.
    Vous pouvez constater, dans la barre de filtre, qu'un nouveau filtre a été appliqué sur le jeu de données. Les données clients sont affichées uniquement si elles correspondent à la condition définie par l'expression régulière.
    Un filtre est appliqué, pour n'afficher que les lignes ayant la valeur true.

Results

Avec ce filtre basé sur différentes valeurs numériques à la fois, vous avez isolé les ventes concernant des voitures des années spécifiées. De là, vous pouvez appliquer n'importe quelle fonction et travailler sur cet échantillon uniquement.

Exporter les lignes filtrées

Maintenant que vous avez votre liste restreinte de clients, vous allez l'exporter comme fichier local.

Procedure

  1. Cliquez sur le bouton Export (Exporter).
  2. Sélectionnez le bouton radio All data et assurez-vous d'avoir activé l'option Apply filters.
    Ainsi, l'export comprend toutes les lignes correspondant potentiellement au filtre, même au-delà de l'échantillon si votre jeu de données est plus volumineux.
  3. Choisissez le format de fichier à utiliser pour exporter vos données.
    • Si vous choisissez Local CSV file, choisissez le séparateur, ainsi que les caractères d'échappement et d'entourage du texte à utiliser et saisissez un nom pour le fichier à exporter.
    • Si vous choisissez Local XLSX file (Fichier XLSX local), choisissez un nom pour le fichier à exporter.
    • Si vous choisissez Amazon S3, saisissez vos identifiants et autres informations afin de stocker votre fichier sur Amazon S3.

Results

Les données nettoyées à l'aide de votre préparation sont exportées dans un fichier local.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.