Accéder au contenu principal Passer au contenu complémentaire

Créer des conditions "ou" sur des villes

Pour créer une condition, ou un filtre sur plusieurs valeurs textuelles en même temps, comme des villes, vous pouvez utiliser le panneau Chart pour sélectionner plusieurs valeurs. Vous pouvez également utiliser les flèches pour naviguer plus loin que les 10 premiers résultats. Cependant, les statistiques des diagrammes se basent uniquement sur l'échantillon de 10 000 lignes. Si votre jeu de données est plus volumineux, comme le jeu de données des vendeurs de voitures, il est possible que vous ratiez des enregistrements potentiels hors de cet échantillon. Si vous souhaitez vous assurer que votre filtre retourne toutes les lignes correspondantes, vous devez procéder différemment. Vous devez créer une expression régulière rapprochant toutes les valeurs textuelles de votre choix, filtrer les lignes correspondant à cette expression régulière et utiliser la fonctionnalité Fetch more afin de récupérer les autres lignes correspondant à ce filtre.

Avec le jeu de données des vendeurs de voitures précédemment importé, vous allez créer une nouvelle préparation et un filtre pour afficher les ventes effectuées dans les cinq plus grandes villes de France.

Créer une expression régulière pour rapprocher les villes

Vous allez créer une expression régulière pour rapprocher toutes les villes de votre choix, en d'autres termes les cinq plus grandes villes de France : Paris, Lyon, Marseille, Toulouse et Bordeaux.

Procedure

  1. Cliquez sur l'en-tête de la colonne city pour sélectionner son contenu.
  2. Dans le panneau des fonctions, à droite de l'écran, saisissez Match pattern (Correspondre au modèle) et cliquez sur le résultat pour ouvrir les options de la fonction associée.
  3. Dans la liste Pattern, sélectionnez Other (Autre).
  4. Dans la liste déroulante Manual pattern, sélectionnez RegEx.
  5. Dans le champ Manual pattern, saisissez l'expression régulière suivante :
    ^Paris$|^Marseille$|^Lyon$|^Toulouse$|^Bordeaux$

    Cette expression rapproche toutes les ventes effectuées dans ces cinq villes.

  6. Cliquez sur Submit.

Results

Une nouvelle colonne est créée, dans laquelle les lignes correspondant à l'expression régulière sont marquées comme true. Celles ne correspondant pas sont marquées comme false.
Nouvelle colonne ajoutée à la préparation, indiquant si les valeurs correspondent à l'expression.

Filtrer les valeurs correspondantes

À présent que vous savez quelles lignes correspondent à l'expression régulière, vous pourrez toutes les récupérer en créant un filtre sur cette nouvelle colonne.

Procedure

  1. Cliquez sur l'en-tête de la colonne city_matching pour sélectionner son contenu.
    Dans la zone de profiling de données, en bas à droite de l'écran, vous pouvez voir un diagramme à barres horizontales affichant le nombre d'occurrences des valeurs true et false dans la colonne. Placez votre curseur que chaque barre pour afficher le nombre exact d'occurrences.
    Diagramme à barres affichant la répartition des valeurs true et false.
  2. Pour créer le filtre, cliquez sur la barre true.
    Vous pouvez constater, dans la barre de filtre, qu'un nouveau filtre a été appliqué sur le jeu de données. Les données clients sont affichées uniquement si elles correspondent à la condition définie par l'expression régulière.

Results

Avec ce filtre basé sur différentes valeurs, vous avez isolé les ventes concernant des clients des villes spécifiées. Cependant, parmi les cinq valeurs que vous recherchiez, seules quatre ont été récupérées et aucune ligne ne contient Paris dans le jeu de données. Vous allez à présent vérifier si le filtre correspond potentiellement à plus de lignes au-delà de votre échantillon.

Récupérer plus de valeurs pour les villes correspondantes

Le filtre précédemment créé n'a pas retourné toutes les villes de votre choix, vous allez donc récupérer plus de lignes correspondant potentiellement, au-delà de l'échantillon.

Procedure

En haut à droite de la grille, cliquez sur Fetch more.
Le bouton Fetch more (En récupérer plus) est disponible en haut à droite de la grille.
La boîte de dialogue Fetch additional rows (Récupérer des lignes supplémentaires) s'ouvre, dans laquelle vous pouvez observer le statut de la recherche de résultats.
Fenêtre modale s'ouvrant pour afficher la progression de la récupération des lignes.
La recherche s'arrête automatiquement lorsqu'elle atteint 10 000 résultats, ou si la fin du jeu de données est atteinte. Vous pouvez également interrompre la recherche à tout moment et afficher les lignes trouvées jusque là. Dans ce cas, plusieurs lignes d'informations clients ont été récupérées, notamment avec la ville de Paris, la dernière valeur recherchée. Vous pouvez voir les ID des lignes au-delà des 10 000 premières lignes de l'échantillon.
Les lignes correspondantes au-delà des 10 000 premières lignes ont été récupérées.

Results

En récupérant toutes les lignes correspondant à votre filtre, à travers le jeu de données, vous avez pu isoler les ventes des cinq villes spécifiées. Tous les filtres et fonctions utilisés à partir de maintenant ne s'appliqueront qu'à ce nouvel échantillon.

Exporter les lignes correspondant à vos filtres

Maintenant que vous avez votre liste restreinte de clients, vous allez l'exporter comme fichier local.

Procedure

  1. Cliquez sur le bouton Export (Exporter).
  2. Sélectionnez le bouton radio All data et assurez-vous d'avoir activé l'option Apply filters.
    Ainsi, l'export comprend toutes les lignes correspondant potentiellement au filtre, même au-delà de l'échantillon si votre jeu de données est plus volumineux, comme une opération "fetch more".
  3. Choisissez le format de fichier à utiliser pour exporter vos données.
    • Si vous choisissez Local CSV file, choisissez le séparateur, ainsi que les caractères d'échappement et d'entourage du texte à utiliser et saisissez un nom pour le fichier à exporter.
    • Si vous choisissez Local XLSX file (Fichier XLSX local), choisissez un nom pour le fichier à exporter.
    • Si vous choisissez Amazon S3, saisissez vos identifiants et autres informations afin de stocker votre fichier sur Amazon S3.

Results

Les données nettoyées à l'aide de votre préparation sont exportées dans un fichier local.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.