Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Erstellen von „or“-Bedingungen für Städte

Um ein Bedingung oder einen Filter für mehrere Textwerte gleichzeitig zu erstellen, beispielsweise für Städte, können Sie im Fensterbereich Chart (Diagramm) mehrere Werte auswählen. Mithilfe der Navigationspfeile können Sie zudem die ersten 10 Ergebnisse schnell durchlaufen. Allerdings basieren die Statistikdaten der Diagramme nur auf dem Sample aus 10.000 Zeilen. Wenn Ihr Datensatz umfangreicher ist, wie z. B. der Autohaus-Datensatz „car dealership“, könnten Ihnen dadurch potenzielle Dateneinträge entgehen, die nicht in diesem Sample enthalten sind. Um folglich sicherzustellen, dass Ihr Filter alle übereinstimmenden Zeilen zurückgibt, müssen Sie anders vorgehen. Sie müssen einen regulären Ausdruck erstellen, der auf alle gewünschten Textwerte verweist, diejenigen Zeilen ausfiltern, die dem regulären Ausdruck entsprechen, und die Funktion Fetch more (Weitere abrufen) einsetzen, um alle anderen Zeilen abzurufen, die diesem Filter entsprechen.

Unter Verwendung des zuvor importierten Datensatzes „car dealership“ erstellen Sie eine neue Datenaufbereitung sowie einen Filter, um die Verkäufe anzuzeigen, die in den fünf größten Städten getätigt wurden.

Erstellen eines regulären Ausdrucks zum Abgleich mit Städten

Sie erstellen einen regulären Ausdruck, um einen Abgleich mit allen Städten durchzuführen, an denen Sie interessiert sind, d. h. mit den fünf größten Städten Frankreichs: Paris, Lyon, Marseille, Toulouse und Bordeaux.

Procedure

  1. Klicken Sie auf die Überschrift der Spalte city (Stadt), um deren Inhalt auszuwählen.
  2. Geben Sie im Funktionsbereich auf der rechten Fensterseite Match pattern (Mit Muster abgleichen) ein und klicken Sie dann auf das Ergebnis, um die Optionen für die entsprechende Funktion anzuzeigen.
  3. Wählen Sie im Feld Pattern (Muster) die Option Other (Andere) aus.
  4. Wählen Sie in der Dropdown-Liste Manual pattern (Manuelles Muster) den Eintrag RegEx aus.
  5. Geben Sie im Feld Manual pattern (Manuelles Muster) den folgenden regulären Ausdruck ein:
    ^Paris$|^Marseille$|^Lyon$|^Toulouse$|^Bordeaux$

    Dieser Ausdruck sucht nach Verkäufen in diesen fünf Städten.

  6. Klicken Sie auf Submit (Senden).

Results

Es wird eine neue Spalte erstellt, in der die Zeilen, die dem regulären Ausdruck entsprechen, mit true gekennzeichnet werden. Alle anderen Zeilen werden mit false gekennzeichnet.
Neue Spalte in der Datenaufbereitung, die zeigt, ob die entsprechenden Werte mit der Formel übereinstimmen.

Filtern der übereinstimmenden Werte

Sie wissen jetzt, wie Sie Zeilen identifizieren können, die einem regulären Ausdruck entsprechen. Somit können Sie alle übereinstimmenden Zeilen abrufen, indem Sie einen Filter für die neue Spalte erstellen.

Procedure

  1. Klicken Sie auf die Überschrift der Spalte city_matching (Stadt_Übereinstimmung), um deren Inhalt auszuwählen.
    Im Bereich des Data-Profiling in der unteren rechten Fensterecke wird ein horizontales Balkendiagramm angezeigt, dem Sie den Anteil der Werte true und false in der Spalte entnehmen können. Positionieren Sie den Mauszeiger auf jeder Leiste, um die genaue Anzahl anzuzeigen.
    Das Balkendiagramm zeigt die Verteilung der Werte true (wahr) und false (falsch).
  2. Um den Filter zu erstellen, klicken Sie auf die Leiste true.
    Die Filterleiste gibt an, dass ein neuer Filter auf den Datensatz angewendet wurde. Dadurch werden Kundendaten nur angezeigt, wenn sie der vom regulären Ausdruck vorgegebenen Bedingung entsprechen.

Results

Mithilfe dieses Filters auf der Basis mehrerer Werte haben Sie alle Verkäufe in Verbindung mit Kunden in den angegebenen Städten isoliert. Allerdings wurden von den fünf Werten, nach denen Sie gesucht haben, nur vier abgerufen, und es sieht aus, als wären im Datensatz keine Zeilen mit Bezug auf Paris vorhanden. Infolgedessen prüfen Sie jetzt, ob der Filter potenziell weitere Zeilen außerhalb des aktuellen Samples als übereinstimmendes Ergebnis identifiziert.

Abrufen weiterer Werte für die entsprechenden Städte

Der zuvor erstellte Filter hat nicht alle Städte zurückgegeben, an denen Sie interessiert sind, sodass Sie weitere Zeilen abrufen möchten, die potenziell mit dem Filter übereinstimmen, aber nicht zum Sample gehören.

Procedure

Klicken Sie in der oberen rechten Ecke des Rasters auf Fetch more (Weitere abrufen).
Die Schaltfläche Fetch more (Weitere abrufen) ist oben rechts im Raster verfügbar.
Daraufhin wird das Dialogfeld Fetch additional rows (Zusätzliche Zeilen abrufen) geöffnet, in dem der Status des Datenabrufs angezeigt wird.
Ein Modal wird geöffnet und zeigt den Fortschritt des Zeilenabrufs an.
Die Suche hält automatisch an, sobald 10.000 Ergebnisse erzielt wurden oder das Ende des Datensatzes erreicht ist. Sie können den Prozess auch jederzeit abbrechen und die bis dahin identifizierten Zeilen anzeigen. Im vorliegenden Fall wurden mehrere zusätzliche Zeilen mit Kundendaten abgerufen, darunter einige mit Paris als Stadt, d. h. dem letzten Wert, nach dem Sie gesucht haben. Den Zeilen-IDs können Sie entnehmen, dass diese Zeilen außerhalb der ersten 10.000 Zeilen des ursprünglichen Samples angesiedelt waren.
Übereinstimmende Zeilen über die ersten 10.000 Zeilen hinaus wurden abgerufen.

Results

Dadurch, dass Sie sämtliche Zeilen, die dem Filter entsprechen, aus dem gesamten Datensatz abgerufen haben, ist es Ihnen gelungen, die in allen fünf betroffenen Städten getätigten Verkäufe zu isolieren. Alle ab jetzt angewendeten Filter bzw. Funktionen werden nur auf dieses Sample angewendet.

Exportieren der den Filtern entsprechenden Zeilen

Sie haben eine Liste mit bestimmten Kunden ausgegrenzt und aufbereitet und möchten die Liste jetzt als lokale Datei exportieren.

Procedure

  1. Klicken Sie auf die Schaltfläche Export (Exportieren).
  2. Wählen Sie die Optionsschaltfläche All data (Alle Daten) aus und vergewissern Sie sich, dass der Schalter Apply filters (Filter anwenden) aktiviert ist.
    Dadurch werden beim Export alle potenziellen Zeilen einbezogen, die dem Filter entsprechen, selbst über das Sample hinaus, wenn Ihr Datensatz größer als das Sample ist. Dieser Vorgang entspricht der Operation „Fetch more (Weitere abrufen)“.
  3. Wählen Sie das Dateiformat aus, das Sie für den Export der Daten verwenden möchten.
    • Bei der Auswahl von Local CSV file (Lokale CSV-Datei) müssen Sie festlegen, welche Feldbegrenzer, Textbegrenzungen und Maskierungszeichen verwendet werden sollen, und einen Namen für die zu exportierende Datei eingeben.
    • Bei der Auswahl von Local XLSX file (Lokale XLSX-Datei) müssen Sie einen Namen für die zu exportierende Datei auswählen.
    • Bei der Auswahl von Amazon S3 müssen Sie Ihre Anmeldedaten und andere Informationen für die Speicherung der Datei in Amazon S3 eingeben.

Results

Die von Ihnen mithilfe der Datenaufbereitung bereinigten Daten werden in eine lokale Datei exportiert.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!