Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Erstellen von „or“-Bedingungen für numerische Daten

Bei der Arbeit mit Datensätzen, die numerische Daten enthalten, können Sie einen Filter verwenden, um Zeilen mit einem spezifischen Wert zu isolieren. Oder Sie wählen über den Fensterbereich Chart (Diagramm) einen Wertebereich aus, um den entsprechenden Filter zu erstellen. Wenn Sie jedoch einen Filter erstellen möchten, der Zeilen zurückgibt, die einer ganzen Liste von Werten entsprechen - mit anderen Worten: einen „or“-Filter -, müssen Sie anders vorgehen. Sie müssen in diesem Fall einen regulären Ausdruck erstellen, der auf alle gewünschten numerischen Werte verweist und diejenigen Zeilen ausfiltern, die dem regulären Ausdruck entsprechen.

Unter Verwendung des Beispiel-Datensatzes „car dealership“ erstellen Sie einen Filter, mit dem die Verkäufe von Autos angezeigt werden, die zu bestimmten Daten auf den Markt gebracht wurden. Sie können dann die Kundendaten exportieren, die ausschließlich diesem Filter entsprechen.

Hinzufügen einer Datenaufbereitung für den Datensatz „Car Dealership“

Fügen Sie eine Datenaufbereitung hinzu, um die Aufbereitung und Bereinigung Ihrer Daten in Angriff zu nehmen.

Sie können eine Datenaufbereitung ausgehend von einem in Talend Cloud Data Preparation bereits verfügbaren Datensatz oder ausgehend von einer Ihrer lokalen Dateien erstellen. Beim Hinzufügen einer Datenaufbereitung über die entsprechende Schaltfläche wird diese in dem Ordner erstellt, in dem Sie zurzeit arbeiten. Darüber hinaus wird die Datenaufbereitung automatisch in die Liste der Datenaufbereitungen aufgenommen, alle von Ihnen vorgenommenen Änderungen werden automatisch gespeichert.

Before you begin

Sie haben unter Verwendung der zuvor heruntergeladenen Datei den Datensatz car_dealership (Autohaus) in Talend Cloud Data Preparation erstellt.

Procedure

  1. Klicken Sie auf der Homepage auf Preparations (Datenaufbereitungen), um die Liste der Datenaufbereitungen zu öffnen.
  2. Klicken Sie auf die Schaltfläche Add Preparation (Datenaufbereitung hinzufügen).
  3. Wählen Sie in der Liste Datasets (Datensätze) den Eintrag car_dealership als Quellmaterial aus.
    Fenster Add a preparation (Datenaufbereitung hinzufügen) mit einer Liste der Datensätze, die zum Erstellen einer Datenaufbereitung verfügbar sind, darunter car_dealership.
    In das Feld Preparation name (Name der Datenaufbereitung) wird automatisch ein Name eingetragen, den Sie jedoch nach Bedarf ändern können.
  4. Klicken Sie auf Submit (Senden).

Results

Der Datensatz wird mit einem leeren Rezept geöffnet, und Sie können mit den Arbeitsschritten zum Hinzufügen einer Datenaufbereitung beginnen. Alle Änderungen, die Sie vornehmen, werden automatisch gespeichert.

Erstellen eines regulären Ausdrucks zum Abgleich mit Autojahren

Sie erstellen eine regulären Ausdruck, um einen Abgleich mit den Daten durchzuführen, an denen Sie interessiert sind, nämlich 1950, 1960, 1970, 1980 1990, 2000 und 2010.

Procedure

  1. Klicken Sie auf die Überschrift der Spalte car_year (Autojahr), um deren Inhalt auszuwählen.
  2. Geben Sie im Funktionsbereich auf der rechten Fensterseite Match pattern (Mit Muster abgleichen) ein und klicken Sie dann auf das Ergebnis, um die Optionen für die entsprechende Funktion anzuzeigen.
  3. Wählen Sie im Feld Pattern (Muster) die Option Other (Andere) aus.
  4. Wählen Sie in der Dropdown-Liste Manual pattern (Manuelles Muster) den Eintrag RegEx aus.
  5. Geben Sie im Feld Manual pattern (Manuelles Muster) den folgenden regulären Ausdruck ein:
    ^1950$|^1960$|^1970$|^1980$|^1990$|^2000$|^2010$

    Dieser Ausdruck identifiziert alle Zeilen mit Verkäufen von Autos aus den Jahren 1950, 1960, 1970 usw.

  6. Klicken Sie auf Submit (Senden).

Results

Es wird eine neue Spalte erstellt, in der die Zeilen, die dem regulären Ausdruck entsprechen, mit true gekennzeichnet werden. Alle anderen Zeilen werden mit false gekennzeichnet.
Eine neue Spalte wird zur Datenaufbereitung hinzugefügt, um zu zeigen, ob die Werte dem Ausdruck entsprechen.

Filtern der Werte zur Erstellung einer „or“-Bedingung

Sie wissen jetzt, wie Sie Zeilen identifizieren können, die einem regulären Ausdruck entsprechen. Somit können Sie alle diese Zeilen abrufen, indem Sie einen Filter für die neue Spalte erstellen.

Procedure

  1. Klicken Sie auf die Überschrift der Spalte car_year_matching (Autojahr_Übereinstimmung), um deren Inhalt auszuwählen.
    Im Bereich des Data-Profiling in der unteren rechten Fensterecke wird ein horizontales Balkendiagramm angezeigt, dem Sie den Anteil der Werte true und false in der Spalte entnehmen können. Positionieren Sie den Mauszeiger auf jeder Leiste, um die genaue Anzahl anzuzeigen.
    Das Balkendiagramm zeigt die Verteilung der Werte true (wahr) und false (falsch).
  2. Um den Filter zu erstellen, klicken Sie auf die Leiste true.
    Die Filterleiste gibt an, dass ein neuer Filter auf den Datensatz angewendet wurde. Dadurch werden Kundendaten nur angezeigt, wenn sie der vom regulären Ausdruck vorgegebenen Bedingung entsprechen.
    Ein Filter wurde angewendet, sodass nur die Zeilen mit dem Wert true (wahr) angezeigt werden.

Results

Mithilfe dieses Filters, der nicht nur auf einem, sondern auf mehreren numerischen Werten gleichzeitig basiert, haben Sie alle Verkäufe in Verbindung mit Autos aus den angegebenen Jahren isoliert. Sie können jetzt jede beliebige Funktion darauf anwenden und ausschließlich mit diesem Sample arbeiten.

Exportierten der gefilterten Zeilen

Sie haben eine Liste mit bestimmten Kunden ausgegrenzt und aufbereitet und möchten die Liste jetzt als lokale Datei exportieren.

Procedure

  1. Klicken Sie auf die Schaltfläche Export (Exportieren).
  2. Wählen Sie die Optionsschaltfläche All data (Alle Daten) aus und vergewissern Sie sich, dass der Schalter Apply filters (Filter anwenden) aktiviert ist.
    Dadurch werden beim Export alle potenziellen Zeilen einbezogen, die dem Filter entsprechen, selbst über das Sample hinaus, wenn Ihr Datensatz größer als das Sample ist.
  3. Wählen Sie das Dateiformat aus, das Sie für den Export der Daten verwenden möchten.
    • Bei der Auswahl von Local CSV file (Lokale CSV-Datei) müssen Sie festlegen, welche Feldbegrenzer, Textbegrenzungen und Maskierungszeichen verwendet werden sollen, und einen Namen für die zu exportierende Datei eingeben.
    • Bei der Auswahl von Local XLSX file (Lokale XLSX-Datei) müssen Sie einen Namen für die zu exportierende Datei auswählen.
    • Bei der Auswahl von Amazon S3 müssen Sie Ihre Anmeldedaten und andere Informationen für die Speicherung der Datei in Amazon S3 eingeben.

Results

Die von Ihnen mithilfe der Datenaufbereitung bereinigten Daten werden in eine lokale Datei exportiert.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!