Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Füllen leerer Datenelemente mit einem festen Wert

Eine Pipeline mit einer Testquelle, einem Prozessor vom Typ „Data cleansing (Datenbereinigung)“ und einem Testziel.

Vorbereitungen

  • Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.

    In diesem Beispiel eine Testverbindung.

  • Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.

    Laden Sie folgende Datei herunter und extrahieren Sie sie: type_converter-datacleansing-taxi.zip. Sie enthält hierarchische Taxi-Daten, u. a. Abholzeiten, Ankunftszeiten, Fahrpreis usw.

  • Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.

    In diesem Beispiel ein Testdatensatz.

Prozedur

  1. Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
  2. Legen Sie einen sinnvollen Namen für die Pipeline fest.

    Example

    Fill empty cells with appropriate value (Leere Zellen mit zutreffendem Wert füllen)
  3. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie die Quelldaten auswählen können. In diesem Fall sind dies Daten im Zusammenhang mit Taxis, die eine Spalte mit leeren Datenelementen enthalten (store_and_fwd_flag).

    Example

    Vorschau eines Datenbeispiels über Taxidaten.
  4. Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
    Benennen Sie ihn um, falls erforderlich.
  5. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Data cleansing (Datenbereinigung) zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
  6. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    Fill empty cells with appropriate value (Leere Zellen mit N/A-Wert füllen)
  7. Führen Sie im Bereich Configuration (Konfiguration) Folgendes durch:
    1. Wählen Sie Fill cells with value (Zellen mit Werten füllen) in der Liste Function name (Funktionsname) aus, da der Steuerbetrag zum Kaufpreis hinzugefügt werden soll.
    2. Wählen Sie .store_and_fwd_flag in der Liste Fields to process (Zu verarbeitende Felder) aus, da dies dem Feld mit leeren Datenelementen entspricht.
    3. Wählen Sie Value (Wert) in der Liste Use with (Verwenden mit) aus und geben Sie N/A in das Feld Value (Wert) ein, um alle leere Datenelemente durch den zu ersetzen.
  8. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Bereinigungsvorgang mit denjenigen nach dem Vorgang zu vergleichen.

    Vorschau des Prozessors vom Typ „Data cleansing (Datenbereinigung)“ nach dem Ersetzen von leeren Datenelementen mit dem Wert „N/A“ („Not available“: Nicht verfügbar).
  9. Klicken Sie auf ADD DESTINATION (ZIEL HINZUFÜGEN) und wählen Sie den Datensatz aus, der Ihre bereinigten Daten aufnehmen soll.
    Benennen Sie ihn um, falls erforderlich.
  10. Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
  11. Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Ihre Pipeline wird ausgeführt, die leeren Datenelemente werden durch den von Ihnen angegebenen festen Wert ersetzt und der Ausgabe-Flow wird an das von Ihnen angegebene Zielsystem gesendet.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!