Replizieren einer Liste mit Leads und unterschiedliches Verarbeiten der zwei Ausgabe-Flows
Vorbereitungen
-
Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.
In diesem Beispiel eine Verbindung zu einer Datenbank.
-
Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.
Laden Sie folgende Datei herunter und extrahieren Sie sie: filter-python-customers.zip. Sie enthält Lead-Daten, u. a. ID, Name, Umsatz usw.
-
Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.
In diesem Beispiel eine in Amazon S3 und eine in HDFS gespeicherte Datei.
Prozedur
Ergebnisse
Ihre Pipeline wird ausgeführt, die Datensätze werden dupliziert und gefiltert und die Ausgabe-Flows an die von Ihnen angegebenen Zielsysteme gesendet.