Hashen von Feldern für sicheren Datenvergleich
Vorbereitungen
-
Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.
In diesem Beispiel eine Verbindung zu Amazon S3.
-
Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.
Laden Sie folgende Datei herunter: string-crops.csv. Sie enthält einen Datensatz mit Daten zu Ernten in Mali mit Erntetyp, Produktionswert, abgeernteten Gebieten usw.
-
Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.
In diesem Beispiel ein im gleichen S3-Bucket gespeicherter Datensatz.
Prozedur
Ergebnisse
Die Pipeline wird ausgeführt, die Daten werden gehast, identische Felder zusammengeführt und gemäß den von Ihnen angegebenen Bedingungen neu organisiert und die Ausgabe wird an das von Ihnen angegebene Zielsystem gesendet.