Verwenden unterschiedlicher Datensätze bei der Ausführung mithilfe von Kontextvariablen
In diesem Szenario werden Kontextvariablen hinzugefügt, um beide Datensätze zu überschreiben, die bei der Ausführung als Quelle und Ziel verwendet werden.
Vorbereitungen
-
Sie haben zuvor eine Verbindung zu dem System erstellt, in dem Ihre Quelldaten gespeichert sind, in diesem Fall eine HTTP-Client-Verbindung.
Die Basis-URL der Verbindung lautet folgendermaßen: https://datausa.io/.
-
Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.
In diesem Beispiel handelt es sich um öffentliche Daten aus den USA, einschließlich Bevölkerungsstatistiken.
Der HTTP-Client-Datensatz weist folgende Eigenschaften auf:- HTTP-Methode: GET
- Pfad: /api/data
- Abfrageparameter: Name: drilldowns, Wert: Nation - Name: measures (Maßstäbe), Wert: Population (Bevölkerung)
- Format des Antwort-Bodys: JSON
- Teil der Antwort extrahieren: .data
- Zurückgegebener Inhalt: Body
- Sie haben ebenfalls die Zielverbindung erstellt, in diesem Fall eine Google BigQuery-Verbindung, sowie einen BigQuery-Datensatz mit dem Namen Nation_statistics (Landesstatistiken). Die BigQuery-Tabelle wird bei der Ausführung erstellt und enthält US-Statistiken pro Jahr.
Prozedur
Ergebnisse
Ihre Pipeline wird ausgeführt, die Daten werden gefiltert, und die Pipeline entspricht den Kontextvariablen, die Sie dem Quell- und dem Zieldatensatz zugewiesen haben:
- In den Logs zur Pipeline-Ausführung werden die Kontextvariablen angegeben, die bei der Ausführung zum Abrufen der US-Bundesstaat-Daten und zur Erstellung der Tabelle State (Bundesstaat) in BigQuery verwendet wurden. In die neue Tabelle wurden 312 Dateneinträge aufgenommen.
- In Ihrem Google BigQuery-Konto wird die neu erstellte Tabelle State_statistics (Bundesstaat_Statistiken) angezeigt, die die ausgefilterten Daten enthält (nach 2015 erfasste Bundesstaat-Daten).