コンテキスト変数を使って実行時に異なるデータセットを使用
このシナリオでは、実行時にソースと宛先として使用される両方のデータセットをオーバーライドするためにコンテキスト変数が追加されます。
始める前に
-
ソースデータを保存するシステムへの接続(ここではHTTPクライアント接続)が作成されていること。
接続の基本URLは、https://datausa.io/です。
-
ソースデータを保管するデータセットが追加済みであること。
ここでは、人口統計が含まれている米国の公共データが対象です。
HTTPクライアントデータセットのプロパティは次のとおりです。- HTTPメソッド: GET
- パス: /api/data
- クエリーパラメーター: 名前: drilldowns 値: Nation、名前: measures 値: Population
- レスポンスボディ形式: JSON
- レスポンスのサブ部分を抽出: .data
- 返されたコンテンツ: ボディ
- また、デスティネーション接続(ここではGoogle BigQuery接続とNation_statisticsという名前のBigQueryデータセット)が作成されていること。このBigQueryテーブルは実行時に作成され、年ごとの米国の統計が含まれます。
手順
タスクの結果
パイプラインは実行中となり、データはフィルタリングされ、ソースデータセットとデスティネーションデータセットに割り当てたコンテキスト変数に対応します。
- パイプライン実行ログには、実行時に米国のデータを取得してBigQueryにStateテーブルを作成するために使用したコンテキスト変数が表示されます。312件のレコードが新しいテーブルに挿入されます。
- Google BigQueryアカウントには、新しく作成され、フィルタリング済みのデータ(2015年以降に収集された米国のデータのみ)が入力されたState_statisticsテーブルが表示されます。