Google Cloud Storageに保存されている統計を処理してデータをAmazon S3にアップロード
このシナリオは、パイプラインでコネクターを簡単にセットアップして使用できるようにすることを目的としています。お使いの環境とユースケースに適応させてください。

始める前に
- このシナリオを再現する場合は、 gcstorage_s3_nyc_stats.xlsx ファイルをダウンロードします。このファイルはニューヨーク市のオープンデータセットであるnyc-park-crime-stats-q4-2019.xlsxから抽出されたもので、誰でも利用できるように公開されています。
手順
タスクの結果
パイプラインは実行中となり、出力フローは指定したAmazon S3バケットに送信されます。

出力ファイルをダウンロードすると、犯罪データが処理され、強盗事件が分離されていることがわかります。
