顧客の平均購入価格を集計
始める前に
-
ソースデータを保管するシステムへの接続が作成済みであること。
-
ソースデータを保管するデータセットが追加済みであること。
aggregate-customers.zipファイルをダウンロードして抽出します。ID、製品情報(書名、価格ほか)など、顧客データの階層リストが含まれています。
-
接続および処理済みデータを保管する関連データセットも作成済みであること。
ここでは、ファイルはHDFSに保存されているものとします。
手順
タスクの結果
パイプラインは実行中となり、書籍の平均価格は1つのレコードに集計され、出力フローは指定のターゲットシステムに送信されます。