Aggregate プロセッサー
データのグループに対して操作を実行します。
Aggregate プロセッサーを使用すると、入力フローからのデータを集計セットでグループ化し、その値を新しいフィールドに出力する操作に使用できます。
使用方法
Aggregate プロセッサーは、1 つの入力フローを必要とし、1 つの出力フローのみを生成できます。
プロパティ
レコードの集計のために設定するプロパティです。
カテゴリー名 | プロパティ名 | 設定 |
---|---|---|
グループ化 | フィールド | リストで、集計セットに使用するフィールドを選択します。 |
操作 | フィールド | 計算操作を実行するフィールドを選択します。 |
操作 | 操作 | 集計セットに適用する操作として、Average、Count、Count Distinct、Concatenate、Maximum、Minimum、Sum のいずれかを選択します。 |
操作 | 出力フィールド名 (オプション) |
生成された出力フィールドの名前を入力します。空のままにしておくと、既定で生成されるフィールド名には、選択されたフィールドの名前と選択された操作の名前が含まれるようになります。 |
プロセッサーの名前を変更したり、説明を編集したりするには、 [プロパティ] パネルのプロセッサー名の横にある [編集] アイコンをクリックします。
例
この例でソースとして使用されているデータには、名前、年齢層、性別、購入回数などの顧客情報が含まれています。
データをより深く理解するために、Aggregate プロセッサーを使用して、年齢層別の平均購入数などの新しい統計情報を作成できます。
プロセッサーのプロパティで、グループ化するフィールドとして Age group、処理を実行するフィールドとして Purchases を設定します。操作として [Average] を選択し、出力に生成されるフィールドの名前を指定します。
たとえば、購入総数など、年齢グループに基づいて別の操作を実行するには、 [操作] プロパティの横にある + アイコンをクリックします。今回は操作として Sum を選択します。
出力フローには、Age group フィールドと、統計分析用の新しいデータを含む 2 つのフィールドが含まれるようになりました。ソース データのその他のフィールドはプロセッサーの出力には含まれません。