Процессор Aggregate (Агрегировать)
Выполняет операции с группами данных.
Процессор Aggregate (Агрегировать) позволяет группировать данные из входного потока по наборам агрегирования, значения которых затем можно использовать для операций, выводимых в новое поле.
Использование
Процессор Aggregate (Агрегировать) принимает один входной поток и может генерировать только один выходной поток.
Свойства
Свойства для настройки агрегирования записей.
Имя категории | Имя свойства | Конфигурация |
---|---|---|
Группировка по | Поле | В списке выберите поле, которое требуется использовать для наборов агрегирования. |
Операции | Поле | Выберите поле, для которого требуется выполнить операцию расчета. |
Операции | Операция | Выберите операцию, которую требуется применить к набору агрегирования: Среднее, Количество, Количество уникальных, Объединить, Максимум, Минимум, Сумма. |
Операции | Имя поля вывода (необязательно) |
Введите имя для созданного выходного поля. Если оставить поле пустым, имя по умолчанию для созданного поля будет содержать имя выбранного поля и название выбранной операции. |
Чтобы переименовать процессор или отредактировать его описание, щелкните значок Изменить рядом с названием процессора на панели Свойства.
Пример
В качестве источника данных в этом примере используется информация о покупателях, такая как имена, возрастные группы, пол и количество покупок.
Чтобы более глубоко проанализировать данные, можно воспользоваться процессором Aggregate (Агрегировать) для создания новой статистики, например среднего количества покупок по возрастным группам.
В свойствах процессора настройте поле Age group (Возрастная группа) как поле для группировки, а поле Purchases (Покупки) ― как поле, с которым требуется выполнять операции. Выберите операцию Среднее и присвойте имя полю, которое будет создано в выходных данных.
Чтобы выполнить другую операцию на основе возрастных групп, например показать общее количество покупок, щелкните значок «+» рядом со свойством Операции. На этот раз выберите операцию Сумма в качестве операции.
Выходной поток данных теперь содержит поле Age group (Возрастная группа), а также два поля, содержащие новые данные для статистического анализа. Другие поля из исходных данных не включены в выходные данные процессора.