Procesor Aggregate (Agregacja)
Wykonuje operacje na grupach danych.
Procesor Aggregate (Agregacja) umożliwia grupowanie danych z wejściowego przepływu za pomocą zestawów agregacji, których wartości mogą być następnie wykorzystywane do operacji wyprowadzanych w nowym polu.
Użycie
Procesor Aggregate (Agregacja) wymaga jednego przepływu wejściowego i może generować tylko jeden przepływ wyjściowy.
Właściwości
Właściwości do skonfigurowania w celu agregowania rekordów.
Nazwa kategorii | Nazwa właściwości | Konfiguracja |
---|---|---|
Grupuj według | Pole | Na liście wybierz pole, którego chcesz użyć w swoich zestawach agregacji. |
Operacje | Pole | Wybierz pole, na którym chcesz wykonać operację obliczeniową. |
Operacje | Operacja | Wybierz operację, którą chcesz zastosować na zestawie agregacji: Średnia, Licz, Licz unikatowe, Konkatenuj, Maksimum, Minimum, Suma. |
Operacje | Nazwa pola wyjściowego (opcjonalnie) |
Wprowadź nazwę wygenerowanego pola wyjściowego. Jeśli pozostawisz ją pustą, domyślnie wygenerowana nazwa pola będzie zawierać nazwę wybranego pola wraz z nazwą wybranej operacji. |
Aby zmienić nazwę procesora lub edytować jego opis, kliknij ikonę Edytuj obok nazwy procesora w panelu Właściwości.
Przykład
Dane użyte jako źródło w tym przykładzie zawierają informacje o klientach, takie jak imiona i nazwiska, grupy wiekowe, płeć i liczba zakupów.
Aby uzyskać lepszy wgląd w dane, można użyć procesora Aggregate (Agregacja) do tworzenia nowych statystyk, takich jak średnia liczba zakupów według grupy wiekowej.
We właściwościach procesora skonfiguruj pole Age group (Grupa wiekowa) jako pole będące kryterium grupowania, a Purchases (Zakupy) jako pole do wykonywania operacji. Wybierz opcję Średnia jako operację i nadaj nazwę polu, które zostanie wygenerowane na wyjściu.
Aby wykonać inną operację w oparciu o grupy wiekowe, na przykład całkowitą liczbę zakupów, kliknij ikonę + obok właściwości Operacje. Tym razem jako operację wybierz Suma.
Przepływ danych wyjściowych zawiera teraz pole Age group (Grupa wiekowa), a także dwa pola zawierające nowe dane do analizy statystycznej. Inne pola z danych źródłowych nie są uwzględniane w danych wyjściowych procesora.