Wizualizacja danych predykcji w aplikacji Qlik Sense
Ostatnim krokiem w tym procesie jest utworzenie aplikacji analitycznej Qlik Sense w celu wizualizacji wygenerowanych danych predykcji.
Alternatywny przepływ pracy: Przesyłanie wstępnie skonfigurowanej aplikacji
Zamiast wykonywać pozostałe kroki w tym temacie, możesz przesłać aplikację Customer churn predictions.qvf, pobraną na początku tego samouczka, do centrum aktywności Analytics.
Pozostałe sekcje na tej stronie przeprowadzą Cię przez proces tworzenia podobnej aplikacji. Wystąpią pewne różnice między danymi predykcji w aplikacji a Twoimi własnymi danymi predykcji.
Aplikacja do pobrania zawiera dodatkowy arkusz zatytułowany Individual Customer Analysis, który wykorzystuje wyrażenia warunkowe, aby zachęcić do szczegółowej analizy pojedynczego konta klienta w danym momencie.
Rozpoczęcie pracy
W centrum aktywności Analytics przejdź do strony Utwórz i kliknij Aplikacja. Wybierz przestrzeń dla aplikacji i nazwij ją Customer churn predictions.
Kliknij Utwórz.
Tworzenie modelu danych
Wybieranie danych
Musisz dodać niezbędne dane do swojej aplikacji. Składają się na nie zestaw danych zastosowania (przesłany na początku samouczka) oraz dwa zestawy danych wygenerowane z predykcji.
Wykonaj następujące czynności:
-
W nowej aplikacji kliknij, aby dodać dane z Katalogu danych.
-
W Katalogu danych zaznacz pola wyboru obok następujących trzech zestawów danych:
-
Zestaw danych zastosowania: ML - Churn data - apply.csv lub ML - Churn data - apply.qvd
-
Zestaw danych predykcji: ML - Prediction output.parquet
-
Zestaw danych Coordinate SHAP: ML - Prediction output_Coordinate_SHAP.parquet
-
-
Kliknij Dalej.
-
Pojawi się panel podsumowania. Kliknij zestaw danych ML - Churn data - apply, aby rozwinąć dostępne pola do załadowania.
-
Kliknij ikonę
obok wszelkich cech, które zostały odznaczone podczas trenowania modelu. Musisz zachować AccountID na liście, ponieważ jest to pole klucza. W celach informacyjnych wróć do utworzonej konfiguracji predykcji i porównaj schematy modelu oraz zestawu danych zastosowania (Ogólne informacje zawiera temat Edytowanie konfiguracji predykcji.).
-
Kliknij Załaduj do aplikacji.
Asocjacja danych
W tym momencie dane zostały dodane do aplikacji, ale połączony model danych nie zostanie skonstruowany, dopóki nie zasocjujesz ze sobą zestawów danych. W tym przypadku pole AccountID będzie indeksem łączącym zestawy danych.
W Twojej aplikacji otwarty jest teraz Menedżer danych. Zobaczysz trzy zestawy danych, ale są one pokazane jako oddzielne encje, które nie są połączone.
Wykonaj następujące czynności:
-
W Twojej aplikacji otwarty jest teraz Menedżer danych. Zobaczysz trzy zestawy danych, ale są one pokazane jako oddzielne encje, które nie są połączone.
-
W prawym panelu Menedżera danych znajdź sugestię asocjacji AccountID.
-
Kliknij Zastosuj. Tabele powinny być teraz ze sobą połączone.
-
Kliknij Załaduj dane.
Sprawdzanie asocjacji w Przeglądarka modelu danych
Przed zbudowaniem jakichkolwiek wizualizacji w aplikacji należy sprawdzić, czy dane zostały prawidłowo zasocjowane.
Wykonaj następujące czynności:
-
Na pasku nawigacyjnym u góry interfejsu otwórz menu nawigacyjne aplikacji i wybierz Przeglądarka modelu danych.
-
Sprawdź, czy trzy zestawy danych zostały prawidłowo połączone. Pole AccountID powinno pełnić rolę klucza we wszystkich trzech zestawach danych. Model danych aplikacji powinien wyglądać jak na poniższym obrazku.
Przeglądarka modelu danych pokazujący model danych aplikacji predykcji
Teraz możesz rozpocząć budowanie zawartości analitycznej. Kliknij Arkusz na karcie Analizuj na pasku nawigacyjnym.
Pierwszy arkusz: Pulpit nawigacyjny zagregowanych predykcji
Pierwszy arkusz będzie koncentrował się na analizie predykcji w formie zagregowanej.
Wykonaj następujące czynności:
-
Powinieneś teraz znajdować się w trybie edycji arkusza.
-
Kliknij prawym przyciskiem myszy dowolną istniejącą wizualizację w arkuszu i usuń ją. Jest to funkcja sugestii wykresu, z której nie będziemy korzystać w tym samouczku.
-
Nadaj arkuszowi tytuł, na przykład Aggregated Predictions. Aby to zrobić, kliknij w dowolnym miejscu pustego arkusza, aby otworzyć Właściwości arkusza po prawej stronie interfejsu. W sekcji Tytuł wpisz nazwę arkusza.
Wykres kołowy
Wykres kołowy pozwala łatwo zwizualizować proporcjonalne rozbicie danych. W tym przypadku sensowne jest rozbicie danych według przewidywanych wyników (yes lub no).
Wykonaj następujące czynności:
-
Przeciągnij wykres kołowy do arkusza.
-
Dodaj Churned_predicted jako wymiar.
-
Dodaj następującą miarę:
Count(AccountID) -
W razie potrzeby wyłącz Etykietę wymiaru w sekcji Wygląd > Prezentacja w panelu właściwości.
-
Rozwiń wymiar w sekcji Dane w panelu właściwości i zmień Etykietę wymiaru na Predicted to Churn.
Etykieta zaktualizuje się w legendzie.
Panel filtrowania
Ten pulpit nawigacyjny będzie służył do szerokiej analizy całego modelu danych. Jednak prawie na pewno ważna będzie możliwość szybkiego filtrowania danych w różnych wymiarach w celu analizy określonych kohort.
Utwórz panel filtrowania z wieloma polami list. Każde pole listy umożliwia wybór wartości w ramach jednego wymiaru.
Wykonaj następujące czynności:
-
Przeciągnij panel filtrowania do arkusza.
-
Dodaj pola do panelu filtrowania. Mogą to być wymiary, co do których oczekujesz, że będą miały istotne znaczenie dla przewidywanych wyników.
-
Zmodyfikuj każde pole listy w razie potrzeby, klikając pole w sekcji Dane w panelu właściwości. Spowoduje to otwarcie Właściwości pola listy.
Na przykład możesz chcieć zmienić etykietę pola i ustawić opcję Zwiń pole listy na Zawsze, aby zaoszczędzić miejsce w arkuszu.
Zmień rozmiar panelu filtrowania, aby pojawiał się jako panel po jednej stronie arkusza.
Obiekty wskaźnika KPI
Wskaźniki KPI to świetny sposób na wyświetlenie pojedynczej wartości dla szczególnie ważnej analizy danych. W tym miejscu utworzymy trzy wykresy wskaźnika KPI.
Wykonaj następujące czynności:
-
Utwórz pusty wykres wskaźnika KPI. Dodaj następującą miarę:
=Count(Churned_predicted)Spowoduje to obliczenie całkowitej liczby klientów, dla których wygenerowaliśmy predykcje odejścia.
-
Oznacz miarę etykietą Total # of Customers.
-
Ustaw Formatowanie liczb na Liczba i prezentuj wartości w formacie 1,000 (bez miejsc dziesiętnych ani wartości procentowych).
-
Utwórz kolejny pusty wykres wskaźnika KPI. Dodaj następującą miarę:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Jest to wyrażenie zestawu obliczające, ile razy wartość yes została wyświetlona w polu Churned_predicted.
-
Oznacz miarę etykietą Predicted to Churn.
-
Skonfiguruj formatowanie liczb wykresu z takimi samymi ustawieniami jak w przypadku pierwszego wskaźnika KPI.
-
Utwórz trzeci pusty wykres wskaźnika KPI. Dodaj następującą miarę:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Oblicza to, ile razy wartość no została wyświetlona w polu Churned_predicted.
-
Oznacz miarę etykietą Predicted to Stay.
Histogram
Możesz zwizualizować rozkład wartości prawdopodobieństwa predykcji za pomocą histogramu.
Przeciągnij histogram do arkusza i nadaj mu tytuł. Dodaj Churned_yes jako wymiar.
Skumulowane wykresy słupkowe
Aby przeanalizować predykcje według pola kategorycznego, takiego jak typ planu, możesz utworzyć wykres słupkowy z poszczególnymi analizami zestawów skumulowanymi jedna na drugiej.
Wykonaj następujące czynności:
-
Przeciągnij wykres słupkowy do arkusza i zatytułuj go Churn Predictions by Plan Type.
-
Dodaj PlanType jako wymiar. Oznacz go etykietą Plan Type.
-
Dodaj następującą miarę:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Oznacz miarę etykietą Predicted to Stay.
-
Dodaj następującą miarę:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Oznacz miarę etykietą Predicted to Churn.
-
W sekcji Wygląd > Prezentacja zmień układ z Grupowane na Skumulowane.
-
Usuń pasek przewijania i ustaw Etykiety wartości na Wł..
-
Skonfiguruj Etykiety segmentów i Etykiety sum na Auto.
Po zakończeniu możesz utworzyć podobny wykres słupkowy z tymi samymi dwiema miarami, ale z innym wymiarem kategorycznym, takim jak NumberOfPenalties.
Wykres rozkładu do analizy poszczególnych wartości pól numerycznych
Wykres rozkładu może posłużyć do prezentacji danych predykcji według miary o zróżnicowanych wartościach numerycznych. W tej sekcji utworzysz wykres wyświetlający predykcje odejścia według opłaty podstawowej, z wyraźnymi grupowaniami dla oceny obsługi klienta.
Wykonaj następujące czynności:
-
Przeciągnij wykres rozkładu do arkusza i zatytułuj go Churn Predictions by Base Fee and Service Rating.
-
Dodaj AccountID jako wymiar dla punktów.
-
Dodaj następującą miarę na osi X:
=Avg(BaseFee) -
Dodaj następujący wymiar wyliczany na osi Y:
=Round(ServiceRating,2)Tworzy to grupowania wzdłuż osi Y dla przybliżonych wartości ServiceRating. Im wyższa wartość, tym wyżej klient ocenił jakość swoich usług.
-
W sekcji Wygląd > Prezentacja zmniejsz Rozmiar bąbelka do 20 i włącz Punkty fluktuacji.
-
W sekcji Kolory i legenda ustaw Kolory na Niestandardowe.
-
Wybierz opcję kolorowania danych według następującego wymiaru:
=Churned_predictedSpowoduje to przypisanie jednego koloru dla każdej z wartości w polu Churned_predicted. W tym przypadku wyświetlone zostaną dwa kolory.
-
Dodaj etykiety do wymiaru i miary, a następnie dodaj następującą etykietę do ustawienia koloru niestandardowego: Predicted to Churn.
Podobne wykresy można utworzyć do analiz różnych pól numerycznych, zastępując miarę BaseFee innymi agregacjami pól.
Skonfiguruj wizualizacje w arkuszu tak, aby wyglądały podobnie do poniższego obrazu.
Arkusz analizy predykcji

Drugi arkusz: Pulpit nawigacyjny zagregowanych wartości SHAP
Następnie utwórz arkusz dedykowany do analizy zagregowanych wartości SHAP.
Wykonaj następujące czynności:
-
Utwórz nowy arkusz.
-
Nadaj arkuszowi tytuł (na przykład Aggregated SHAP).
Klasyfikacja ważności SHAP
Ten typ wykresu jest podobny do automatycznie wygenerowanego, który mogłeś zobaczyć podczas konfigurowania wersji eksperymentu. W tym miejscu utworzymy taki wykres dla przewidywanego zestawu danych.
Celem tego typu wykresu jest pokazanie cech, które w największym stopniu przyczyniają się do wyniku widocznego w kolumnie Churned. Musimy mieć świadomość, że ponieważ będziemy używać wartości bezwzględnych, wyniki SHAP mogą być dodatnie (wartość yes) lub ujemne (wartość no). Jeśli wolisz, możesz również użyć wyrażenia, które nie oblicza wartości bezwzględnej.
Wykonaj następujące czynności:
-
Przeciągnij wykres słupkowy do pustego arkusza.
-
Zatytułuj wykres SHAP Importance by Feature.
-
Dodaj automl_feature jako wymiar i oznacz go etykietą Feature.
Pozwala to na prezentację zagregowanych danych dla wszystkich uwzględnionych cech.
-
Dodaj następującą miarę wyliczaną:
=fabs(Avg(SHAP_value)) -
W polu Etykieta wpisz Average Absolute SHAP.
-
W panelu właściwości, w sekcji Wygląd > Prezentacja, usuń pasek przewijania, jeśli jest obecny, i ustaw orientację wykresu z Pionowej na Poziomą.
-
W sekcji Sortowanie przeciągnij miarę nad wymiar, jeśli jeszcze tego nie zrobiono. Pozostaw sortowanie każdego pola na Auto.
Spowoduje to posortowanie wykresu według wartości miary w porządku malejącym.
Kontener kratowy
Możesz utworzyć kontener kratowy, aby filtrować dane dla określonych wartości pól w ramach wymiaru. W tym przypadku możemy rozbić wartości SHAP dla każdego z czterech typów planów oferowanych klientom.
Aby utworzyć obiekt kontenera kratowego, musisz określić wymiar i wizualizację główną. Przekształcimy właśnie utworzoną klasyfikację ważności SHAP w wizualizację główną.
Wykonaj następujące czynności:
- Kliknij prawym przyciskiem myszy wykres Average Absolute SHAP w arkuszu, a następnie wybierz
Dodaj do elementów głównych.
- Zachowaj domyślną nazwę i kliknij Dodaj.
-
W sekcji Obiekty niestandardowe > Qlik Visualization bundle w panelu zasobów przeciągnij kontener kratowy do arkusza.
-
Dodaj PlanType jako wymiar.
-
Kliknij Dodaj wizualizację główną wewnątrz wykresu, a następnie dodaj wykres Average Absolute SHAP.
-
W sekcji Wygląd > Ogólne w panelu właściwości włącz opcję Pokaż tytuły i zatytułuj wykres SHAP Importance by Plan Type.
-
Zmień rozmiar kontenera kratowego, aby był wystarczająco szeroki do wyświetlania nazw cech na wykresach. Jeśli nie wyświetlają się wszystkie etykiety, dostosuj powiększenie w oknie przeglądarki.
Alternatywnie możesz wyświetlić te dane, tworząc poszczególne wykresy z wyrażeniami zestawu dla każdej wartości wymiaru, którą chcesz przeanalizować. W tym przypadku możesz utworzyć oddzielny wykres dla każdego z czterech typów planów.
Ponowne użycie panelu filtrowania
Panel filtrowania utworzony w pierwszym arkuszu może zostać ponownie użyty w tym arkuszu. W trybie edycji arkusza kliknij prawym przyciskiem myszy panel filtrowania i skopiuj go. Wklej go do arkusza Aggregated SHAP.
Mapa drzewa
Możesz również zwizualizować rozbicie wartości SHAP za pomocą mapy drzewa. Przeciągnij mapę drzewa do arkusza i dodaj ten sam wymiar i miarę, których użyto w klasyfikacji ważności SHAP.
Skonfiguruj wizualizacje w arkuszu tak, aby wyglądały podobnie do poniższego obrazu.
Arkusz Aggregated SHAP w trybie analizy

Korzystanie z aplikacji
Po zakończeniu budowania aplikacji jest ona gotowa do użycia w celu analizy danych.
Kliknij Edytuj arkusz, aby przełączyć się do trybu analizy. W tym widoku możesz dokonywać selekcji (w panelach filtrowania lub w innym miejscu arkusza), aby filtrować dane w celu określonej analizy podzbiorów danych. Na przykład możesz chcieć przeanalizować określony typ planu klienta lub region i porównać wyniki z innymi podzbiorami danych.
Dziękujemy!
Dotarłeś do końca tego samouczka. Mamy nadzieję, że nauczyłeś się kilku rzeczy i zdałeś sobie sprawę, że zautomatyzowane uczenie maszynowe to szybki i łatwy sposób na generowanie modeli predykcyjnych. Qlik Sense to potężne narzędzie, które ułatwia wizualizację danych predykcji i dostarcza istotnych informacji o danych.