Wizualizacja danych predykcyjnych w aplikacji Qlik Sense
Ostatnim krokiem w procesie jest utworzenie aplikacji analitycznej Qlik Sense do wizualizacji wygenerowanych danych predykcji.
Alternatywny przepływ pracy: prześlij wstępnie skonfigurowaną aplikację
Zamiast wykonywać pozostałe kroki opisane w tym temacie, możesz przesłać aplikację Customer churn predictions.qvf pobraną na początku tego samouczka do centrum aktywności Analytics.
Pozostałe sekcje na tej stronie poprowadzą Cię przez proces tworzenia podobnej aplikacji. Wystąpią pewne różnice między danymi predykcyjnymi w aplikacji a Twoimi własnymi danymi predykcyjnymi.
Aplikacja do pobrania zawiera dodatkowy arkusz zatytułowany Individual Customer Analysis, który wykorzystuje wyrażenia warunkowe, aby zachęcić do szczegółowej analizy pojedynczych kont klientów.
Pierwsze kroki
W centrum aktywności Analytics przejdź do strony Utwórz i kliknij Aplikacja analityczna.Wybierz przestrzeń dla aplikacji i nazwij ją Customer churn predictions.
Kliknij polecenie Utwórz.
Tworzenie modelu danych
Wybieranie danych
Musisz dodać niezbędne dane do swojej aplikacji. Składają się one z zestawu danych do zastosowania (przesłanego na początku samouczka) i dwóch zestawów danych wygenerowanych na podstawie predykcji.
Wykonaj następujące czynności:
-
W nowej aplikacji kliknij, aby dodać dane z Katalogu danych.
-
W Katalogu danych kliknij pola wyboru obok następujących trzech zestawów danych:
-
Zestaw danych do zastosowania: AutoML Tutorial - Churn data - apply.csv lub AutoML Tutorial - Churn data - apply.qvd
-
Zestaw danych predykcyjnych: AutoML Tutorial - Churn data - apply_Prediction.csv
-
Zestaw danych SHAP w formacie układu współrzędnych: AutoML Tutorial - Churn data - apply_Prediction_Coordinate_SHAP.csv
-
-
Kliknij przycisk Dalej.
-
Pojawi się panel podsumowania. Kliknij zestaw danych AutoML Tutorial - Churn data - apply.csv, aby rozwinąć dostępne pola do załadowania.
-
Kliknij ikonę obok wszystkich cech, które zostały odznaczone podczas uczenia modelu. Powinno to być DaysSinceLastService, podobnie jak wszelkie cechy odznaczone ze względu na niewielki wpływ na model.
-
Kliknij Załaduj do aplikacji.
Tworzenie asocjacji danych
W tym momencie dane zostały dodane do aplikacji, ale połączony model danych zostanie skonstruowany dopiero wtedy, gdy powiążesz ze sobą zestawy danych. W tym przypadku pole AccountID będzie indeksem łączącym zestawy danych.
W aplikacji jest teraz otwarty Menedżer danych. Zobaczysz trzy zestawy danych, ale są wyświetlane jako osobne i niepołączone.
Wykonaj następujące czynności:
-
W aplikacji jest teraz otwarty Menedżer danych. Zobaczysz trzy zestawy danych, ale są wyświetlane jako osobne i niepołączone.
-
W prawym panelu Menedżera danych znajdź sugestię powiązania AccountID.
-
Kliknij przycisk Zastosuj. Tabele powinny być teraz ze sobą połączone.
-
Kliknij polecenie Ładuj dane.
Sprawdzanie powiązań w narzędziu Przeglądarka modelu danych
Przed zbudowaniem jakichkolwiek wizualizacji w aplikacji należy sprawdzić, czy dane zostały prawidłowo powiązane.
Wykonaj następujące czynności:
-
Na pasku nawigacyjnym w górnej części interfejsu otwórz menu nawigacji aplikacji i wybierz Przeglądarka modelu danych.
-
Sprawdź, czy trzy zestawy danych zostały prawidłowo połączone. Pole AccountID powinno działać jako klucz we wszystkich trzech zestawach danych. Model danych aplikacji powinien wyglądać jak na następującej ilustracji.
Możesz teraz zacząć budować zawartość analityczną. Kliknij Arkusz na karcie Analizuj na pasku nawigacyjnym.
Pierwszy arkusz: Zagregowany panel predykcji
Pierwszy arkusz posłuży do analizy predykcji w formie zagregowanej.
Wykonaj następujące czynności:
-
Powinien być aktywny tryb edycji arkusza. Kliknij Opcje zaawansowane.
-
Kliknij prawym przyciskiem myszy dowolną istniejącą wizualizację w arkuszu i ją usuń. Jest to funkcja sugestii wykresów, której nie będziemy używać w tym samouczku.
-
Zatytułuj arkusz, na przykład Aggregated Predictions. W tym celu kliknij dowolne miejsce pustego arkusza, aby otworzyć Właściwości arkusza po prawej stronie interfejsu. W obszarze Tytuł wpisz nazwę arkusza.
Wykres kołowy
Wykres kołowy umożliwia łatwą wizualizację proporcjonalnego rozbicia danych. W tym przypadku sensownie jest rozbić dane według przewidywanych wyników (yes lub no).
Wykonaj następujące czynności:
-
Przeciągnij wykres kołowy na arkusz.
-
Dodaj Churned_predicted jako wymiar.
-
Dodaj Count(AccountID) jako miarę.
-
W razie potrzeby wyłącz Etykietę wymiaru w obszarze Wygląd > Prezentacja w panelu właściwości.
-
Rozwiń wymiar w obszarze Dane w panelu właściwości i zmodyfikuj Etykietę wymiaru na Predicted to Churn.
Etykieta zostanie zaktualizowana w legendzie.
Panel filtrowania
Ten pulpit nawigacyjny będzie służyć do szerokiej analizy całego modelu danych. Najprawdopodobniej jednak ważna będzie możliwość szybkiego filtrowania danych w różnych wymiarach w celu analizy konkretnych kohort.
Utwórz panel filtrowania z wieloma polami listy. Każde pole listy umożliwia wybór wartości w ramach jednego wymiaru.
Wykonaj następujące czynności:
-
Przeciągnij panel filtrowania na arkusz.
-
Dodaj pola do panelu filtrowania. Mogą to być wymiary, które Twoim zdaniem będą istotne dla przewidywanych wyników.
-
W razie potrzeby zmodyfikuj każde pole listy, klikając pole w obszarze Dane w panelu właściwości. Spowoduje to otwarcie Właściwości pola listy.
Możesz na przykład zmienić etykietę pola i ustawić Zwiń pole listy na Zawsze, aby zaoszczędzić miejsce na arkuszu.
Zmień rozmiar panelu filtrowania, aby był wyświetlany jako panel po jednej stronie arkusza.
Obiekty KPI
Wskaźniki KPI to świetny sposób na wyświetlenie pojedynczej wartości na potrzeby szczególnie ważnej analizy danych. Tutaj utworzymy trzy wykresy KPI.
Wykonaj następujące czynności:
-
Utwórz pusty wykres KPI. Dodaj następującą miarę:
=Count(Churned_predicted)
Spowoduje to obliczenie całkowitej liczby klientów, dla których wygenerowaliśmy prognozy odpływu.
-
Oznacz miarę jako Total # of Customers.
-
Ustaw Formatowanie liczb na Liczba i przedstaw wartości w formacie 1000 (bez miejsc dziesiętnych i wartości procentowych).
-
Utwórz kolejny pusty wykres KPI. Dodaj następującą miarę:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Jest to wyrażenie zestawu, które oblicza, ile razy wartość yes została wyświetlona w polu Churned_predicted.
-
Nadaj mierze etykietę Predicted to Churn.
-
Skonfiguruj formatowanie liczb na wykresie z tymi samymi ustawieniami co w przypadku pierwszego wskaźnika KPI.
-
Utwórz trzeci pusty wykres KPI. Dodaj następującą miarę:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Oblicza ona, ile razy wartość no została wyświetlona w polu Churned_predicted.
-
Nadaj mierze etykietę Predicted to Stay.
Histogram
Rozkład wartości prawdopodobieństwa predykcji można wizualizować za pomocą histogramu.
Przeciągnij histogram na arkusz i nadaj mu tytuł. Dodaj Churned_yes jako wymiar.
Skumulowane wykresy słupkowe
Aby analizować predykcje według pola kategorialnego, takiego jak typ planu, można utworzyć wykres słupkowy z poszczególnymi analizami zestawów ułożonymi jedna na drugiej.
Wykonaj następujące czynności:
-
Przeciągnij wykres słupkowy na arkusz i zatytułuj go Churn Predictions by Plan Type.
-
Dodaj PlanType jako wymiar. Nadaj mu etykietę Plan Type.
-
Dodaj następującą miarę:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Nadaj mierze etykietę Predicted to Stay.
-
Dodaj następującą miarę:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Nadaj mierze etykietę Predicted to Churn.
-
W obszarze Wygląd > Prezentacja zmień układ ze Zgrupowane na Skumulowane.
-
Usuń pasek przewijania i ustaw opcję Etykiety wartości na Wł.
-
Skonfiguruj Etykiety segmentów i Etykiety łączne na Autom.
Na zakończenie możesz utworzyć podobny wykres słupkowy z tymi samymi dwiema miarami, ale z innym wymiarem kategorialnym, na przykład NumberOfPenalties.
Wykres rozkładu do analizy poszczególnych wartości pól liczbowych
Wykres rozkładu może służyć do przedstawiania danych predykcji za pomocą miary z różnymi wartościami liczbowymi. W tej sekcji utworzysz wykres, aby wyświetlić prognozy odpływu klientów według opłaty podstawowej, z odrębnymi grupami dla oceny obsługi klienta.
Wykonaj następujące czynności:
-
Przeciągnij wykres rozkładu na arkusz i zatytułuj go Churn Predictions by Base Fee and Service Rating.
-
Dodaj AccountID jako wymiar dla punktów.
-
Dodaj następującą miarę na osi X:
=Avg(BaseFee)
-
Dodaj następujący wymiar wyliczany na osi Y:
=Round(ServiceRating,2)
Spowoduje to utworzenie grup wzdłuż osi Y dla przybliżonych wartości ServiceRating. Im wyższa wartość, tym wyżej klient ocenił jakość usług.
-
W sekcji Wygląd > Prezentacja zmniejsz Rozmiar bąbelka na 20 i włącz Zastosuj odchylenie względem punktów.
-
W sekcji Kolory i legenda ustaw Kolory na Niestandardowe.
-
Wybierz opcję pokolorowania danych według następującego wymiaru:
=Churned_predicted
Spowoduje to przypisanie jednego koloru do każdej z wartości w polu Churned_predicted. W tym przypadku będą wyświetlane dwa kolory.
-
Dodaj etykiety do wymiaru oraz miary i dodaj następującą etykietę do niestandardowego ustawienia koloru: Predicted to Churn.
Podobne wykresy można tworzyć dla analiz różnych pól liczbowych, podstawiając inne agregacje pól w miejsce miary BaseFee.
Skonfiguruj wizualizacje na arkuszu, aby wyglądały podobnie do poniższej ilustracji.
Drugi arkusz: Zagregowany pulpit nawigacyjny SHAP
Następnie utwórz arkusz do analizy zagregowanych wartości SHAP.
Wykonaj następujące czynności:
-
Utwórz nowy arkusz i otwórz go w trybie zaawansowanej edycji.
-
Nadaj arkuszowi tytuł (na przykład Aggregated SHAP).
Klasyfikacja ważności SHAP
Ten typ wykresu jest podobny do wykresu wygenerowanego automatycznie, który można było zobaczyć podczas konfigurowania wersji eksperymentu. Tutaj utworzymy wykres dla przewidywanego zestawu danych.
Celem tego typu wykresu jest pokazanie cech, które w największym stopniu przyczyniają się do wyniku widocznego w kolumnie Churned. Musimy mieć świadomość, że ponieważ będziemy używać wartości bezwzględnych, wyniki SHAP mogą być pozytywne (mieć wartość yes) lub negatywne (mieć wartość no). Jeśli wolisz, możesz także użyć wyrażenia, które nie oblicza wartości bezwzględnej.
Wykonaj następujące czynności:
-
Przeciągnij wykres słupkowy na pusty arkusz.
-
Zatytułuj wykres SHAP Importance by Feature.
-
Dodaj automl_feature jako wymiar i nadaj mu etykietę Feature.
Umożliwia to prezentację zagregowanych danych dla wszystkich uwzględnionych cech.
-
Dodaj następującą obliczoną miarę:
=fabs(Avg(SHAP_value))
-
W obszarze Etykieta wpisz Average Absolute SHAP.
-
W panelu właściwości w obszarze Wygląd > Prezentacja usuń pasek przewijania, jeśli jest obecny, i ustaw orientację wykresu z pionowej na poziomą.
-
W obszarze Sortowanie przeciągnij miarę nad wymiar, jeśli nie zostało to jeszcze zrobione. Jako sposób sortowania każdego pola pozostaw Autom.
Spowoduje to posortowanie wykresu według wartości miar w porządku malejącym.
Kontener kratowy
Możesz utworzyć kontener kratowy, aby filtrować dane dla określonych wartości pól w wymiarze. W tym przypadku możemy rozbić wartości SHAP dla każdego z czterech typów planów oferowanych klientom.
Aby utworzyć obiekt kontenera kratowego, należy określić wymiar i wizualizację główną. Utworzoną właśnie klasyfikację ważności SHAP przekonwertujemy na wizualizację główną.
Wykonaj następujące czynności:
- Kliknij prawym przyciskiem myszy wykres Average Absolute SHAP w arkuszu, a następnie wybierz Dodaj do elementów głównych.
- Zachowaj domyślną nazwę i kliknij Dodaj.
-
W obszarze Obiekty niestandardowe > Qlik Visualization Bundle w panelu zasobów przeciągnij kontener kratowy na arkusz.
-
Dodaj PlanType jako wymiar.
-
Kliknij pozycję Dodaj wizualizację główną wewnątrz wykresu, a następnie dodaj wykres Average Absolute SHAP.
-
W obszarze Wygląd > Ogólne w panelu właściwości włącz opcję Pokaż tytuły i nazwij wykres SHAP Importance by Plan Type.
-
Zwiększ rozmiar kontenera kratowego tak, aby wyświetlał nazwy obiektów na wykresach. Jeśli nie wyświetlają się wszystkie etykiety, dostosuj powiększenie w oknie przeglądarki.
Zamiast tego możesz wyświetlić te dane, tworząc indywidualne wykresy z wyrażeniami zestawów dla każdej wartości wymiaru, którą chcesz przeanalizować. W takim przypadku możesz utworzyć osobny wykres dla każdego z czterech typów planów.
Ponowne użycie panelu filtrowania
Panel filtrowania utworzony na pierwszym arkuszu można wykorzystać ponownie na tym arkuszu. W trybie edycji zaawansowanej kliknij panel filtrowania prawym przyciskiem myszy i go skopiuj. Wklej go do arkusza Aggregated SHAP.
Mapa drzewa
Możesz także zwizualizować rozbicie wartości SHAP za pomocą mapy drzewa. Przeciągnij mapę drzewa na arkusz i dodaj ten sam wymiar oraz miarę, które zostały użyte w rankingu ważności SHAP.
Skonfiguruj wizualizacje na arkuszu, aby wyglądały podobnie do poniższej ilustracji.
Korzystanie z aplikacji
Po zakończeniu jej tworzenia aplikacja jest gotowa do użycia w analizie danych.
Kliknij Edytuj arkusz, aby przejść do trybu analizy. W tym widoku możesz dokonywać wyborów (w panelach filtrowania lub w innych miejscach arkusza), aby filtrować dane w celu konkretnej analizy podzestawów danych. Można na przykład przeanalizować konkretny typ planu klientów lub region i porównać wyniki z innymi podzestawami danych.
Dziękujemy!
To już koniec tego samouczka. Mamy nadzieję, że dostarczył Ci pewnych informacji i przekonał, że zautomatyzowane uczenie maszynowe to szybki i łatwy sposób generowania modeli predykcyjnych. Qlik Sense to wszechstronne narzędzie, które ułatwia wizualizację danych predykcji i oferuje przydatne wnioski z danych.