Visualisera prediktionsdata i en Qlik Sense-applikation
Det sista steget i processen är att skapa en Qlik Sense-analysapplikation för att visualisera de prediktionsdata du har genererat.
Alternativt arbetsflöde: Ladda upp förkonfigurerad applikation
Istället för att följa de återstående stegen i det här delavsnittet kan du ladda upp applikationen Customer churn predictions.qvf, som du hämtade i början av den här handledningen, till Analyser aktivitetscenter.
De återstående delavsnitten på den här sidan guidar dig genom skapandet av en liknande applikation. Det kommer att finnas vissa skillnader mellan prediktionsdata i applikationen och dina egna prediktionsdata.
Den nedladdningsbara applikationen innehåller ett ytterligare ark med titeln Individual Customer Analysis, som använder villkorsuttryck för att uppmuntra detaljerad analys av ett enskilt kundkonto i taget.
Komma igång
Från Analyser-aktivitetscentret, gå till sidan Skapa och klicka på Applikation. Välj ett utrymme för applikationen och namnge den Customer churn predictions.
Klicka på Skapa.
Skapa datamodellen
Välja dina data
Du måste lägga till nödvändiga data i din applikation. Detta består av tillämpningsdatasetet (uppladdat i början av handledningen) och de två dataseten som genererats från prediktionen.
Gör följande:
-
I den nya applikationen klickar du för att lägga till data från Datakatalog.
-
I Datakatalog klickar du på kryssrutorna bredvid följande tre dataset:
-
Tillämpningsdataset: ML - Churn data - apply.csv eller ML - Churn data - apply.qvd
-
Prediktionsdataset: ML - Prediction output.parquet
-
Coordinate SHAP-dataset: ML - Prediction output_Coordinate_SHAP.parquet
-
-
Klicka på Nästa.
-
En sammanfattningspanel visas. Klicka på datasetet ML - Churn data - apply för att expandera de tillgängliga fälten att ladda.
-
Klicka på ikonen
bredvid eventuella funktioner som avmarkerades under modellträningen. Du måste behålla AccountID i listan eftersom det är ett nyckelfält. Som referens kan du återvända till den prediktionskonfiguration du skapade och jämföra scheman för modellen och tillämpningsdatasetet (För allmän hjälp, se Redigera prognoskonfigurationer.).
-
Klicka på Ladda i app.
Associera data
Vid det här laget har du lagt till data i applikationen, men en ansluten datamodell konstrueras inte förrän du associerar dataseten med varandra. I det här fallet kommer fältet AccountID att vara indexet som länkar samman dataseten.
I din applikation är Datahanteraren nu öppen. Du kommer att se de tre dataseten, men de visas som separata enheter som inte är anslutna.
Gör följande:
-
I din applikation är Datahanteraren nu öppen. Du kommer att se de tre dataseten, men de visas som separata enheter som inte är anslutna.
-
I den högra rutan i Datahanteraren letar du upp associationsförslaget AccountID.
-
Klicka på Tillämpa. Tabellerna bör nu vara anslutna till varandra.
-
Klicka på Ladda data.
Kontrollera dina associationer i Datamodellvyn
Innan du bygger några visualiseringar i applikationen bör du verifiera att data har associerats korrekt.
Gör följande:
-
I navigeringsfältet högst upp i gränssnittet öppnar du applikationens navigeringsmeny och väljer Datamodellvyn.
-
Kontrollera att de tre dataseten har anslutits korrekt. Fältet AccountID bör fungera som en nyckel över alla tre dataseten. Applikationens datamodell bör se ut som på följande bild.
Datamodellvyn som visar datamodellen för prediktionsapplikationen
Du är nu redo att börja bygga analysinnehåll. Klicka på Ark under fliken Analysera i navigeringsfältet.
Första arket: Instrumentpanel för aggregerade prediktioner
Det första arket kommer att fokusera på analys av prediktionerna i aggregerad form.
Gör följande:
-
Du bör nu befinna dig i arkets redigeringsläge.
-
Högerklicka på valfri befintlig visualisering i arket och ta bort den. Detta är en funktion för diagramförslag som vi inte kommer att använda i den här handledningen.
-
Ge arket en titel, till exempel Aggregated Predictions. För att göra detta klickar du var som helst i det tomma arket för att öppna Arkegenskaper på höger sida av gränssnittet. Under Titel skriver du ett namn för arket.
Cirkeldiagram
Ett cirkeldiagram låter dig enkelt visualisera den proportionella uppdelningen av dina data. I det här fallet är det logiskt att dela upp data efter de förutsagda utfallen (yes eller no).
Gör följande:
-
Dra ett cirkeldiagram till arket.
-
Lägg till Churned_predicted som en dimension.
-
Lägg till följande mått:
Count(AccountID) -
Om så önskas, stäng av Dimensionsetikett under Utseende > Presentation i egenskapspanelen.
-
Expandera dimensionen under Data i egenskapspanelen och ändra Etikett för dimensionen till Predicted to Churn.
Etiketten uppdateras i teckenförklaringen.
Filterruta
Den här instrumentpanelen kommer att vara för bred analys av hela datamodellen. Det kommer dock med största sannolikhet att vara viktigt att snabbt kunna filtrera data över olika dimensioner för att analysera specifika kohorter.
Skapa en filterruta med flera listrutor. Varje listruta tillåter val av värden inom en enda dimension.
Gör följande:
-
Dra en filterruta till arket.
-
Lägg till fält i filterrutan. Dessa kan vara dimensioner som du förväntar dig ska vara betydelsefulla för de förutsagda utfallen.
-
Ändra varje listruta efter behov genom att klicka på fältet under Data i egenskapspanelen. Detta öppnar Listruteegenskaper.
Du kanske till exempel vill ändra fältetiketten och ställa in Dölj listruta till Alltid för att spara utrymme på arket.
Ändra storlek på filterrutan så att den visas som en panel på ena sidan av arket.
KPI-objekt
KPI:er är ett utmärkt sätt att visa ett enskilt värde för en särskilt viktig analys av dina data. Här kommer vi att skapa tre KPI-diagram.
Gör följande:
-
Skapa ett tomt KPI-diagram. Lägg till följande mått:
=Count(Churned_predicted)Detta kommer att beräkna det totala antalet kunder för vilka vi har genererat churn-prediktioner.
-
Märk måttet Total # of Customers.
-
Ställ in Nummerformatering till Nummer och presentera värdena i formatet 1,000 (utan decimaler eller procentvärden).
-
Skapa ytterligare ett tomt KPI-diagram. Lägg till följande mått:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Detta är ett mängduttryck som beräknar antalet gånger värdet yes visades i fältet Churned_predicted.
-
Märk måttet Predicted to Churn.
-
Konfigurera nummerformateringen för diagrammet med samma inställningar som den första KPI:n.
-
Skapa ett tredje tomt KPI-diagram. Lägg till följande mått:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Detta beräknar antalet gånger värdet no visades i fältet Churned_predicted.
-
Märk måttet Predicted to Stay.
Histogram
Du kan visualisera fördelningen av prediktionssannolikhetsvärden med ett histogram.
Dra ett histogram till arket och ge det en titel. Lägg till Churned_yes som dimension.
Flervärdes stapeldiagram
För att analysera prediktioner efter ett kategoriskt fält, till exempel plantyp, kan du skapa ett stapeldiagram med individuella mängdanalyser staplade ovanpå varandra.
Gör följande:
-
Dra ett stapeldiagram till arket och ge det titeln Churn Predictions by Plan Type.
-
Lägg till PlanType som en dimension. Märk den Plan Type.
-
Lägg till följande mått:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Märk måttet Predicted to Stay.
-
Lägg till följande mått:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Märk måttet Predicted to Churn.
-
Under Utseende > Presentation ändrar du layouten från Grupperad till Flervärdes.
-
Ta bort rullningslisten och ställ in Värdeetiketter till På.
-
Konfigurera Segmentetiketter och Totaletiketter till Auto.
När du är klar kan du skapa ett liknande stapeldiagram med samma två mått, men med en annan kategorisk dimension, till exempel NumberOfPenalties.
Distributionsdiagram för att analysera individuella numeriska fältvärden
Ett distributionsdiagram kan användas för att presentera prediktionsdata efter ett mått med olika numeriska värden. I det här delavsnittet kommer du att skapa ett diagram för att visa churn-prediktioner efter grundavgift, med distinkta grupperingar för kundens servicebetyg.
Gör följande:
-
Dra ett distributionsdiagram till arket och ge det titeln Churn Predictions by Base Fee and Service Rating.
-
Lägg till AccountID som dimension för punkterna.
-
Lägg till följande mått på x-axeln:
=Avg(BaseFee) -
Lägg till följande beräknade dimension på y-axeln:
=Round(ServiceRating,2)Detta skapar grupperingar längs y-axeln för ungefärliga ServiceRating-värden. Ju högre värde, desto högre har kunden betygsatt kvaliteten på sin tjänst.
-
Under Utseende > Presentation minskar du Bubbelstorlek till 20 och slår på Jitter-punkter.
-
I Färger och teckenförklaring ställer du in Färger till Anpassad.
-
Välj alternativet att färglägga data efter följande dimension:
=Churned_predictedDetta kommer att tilldela en färg för vart och ett av värdena i fältet Churned_predicted. I det här fallet kommer två färger att visas.
-
Lägg till etiketter till dimensionen och måttet, och lägg till följande etikett till den anpassade färginställningen: Predicted to Churn.
Liknande diagram kan skapas för analyser av olika numeriska fält genom att byta ut andra fältaggregeringar i stället för måttet BaseFee.
Konfigurera visualiseringarna på arket så att de ser ut ungefär som på bilden nedan.
Ark för prediktionsanalys

Andra arket: Instrumentpanel för aggregerad SHAP
Därefter skapar du ett ark dedikerat till att analysera de aggregerade SHAP-värdena.
Gör följande:
-
Skapa ett nytt ark.
-
Ge arket en titel (till exempel Aggregated SHAP).
SHAP-betydelse rangordning
Den här typen av diagram liknar det autogenererade som du kanske har sett när du konfigurerade dina experimentversioner. Här kommer vi att göra ett för det förutsagda datasetet.
Syftet med den här typen av diagram är att visa de funktioner som bidrar mest till utfallen som ses i kolumnen Churned. Vi måste vara medvetna om att eftersom vi kommer att använda absoluta värden kan SHAP-resultaten vara antingen positiva (värdet yes) eller negativa (värdet no). Om du föredrar det kan du också använda ett uttryck som inte beräknar det absoluta värdet.
Gör följande:
-
Dra ett stapeldiagram till det tomma arket.
-
Ge diagrammet titeln SHAP Importance by Feature.
-
Lägg till automl_feature som en dimension och märk den Feature.
Detta gör att du kan presentera aggregerade data över alla inkluderade funktioner.
-
Lägg till följande beräknade mått:
=fabs(Avg(SHAP_value)) -
Under Etikett skriver du Average Absolute SHAP.
-
I egenskapspanelen, under Utseende > Presentation, tar du bort rullningslisten om den finns och ställer in diagrammets orientering från Vertikal till Horisontell.
-
Under Sortering drar du måttet ovanför dimensionen om det inte redan är gjort. Lämna sorteringen av varje fält till Auto.
Detta sorterar diagrammet efter måttvärden i ett fallande mönster.
Trellis container/spaljébehållare
Du kan skapa en Trellis container/spaljébehållare för att filtrera data för specifika fältvärden inom en dimension. I det här fallet kan vi dela upp SHAP-värdena för var och en av de fyra plantyperna som erbjuds kunderna.
För att skapa ett Trellis-objekt måste du ange en dimension och en originalvisualisering. Vi kommer att konvertera SHAP-betydelsens rangordning som vi just skapade till en originalvisualisering.
Gör följande:
- Högerklicka på diagrammet Average Absolute SHAP i arket och välj sedan
Lägg till i originalobjekt.
- Behåll standardnamnet och klicka på Lägg till.
-
Under Anpassade objekt > Qlik Visualization bundle i resurspanelen drar du en Trellis container/spaljébehållare till arket.
-
Lägg till PlanType som en dimension.
-
Klicka på Lägg till originalvisualisering inuti diagrammet och lägg sedan till diagrammet Average Absolute SHAP.
-
Under Utseende > Allmänt i egenskapspanelen slår du på Visa titlar och ger diagrammet titeln SHAP Importance by Plan Type.
-
Ändra storlek på Trellis container/spaljébehållaren så att den är tillräckligt bred för att visa namnen på funktionerna i diagrammen. Om alla etiketter inte visas justerar du zoomen i webbläsarfönstret.
Alternativt kan du visa dessa data genom att skapa individuella diagram med mängduttryck för varje dimensionsvärde du vill analysera. I det här fallet kan du skapa ett separat diagram för var och en av de fyra plantyperna.
Återanvända filterrutan
Filterrutan du skapade på det första arket kan återanvändas på det här arket. I arkets redigeringsläge högerklickar du på filterrutan och kopierar den. Klistra in den i arket Aggregated SHAP.
Trädkarta
Du kan också visualisera uppdelningen av SHAP-värdena med en trädkarta. Dra en trädkarta till arket och lägg till samma dimension och mått som du använde i SHAP-betydelsens rangordning.
Konfigurera visualiseringarna på arket så att de ser ut ungefär som på bilden nedan.
Arket Aggregated SHAP i analysläge

Använda applikationen
När du har byggt klart applikationen är den redo att användas för dataanalys.
Klicka på Redigera ark för att växla till analysläge. I den här vyn kan du göra val (i filterrutorna eller någon annanstans i arket) för att filtrera data för specifik analys av delmängder av data. Du kanske till exempel vill analysera en specifik kundplantyp eller region och jämföra resultaten med andra delmängder av data.
Tack!
Du har nått slutet av den här handledningen. Vi hoppas att du har lärt dig ett och annat och insett att automatiserad maskininlärning är ett snabbt och enkelt sätt att generera prediktiva modeller. Qlik Sense är ett kraftfullt verktyg som gör det enkelt att visualisera dina prediktionsdata och ge meningsfulla insikter i dina data.