Visualisera förutsägelsedata i en Qlik Sense-app
Det sista steget i processen är att skapa en Qlik Sense-analysapp för att visualisera de prognosdata du har genererat.
Alternativt arbetsflöde: ladda upp förkonfigurerad app
I stället för att följa de återstående stegen i det här avsnittet kan du ladda upp Customer churn predictions.qvf-appen, som du laddade ned i början av den här introduktionskursen, till aktivtetscentret för Analyser.
Det återstående avsnittet på den här sidan guidar dig genom att skapa en liknande app. Det kommer att finnas några skillnader mellan förutsägelsedata i appen och dina egna förutsägelsedata.
Appen som kan hämtas innehåller ytterligare ett ark benämnt Individual Customer Analysis som använder villkorliga uttryck för att uppmuntra detaljerad analys av ett enda kundkonto i taget.
Komma igång
Från aktivitetscentret för Analyser gå till sidan Skapa och klicka på Analysappen.Välj ett utrymme för appen och namnge den Kundförlustprognoser.
Klicka på Skapa.
Skapa datamodellen
Välja dina data
Du behöver lägga till nödvändiga data i din app. De består av den tillämpade datauppsättningen som laddades upp i början av introduktionskursen och de två datauppsättningarna som genererades från förutsägelsen.
Gör följande:
-
I den nya appen klickar du för att lägga till data från Datakatalog.
-
I Datakatalog klickar du på kryssrutorna intill de följande tre datauppsättningarna:
-
Datauppsättning för tillämpning: AutoML Tutorial - Churn data - apply.csv eller AutoML Tutorial - Churn data - apply.qvd
-
Datauppsättning för förutsägelse: AutoML Tutorial - Churn data - apply_Prediction.csv
-
Koordinera SHAP-datauppsättning: AutoML Tutorial - Churn data - apply_Prediction_Coordinate_SHAP.csv
-
-
Klicka på Nästa.
-
En sammanfattningspanel öppnas. Klicka på AutoML Tutorial - Churn data - apply.csv-datauppsättningen för att utöka de tillgängliga fälten och ladda in dem.
-
Klicka på -ikonen vid de funktioner som avmarkerades under modellträningen. Detta ska vara DaysSinceLastService och alla funktioner som du har avmarkerat på grund av liten påverkan på modellen.
-
Klicka på Läs in i appen.
Associera data
I det här läget har du lagt till data i appen, men en kopplad datamodell konstrueras inte förrän du associerar datauppsättningarna med varandra. I det här fallet blir fältet AccountID det indexeringsfält som länkar datauppsättningarna till varandra.
I din app öppnas nu Datahanteraren. Du kommer att se tre datauppsättningar, men de visas som separata entiteter som inte är kopplade.
Gör följande:
-
I din app öppnas nu Datahanteraren. Du kommer att se tre datauppsättningar, men de visas som separata entiteter som inte är kopplade.
-
På panelen på höger sida av Datahanteraren visas förslaget till AccountID-associering.
-
Klicka på Tillämpa. Tabellerna ska nu vara kopplade till varandra.
-
Klicka på Ladda data.
Kontrollera dina associationer i Datamodellvyn
Innan du bygger några visualiseringar i appen ska du verifiera att data har associeras korrekt.
Gör följande:
-
I navigeringsfältet högst upp i gränssnittet öppnar du appnavigeringsmenyn och väljer Datamodellvyn.
-
Kontrollera att de tre datauppsättningarna har kopplats korrekt. Fältet AccountID ska vara nyckelfält i alla tre datauppsättningarna. Appens datamodell ska se ut som i följande bild.
Du är nu redo för att börja bygga ditt analysinnehåll. Klicka på Ark under fliken Analysera i navigeringsfältet.
Första arket: instrumentpanel för aggregerade förutsägelser
Det första arket fokuserar på analys av förutsägelser i aggregerad form.
Gör följande:
-
Du ska nu vara i redigeringsläget för arket. Klicka på Avancerade alternativ.
-
Högerklicka på alla befintliga visualiseringar i arket och ta bort dem. Det här är en diagramförslagsfunktion som vi inte kommer att använda i den här introduktionskursen.
-
Ge arket ett namn, till exempel Aggregerade förutsägelser. För att göra det klickar du var som helst i det tomma arket för att öppna Arkegenskaper på gränssnittets högra sida. Skriv ett namn på arket under Rubrik.
Cirkeldiagram
Ett cirkeldiagram låter dig enkelt visualisera hur dina data är proportionellt uppdelade. I det här fallet är det lämpligt att dela upp data efter förutsedda resultat (yes eller no).
Gör följande:
-
Dra ett cirkeldiagram till arket.
-
Lägg till Churned_predicted som en dimension.
-
Lägg till Count(AccountID) som ett mått.
-
Stäng vid behov av Dimensionsetikett under Utseende > Presentation i egenskapspanelen.
-
Utöka dimensionen under Data i egenskapspanelen och ändra Etiketten för dimensionen till Predicted to Churn.
Etiketten uppdateras i teckenförklaringen.
Filterruta
Den här instrumentpanelen kommer att användas för bred analys av hela datamodellen. Men det kommer nästan säkert att vara viktigt att snabbt kunna filtrera data genom olika dimensioner för att analysera specifika kohorter.
Skapa en filterruta med olika listrutor. Det går att välja värden inom en enstaka dimension i alla listrutor.
Gör följande:
-
Dra en filterruta till arket.
-
Lägg till fält i filterrutan. Det här kan vara dimensioner som du förväntar dig ska vara signifikanta för de förutsedda resultaten.
-
Ändra alla listrutor efter behov genom att klicka på fältet under Data i egenskapspanelen. Då öppnas Egenskaper för listruta.
Du kan exempelvis vilja ändra fältetiketten och ställa in Dölj listruta till Alltid för att spara arkutrymme.
Ändra storlek på filterrutan så att den visas som en panel på arkets ena sida.
KPI-objekt
KPI:er är ett bra sätt att visa ett enstaka värde för en speciellt viktig analys av dina data. Här skapar vi tre KPI-diagram.
Gör följande:
-
Skapa ett tomt KPI-diagram. Lägg till följande mått:
=Count(Churned_predicted)
Detta beräknar det sammanlagda antal kunder för vilka vi har genererat kundförlustprognoser.
-
Ge måttet etiketten Sammanlagt antal kunder.
-
Ange Talformat till Tal och presentera värdet i formatet 1 000 (utan decimaler eller procentvärden).
-
Skapa ännu ett tomt KPI-diagram. Lägg till följande mått:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Detta är ett set-uttryck som beräknar hur många gånger värdet yes visades i fältet Churned_predicted.
-
Ge måttet etiketten Förväntas gå förlorad.
-
Konfigurera diagrammets talformatering på samma sätt som för föregående KPI.
-
Skapa ett tredje tomt KPI-diagram. Lägg till följande mått:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Detta beräknar hur många gånger värdet no visades i fältet Churned_predicted.
-
Ge måttet etiketten Förväntas finnas kvar.
Histogram
Du kan visualisera fördelningen av sannolikhetsvärden för förutsägelser med ett histogram.
Dra ett histogram till arket och ge det ett namn. Lägg till Churned_yes som dimension.
Stapeldiagram med flervärdesstaplar
För att analysera prognoser efter ett kategorifält, till exempel avtalstyp, kan du skapa ett stapeldiagram med enskilda set-analyser staplade ovanpå varandra.
Gör följande:
-
Dra ett stapeldiagram till arket och ge det rubriken Prognoser om kundförlust efter avtalstyp.
-
Lägg till PlanType som en dimension. Ge den etiketten Avtalstyp.
-
Lägg till följande mått:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Ge måttet etiketten Förväntas finnas kvar.
-
Lägg till följande mått:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Ge måttet etiketten Förväntas gå förlorad.
-
Under Utseende > Presentation ändrar du layout från Grupperad till Staplad.
-
Ta bort rullningslisten och ange Värdeetiketter till På.
-
Konfigurera Etiketter för segment och Etiketter för totaler till Automatiskt.
När du är klar kan du skapa ett motsvarande stapeldiagram med samma två mått, men med en annan kategorisk dimension, till exempel NumberOfPenalties.
Fördelningsdiagram för att analysera enskilda värden för numeriska fält
Ett föredelningsdiagram kan användas för att presentera prognosdata per mått med olika numeriska värden. I det här avsnittet kommer du att skapa ett diagram för att visa prognoser för kundförlust per grundavgift, med skilda grupper för kunders servicebetyg.
Gör följande:
-
Dra ett fördelningsdiagram till arket och ge det titeln Prognos för kundförlust per grundavgift och servicebetyg.
-
Lägg till AccountID som dimension för punkterna.
-
Lägg till följande mått på X-axeln:
=Avg(BaseFee)
-
Lägg till följande beräknade dimension på Y-axeln:
=Round(ServiceRating,2)
Detta skapar grupperingar längs Y-axeln för ungefärliga ServiceRating-värden. Ju högre värden, desto högre har kunden bedömt kvaliteten på servicen.
-
Under Utseende > Presentation minskar du Bubblans storlek till 20 och aktiverar Jitterpunkter.
-
I Färger och teckenförklaring anger du Färger till Anpassat.
-
Välj alternativet att färglägga data efter följande dimension:
=Churned_predicted
Detta tilldelar en färg till varje värde i fältet Churned_predicted. I det här fallet kommer det att visas två färger.
-
Lägg till etiketter för dimensionen och måttet, och lägg till följande etikett för den anpassade färginställningen: förväntas gå förlorad.
Liknande diagram kan skapas för analyser av olika numeriska fält genom att ersätta andra fältaggregeringar i stället för måttet BaseFee.
Konfigurera visualiseringarna i arket så att de liknar bilden nedan.
Andra arket: aggregerad SHAP-kontrollpanel
Skapa därefter ett ark som används för att analysera de aggregerade SHAP-värdena.
Gör följande:
-
Skapa ett nytt ark och öppna det avancerade redigeringsläget.
-
Ge arket ett namn (till exempel Aggregerad SHAP).
Rangordning av SHAP importance
Den här typen av diagram liknar det automatiskt genererade som du kan ha sett när du konfigurerade dina experimentversioner. Här kommer vi att göra ett för den prognostiserade datauppsättningen.
Syften med den här typen av diagram är att visa de funktioner som har störst bidrag till det utfall som visas i kolumnen Churned. Vi måste vara medvetna om att eftersom vi använder absoluta värden kan SHAP-resultaten vara antingen positiva (värdet yes) eller negativa (värdet no). Om du föredrar kan du också använda ett uttryck som inte beräknar det absoluta värdet.
Gör följande:
-
Dra ett stapeldiagram till det tomma arket.
-
Ge diagrammet rubriken SHAP-betydelse efter funktion.
-
Lägg till automl_feature som en dimension och ge den etiketten Funktion.
Detta gör att du kan presentera aggregerade data över alla funktioner som ingår.
-
Lägg till följande beräknade mått:
=fabs(Avg(SHAP_value))
-
Under Etikett skriver du Genomsnittligt absolut SHAP.
-
I egenskapspanelen, under Utseende > Presentation, tar du bort rullningslisten om det finns en sådan och ändrar diagrammets orientering från Vertikal till Horisontell.
-
Under Sortering drar du måttet ovanför dimensionen om detta inte redan gjorts. Lämna sorteringen för varje fält på Automatiskt.
Detta sorterar diagrammet efter mätvärden i ett fallande mönster.
Spaljébehållare
Du kan göra en spaljébehållare för att filtrera data för specifika fältvärden inom en dimension. I det här fallet kan vi bryta ned SHAP-värdena för var och en av de fyra avtalstyperna som erbjuds kunderna.
För att skapa ett spaljéobjekt måste du ange en dimension och en originalvisualisering. Vi konverterar den SHAP importance-rangordning som vi nyss skapade till en originalvisualisering.
Gör följande:
- Högerklicka på diagrammet Genomsnittlig absolut SHAP i arket och välj sedan Lägg till bland originalen.
- Behåll standardnamnet och klicka på Lägg till.
-
Under Anpassade objekt > Qlik Visualization Bundle i resurspanelen drar du en spaljébehållare till arket.
-
Lägg till PlanType som en dimension.
-
Klicka på Lägg till originalvisualisering inuti diagrammet och lägg sedan till diagrammet Genomsnittligt absolut SHAP.
-
Under Utseende > Allmänt i egenskapsfönstret aktiverar du Visa rubrik och ger diagrammet namnet SHAP-betydelse efter avtalstyp.
-
Ändra storlek på spaljébehållaren så att den är tillräckligt bred för att visa namnen på funktioner i diagrammen. Om det inte går att se alla etiketter justerar du zoomningen i webbläsarfönstret.
Alternativt kan du visa dessa data genom att skapa enskilda diagram med fasta uttryck för varje dimensionsvärde du vill analysera. I det här fallet kan du skapa ett separat diagram för var och en av de fyra avtalstyperna.
Återanvända filterrutan
Den filterruta som du skapade på det första arket kan återanvändas på det här arket. I avancerat redigeringsläge högerklickar du på filterrutan och kopierar den. Klistra in den i arket Aggregerad SHAP.
Trädkarta
Du kan också visualisera uppdelningen av SHAP-värden med en trädkarta. Dra en trädkarta till arket och lägg till samma dimension och mått som du använde i SHAP-rangordningen av betydelse.
Konfigurera visualiseringarna i arket så att de liknar bilden nedan.
Använda appen
När du har byggt färdigt appen är den klar att användas för dataanalys.
Klicka på Redigera ark för att växla till analysläge. I den här vyn kan du göra val (i filterrutorna eller på något annat ställe i arket) för att filtrera data för specifik analys av delmängderna av data. Du kan exempelvis vilja analysera avtalstypen eller regionen för en specifik och jämföra resultaten med andra delmängder med data.
Tack!
Nu är introduktionskursen nästan slut. Vi hoppas att du har lärt dig en del och insett att automatiserad maskininlärning är ett snabbt och enkelt sätt att skapa prediktiva modeller. Qlik Sense är ett kraftfullt verktyg som gör det enkelt att visualisera dina prognosdata och ge meningsfulla insikter i dina data.