Visualisera prediktionsdata i en Qlik Sense-applikation | Qlik CloudHjälp
Gå till huvudinnehåll Gå till ytterligare innehåll

Visualisera prediktionsdata i en Qlik Sense-applikation

Det sista steget i processen är att skapa en Qlik Sense-analysapplikation för att visualisera de prediktionsdata du har genererat.

Alternativt arbetsflöde: Ladda upp förkonfigurerad applikation

Istället för att följa de återstående stegen i det här delavsnittet kan du ladda upp applikationen Customer churn predictions.qvf, som du hämtade i början av den här handledningen, till Analyser aktivitetscenter.

De återstående delavsnitten på den här sidan guidar dig genom skapandet av en liknande applikation. Det kommer att finnas vissa skillnader mellan prediktionsdata i applikationen och dina egna prediktionsdata.

Den nedladdningsbara applikationen innehåller ett ytterligare ark med titeln Individual Customer Analysis, som använder villkorsuttryck för att uppmuntra detaljerad analys av ett enskilt kundkonto i taget.

Komma igång

Från Analyser-aktivitetscentret, gå till sidan Skapa och klicka på Applikation. Välj ett utrymme för applikationen och namnge den Customer churn predictions.

Klicka på Skapa.

Anteckning om informationSättet du interagerar med din applikation på är annorlunda om du använder en enhet med pekskärm, eller om pekstöd är aktiverat. Mer information finns i Meny för lång tryckning (enheter med pekskärm).

Skapa datamodellen

Välja dina data

Du måste lägga till nödvändiga data i din applikation. Detta består av tillämpningsdatasetet (uppladdat i början av handledningen) och de två dataseten som genererats från prediktionen.

  1. I den nya applikationen klickar du för att lägga till data från Datakatalog.

  2. I Datakatalog klickar du på kryssrutorna bredvid följande tre dataset:

    • Tillämpningsdataset ML - Churn data - apply.csv eller ML - Churn data - apply.qvd

    • Prediktionsdataset: ML - Prediction output.parquet

    • Coordinate SHAP-dataset: ML - Prediction output_Coordinate_SHAP.parquet

  3. Klicka på Nästa.

  4. En sammanfattningspanel visas. Klicka på datasetet ML - Churn data - apply för att expandera de tillgängliga fälten att ladda.

  5. Klicka på ikonen Kryssmarkering bredvid eventuella funktioner som avmarkerades under modellträningen. Du måste behålla AccountID i listan eftersom det är ett nyckelfält. Som referens kan du återvända till den prediktionskonfiguration du skapade och jämföra scheman för modellen och tillämpningsdatasetet (För allmän hjälp, se Redigera prognoskonfigurationer.).

  6. Klicka på Ladda i app.

Associera data

Vid det här laget har du lagt till data i applikationen, men en ansluten datamodell konstrueras inte förrän du associerar dataseten med varandra. I det här fallet kommer fältet AccountID att vara indexet som länkar samman dataseten.

I din applikation är Datahanteraren nu öppen. Du kommer att se de tre dataseten, men de visas som separata enheter som inte är anslutna.

  1. I din applikation är Datahanteraren nu öppen. Du kommer att se de tre dataseten, men de visas som separata enheter som inte är anslutna.

  2. I den högra rutan i Datahanteraren letar du upp associationsförslaget AccountID.

  3. Klicka på Tillämpa. Tabellerna bör nu vara anslutna till varandra.

  4. Klicka på Ladda data.

Kontrollera dina associationer i Datamodellvyn

Innan du bygger några visualiseringar i applikationen bör du verifiera att data har associerats korrekt.

  1. I navigeringsfältet högst upp i gränssnittet öppnar du applikationens navigeringsmeny och väljer Datamodellvyn.

  2. Kontrollera att de tre dataseten har anslutits korrekt. Fältet AccountID bör fungera som en nyckel över alla tre dataseten. Applikationens datamodell bör se ut som på följande bild.

    Datamodellvyn som visar datamodellen för prediktionsapplikationen

    Kontrollerar att datamodellen för vår nyskapade prediktionsapp har konfigurerats korrekt. I det här fallet bör de tre dataseten vara anslutna med fältet AccountID.

Du är nu redo att börja bygga analysinnehåll. Klicka på Ark under fliken Analysera i navigeringsfältet.

Första arket: Instrumentpanel för aggregerade prediktioner

Det första arket kommer att fokusera på analys av prediktionerna i aggregerad form.

  1. Du bör nu befinna dig i arkets redigeringsläge.

  2. Högerklicka på valfri befintlig visualisering i arket och ta bort den. Detta är en funktion för diagramförslag som vi inte kommer att använda i den här handledningen.

  3. Ge arket en titel, till exempel Aggregated Predictions. För att göra detta klickar du var som helst i det tomma arket för att öppna Arkegenskaper på höger sida av gränssnittet. Under Titel skriver du ett namn för arket.

Cirkeldiagram

Ett cirkeldiagram låter dig enkelt visualisera den proportionella uppdelningen av dina data. I det här fallet är det logiskt att dela upp data efter de förutsagda utfallen (yes eller no).

  1. Dra ett cirkeldiagram till arket.

  2. Lägg till Churned_predicted som en dimension.

  3. Lägg till följande mått:

    Count(AccountID)
  4. Om så önskas, stäng av Dimensionsetikett under UtseendePresentation i egenskapspanelen.

  5. Expandera dimensionen under  Data i egenskapspanelen och ändra Etikett för dimensionen till Predicted to Churn.

    Etiketten uppdateras i teckenförklaringen.

Filterruta

Den här instrumentpanelen kommer att vara för bred analys av hela datamodellen. Det kommer dock med största sannolikhet att vara viktigt att snabbt kunna filtrera data över olika dimensioner för att analysera specifika kohorter.

Skapa en filterruta med flera listrutor. Varje listruta tillåter val av värden inom en enda dimension.

  1. Dra en filterruta till arket.

  2. Lägg till fält i filterrutan. Dessa kan vara dimensioner som du förväntar dig ska vara betydelsefulla för de förutsagda utfallen.

  3. Ändra varje listruta efter behov genom att klicka på fältet under Data i egenskapspanelen. Detta öppnar Listruteegenskaper.

    Du kanske till exempel vill ändra fältetiketten och ställa in Dölj listruta till Alltid för att spara utrymme på arket.

Ändra storlek på filterrutan så att den visas som en panel på ena sidan av arket.

KPI-objekt

KPI:er är ett utmärkt sätt att visa ett enskilt värde för en särskilt viktig analys av dina data. Här kommer vi att skapa tre KPI-diagram.

  1. Skapa ett tomt KPI-diagram. Lägg till följande mått:

    =Count(Churned_predicted)

    Detta kommer att beräkna det totala antalet kunder för vilka vi har genererat churn-prediktioner.

  2. Märk måttet Total # of Customers.

  3. Ställ in Nummerformatering till Nummer och presentera värdena i formatet 1,000 (utan decimaler eller procentvärden).

  4. Skapa ytterligare ett tomt KPI-diagram. Lägg till följande mått:

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Detta är ett mängduttryck som beräknar antalet gånger värdet yes visades i fältet Churned_predicted.

  5. Märk måttet Predicted to Churn.

  6. Konfigurera nummerformateringen för diagrammet med samma inställningar som den första KPI:n.

  7. Skapa ett tredje tomt KPI-diagram. Lägg till följande mått:

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Detta beräknar antalet gånger värdet no visades i fältet Churned_predicted.

  8. Märk måttet Predicted to Stay.

Histogram

Du kan visualisera fördelningen av prediktionssannolikhetsvärden med ett histogram.

Dra ett histogram till arket och ge det en titel. Lägg till Churned_yes som dimension.

Flervärdes stapeldiagram

För att analysera prediktioner efter ett kategoriskt fält, till exempel plantyp, kan du skapa ett stapeldiagram med individuella mängdanalyser staplade ovanpå varandra.

  1. Dra ett stapeldiagram till arket och ge det titeln Churn Predictions by Plan Type.

  2. Lägg till PlanType som en dimension. Märk den Plan Type.

  3. Lägg till följande mått:

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Märk måttet Predicted to Stay.

  4. Lägg till följande mått:

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Märk måttet Predicted to Churn.

  5. Under UtseendePresentation ändrar du layouten från Grupperad till Flervärdes.

  6. Ta bort rullningslisten och ställ in Värdeetiketter till .

  7. Konfigurera Segmentetiketter och Totaletiketter till Auto.

När du är klar kan du skapa ett liknande stapeldiagram med samma två mått, men med en annan kategorisk dimension, till exempel NumberOfPenalties.

Distributionsdiagram för att analysera individuella numeriska fältvärden

Ett distributionsdiagram kan användas för att presentera prediktionsdata efter ett mått med olika numeriska värden. I det här delavsnittet kommer du att skapa ett diagram för att visa churn-prediktioner efter grundavgift, med distinkta grupperingar för kundens servicebetyg.

  1. Dra ett distributionsdiagram till arket och ge det titeln Churn Predictions by Base Fee and Service Rating.

  2. Lägg till AccountID som dimension för punkterna.

  3. Lägg till följande mått på x-axeln:

    =Avg(BaseFee)
  4. Lägg till följande beräknade dimension på y-axeln:

    =Round(ServiceRating,2)

    Detta skapar grupperingar längs y-axeln för ungefärliga ServiceRating-värden. Ju högre värde, desto högre har kunden betygsatt kvaliteten på sin tjänst.

  5. Under UtseendePresentation minskar du Bubbelstorlek till 20 och slår på Jitter-punkter.

  6. I Färger och teckenförklaring ställer du in Färger till Anpassad.

  7. Välj alternativet att färglägga data efter följande dimension:

    =Churned_predicted

    Detta kommer att tilldela en färg för vart och ett av värdena i fältet Churned_predicted. I det här fallet kommer två färger att visas.

  8. Lägg till etiketter till dimensionen och måttet, och lägg till följande etikett till den anpassade färginställningen: Predicted to Churn.

Liknande diagram kan skapas för analyser av olika numeriska fält genom att byta ut andra fältaggregeringar i stället för måttet BaseFee.

Konfigurera visualiseringarna på arket så att de ser ut ungefär som på bilden nedan.

Ark för prediktionsanalys

Instrumentpanel för prediktioner med diagramobjekt för att analysera prediktionsdata.

Andra arket: Instrumentpanel för aggregerad SHAP

Därefter skapar du ett ark dedikerat till att analysera de aggregerade SHAP-värdena.

  1. Skapa ett nytt ark.

  2. Ge arket en titel (till exempel Aggregated SHAP).

SHAP-betydelse rangordning

Den här typen av diagram liknar det autogenererade som du kanske har sett när du konfigurerade dina experimentversioner. Här kommer vi att göra ett för det förutsagda datasetet.

Syftet med den här typen av diagram är att visa de funktioner som bidrar mest till utfallen som ses i kolumnen Churned. Vi måste vara medvetna om att eftersom vi kommer att använda absoluta värden kan SHAP-resultaten vara antingen positiva (värdet yes) eller negativa (värdet no). Om du föredrar det kan du också använda ett uttryck som inte beräknar det absoluta värdet.

  1. Dra ett stapeldiagram till det tomma arket.

  2. Ge diagrammet titeln SHAP Importance by Feature.

  3. Lägg till automl_feature som en dimension och märk den Feature.

    Detta gör att du kan presentera aggregerade data över alla inkluderade funktioner.

  4. Lägg till följande beräknade mått:

    =fabs(Avg(SHAP_value))
  5. Under Etikett skriver du Average Absolute SHAP.

  6. I egenskapspanelen, under Utseende > Presentation, tar du bort rullningslisten om den finns och ställer in diagrammets orientering från Vertikal till Horisontell.

  7. Under Sortering drar du måttet ovanför dimensionen om det inte redan är gjort. Lämna sorteringen av varje fält till Auto.

    Detta sorterar diagrammet efter måttvärden i ett fallande mönster.

Trellis container/spaljébehållare

Du kan skapa en Trellis container/spaljébehållare för att filtrera data för specifika fältvärden inom en dimension. I det här fallet kan vi dela upp SHAP-värdena för var och en av de fyra plantyperna som erbjuds kunderna.

För att skapa ett Trellis-objekt måste du ange en dimension och en originalvisualisering. Vi kommer att konvertera SHAP-betydelsens rangordning som vi just skapade till en originalvisualisering.

  1. Högerklicka på diagrammet Average Absolute SHAP i arket och välj sedan Länkat objekt Lägg till i originalobjekt.
  2. Behåll standardnamnet och klicka på Lägg till.
  3. Under Anpassade objekt > Qlik Visualization bundle i resurspanelen drar du en Trellis container/spaljébehållare till arket.

  4. Lägg till PlanType som en dimension.

  5. Klicka på Lägg till originalvisualisering inuti diagrammet och lägg sedan till diagrammet Average Absolute SHAP.

  6. Under UtseendeAllmänt i egenskapspanelen slår du på Visa titlar och ger diagrammet titeln SHAP Importance by Plan Type.

  7. Ändra storlek på Trellis container/spaljébehållaren så att den är tillräckligt bred för att visa namnen på funktionerna i diagrammen. Om alla etiketter inte visas justerar du zoomen i webbläsarfönstret.

Alternativt kan du visa dessa data genom att skapa individuella diagram med mängduttryck för varje dimensionsvärde du vill analysera. I det här fallet kan du skapa ett separat diagram för var och en av de fyra plantyperna.

Återanvända filterrutan

Filterrutan du skapade på det första arket kan återanvändas på det här arket. I arkets redigeringsläge högerklickar du på filterrutan och kopierar den. Klistra in den i arket Aggregated SHAP.

Trädkarta

Du kan också visualisera uppdelningen av SHAP-värdena med en trädkarta. Dra en trädkarta till arket och lägg till samma dimension och mått som du använde i SHAP-betydelsens rangordning.

Konfigurera visualiseringarna på arket så att de ser ut ungefär som på bilden nedan.

Arket Aggregated SHAP i analysläge

Hela arket i konsumtionsläge som visar olika SHAP-baserade visualiseringar.

Använda applikationen

När du har byggt klart applikationen är den redo att användas för dataanalys.

Klicka på Redigera ark för att växla till analysläge. I den här vyn kan du göra val (i filterrutorna eller någon annanstans i arket) för att filtrera data för specifik analys av delmängder av data. Du kanske till exempel vill analysera en specifik kundplantyp eller region och jämföra resultaten med andra delmängder av data.

Tack!

Du har nått slutet av den här handledningen. Vi hoppas att du har lärt dig ett och annat och insett att automatiserad maskininlärning är ett snabbt och enkelt sätt att generera prediktiva modeller. Qlik Sense är ett kraftfullt verktyg som gör det enkelt att visualisera dina prediktionsdata och ge meningsfulla insikter i dina data.

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!