De voorspellingsgegevens visualiseren in een Qlik Sense applicatie
De laatste stap in het proces is het maken van een Qlik Sense analytics-applicatie om de voorspellingsgegevens die u hebt gegenereerd te visualiseren.
Alternatieve workflow: Vooraf geconfigureerde applicatie uploaden
In plaats van de resterende stappen in dit onderwerp te volgen, kunt u de applicatie Customer churn predictions.qvf, die u aan het begin van deze tutorial hebt gedownload, uploaden naar het Analyse activiteitencentrum.
De resterende secties op deze pagina leiden u door het maken van een vergelijkbare applicatie. Er zullen enkele verschillen zijn tussen de voorspellingsgegevens in de applicatie en uw eigen voorspellingsgegevens.
De downloadbare applicatie bevat een extra werkblad met de titel Individual Customer Analysis, dat voorwaardelijke uitdrukkingen gebruikt om gedetailleerde analyse van één klantaccount tegelijk aan te moedigen.
Aan de slag
Ga vanuit het Analyse activiteitencentrum naar de pagina Maken en klik op Applicatie. Selecteer een ruimte voor de applicatie en noem deze Customer churn predictions.
Klik op Maken.
Het gegevensmodel maken
Uw gegevens selecteren
U moet de benodigde gegevens toevoegen aan uw applicatie. Dit bestaat uit de toepassingsgegevensset (geüpload aan het begin van de tutorial) en de twee gegevenssets die zijn gegenereerd op basis van de voorspelling.
Doe het volgende:
-
Klik in de nieuwe applicatie om gegevens toe te voegen uit de Gegevenscatalogus.
-
Klik in de Gegevenscatalogus op de selectievakjes naast de volgende drie gegevenssets:
-
Toepassingsgegevensset: ML - Churn data - apply.csv of ML - Churn data - apply.qvd
-
Voorspellingsgegevensset: ML - Prediction output.parquet
-
Coördinaat SHAP-gegevensset: ML - Prediction output_Coordinate_SHAP.parquet
-
-
Klik op Volgende.
-
Er verschijnt een overzichtsvenster. Klik op de gegevensset ML - Churn data - apply om de beschikbare velden uit te vouwen om te laden.
-
Klik op het pictogram
naast eventuele functies die zijn gedeselecteerd tijdens de modeltraining. U moet AccountID in de lijst houden omdat het een sleutelveld is. Ga ter referentie terug naar de voorspellingsconfiguratie die u hebt gemaakt en vergelijk de schema's van het model en de toepassingsgegevensset (zie Configuraties voor voorspelling bewerken voor algemene hulp).
-
Klik op Laden in app.
De gegevens koppelen
Op dit punt hebt u de gegevens aan de applicatie toegevoegd, maar er wordt pas een verbonden gegevensmodel geconstrueerd als u de gegevenssets aan elkaar koppelt. In dit geval is het veld AccountID de index die de gegevenssets aan elkaar koppelt.
In uw applicatie is Gegevensbeheer nu geopend. U ziet de drie gegevenssets, maar ze worden weergegeven als afzonderlijke entiteiten die niet zijn verbonden.
Doe het volgende:
-
In uw applicatie is Gegevensbeheer nu geopend. U ziet de drie gegevenssets, maar ze worden weergegeven als afzonderlijke entiteiten die niet zijn verbonden.
-
Zoek in het rechtervenster van Gegevensbeheer de koppelingssuggestie AccountID.
-
Klik op Toepassen. De tabellen moeten nu met elkaar zijn verbonden.
-
Klik op Gegevens laden.
Uw koppelingen controleren in Gegevensmodelviewer
Voordat u visualisaties in de applicatie bouwt, moet u controleren of de gegevens correct zijn gekoppeld.
Doe het volgende:
-
Open in de navigatiebalk bovenaan de interface het applicatienavigatiemenu en selecteer Gegevensmodelviewer.
-
Controleer of de drie gegevenssets correct zijn verbonden. Het veld AccountID moet fungeren als een sleutel voor alle drie de gegevenssets. Het gegevensmodel van de applicatie moet eruitzien als de volgende afbeelding.
Gegevensmodelviewer die het gegevensmodel van de voorspellingsapplicatie toont
U bent nu klaar om te beginnen met het bouwen van analytics-inhoud. Klik op Werkblad op het tabblad Analyseren in de navigatiebalk.
Eerste werkblad: Dashboard met geaggregeerde voorspellingen
Het eerste werkblad richt zich op de analyse van de voorspellingen in geaggregeerde vorm.
Doe het volgende:
-
U zou zich nu in de bewerkingsmodus van het werkblad moeten bevinden.
-
Klik met de rechtermuisknop op een bestaande visualisatie in het werkblad en verwijder deze. Dit is een functie voor diagramsuggesties die we voor deze tutorial niet zullen gebruiken.
-
Geef het werkblad een titel, bijvoorbeeld Aggregated Predictions. Klik hiervoor ergens in het lege werkblad om Werkbladeigenschappen aan de rechterkant van de interface te openen. Typ onder Titel een naam voor het werkblad.
Cirkeldiagram
Met een cirkeldiagram kunt u eenvoudig de proportionele uitsplitsing van uw gegevens visualiseren. In dit geval is het logisch om de gegevens uit te splitsen naar de voorspelde uitkomsten (yes of no).
Doe het volgende:
-
Sleep een cirkeldiagram naar het werkblad.
-
Voeg Churned_predicted toe als een dimensie.
-
Voeg de volgende meting toe:
Count(AccountID) -
Schakel desgewenst Dimensielabel uit onder Uiterlijk > Presentatie in het eigenschappenvenster.
-
Vouw de dimensie uit onder Gegevens in het eigenschappenvenster en wijzig het Label voor de dimensie in Predicted to Churn.
Het label wordt bijgewerkt in de legenda.
Filtervak
Dit dashboard is bedoeld voor een brede analyse van het gehele gegevensmodel. Het zal echter vrijwel zeker belangrijk zijn om de gegevens snel over verschillende dimensies te kunnen filteren om specifieke cohorten te analyseren.
Maak een filtervak met meerdere keuzelijsten. Elke keuzelijst maakt selecties van waarden binnen een enkele dimensie mogelijk.
Doe het volgende:
-
Sleep een filtervak naar het werkblad.
-
Voeg velden toe aan het filtervak. Dit kunnen dimensies zijn waarvan u verwacht dat ze significant zijn voor de voorspelde uitkomsten.
-
Wijzig elke keuzelijst naar behoefte door op het veld onder Gegevens in het eigenschappenvenster te klikken. Hiermee opent u de Eigenschappen keuzelijst.
U wilt bijvoorbeeld het veldlabel wijzigen en Keuzelijst samenvouwen instellen op Altijd om ruimte op het werkblad te besparen.
Wijzig de grootte van het filtervak zodat het als een venster aan één kant van het werkblad verschijnt.
KPI-objecten
KPI's zijn een geweldige manier om een enkele waarde weer te geven voor een bijzonder belangrijke analyse van uw gegevens. Hier maken we drie KPI-diagrammen.
Doe het volgende:
-
Maak een leeg KPI-diagram. Voeg de volgende meting toe:
=Count(Churned_predicted)Dit berekent het totale aantal klanten waarvoor we churn-voorspellingen hebben gegenereerd.
-
Label de meting Total # of Customers.
-
Stel Getalnotatie in op Getal en presenteer de waarden in de notatie 1.000 (zonder decimalen of percentage-waarden).
-
Maak nog een leeg KPI-diagram. Voeg de volgende meting toe:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Dit is een set-uitdrukking die het aantal keren berekent dat de waarde yes werd weergegeven in het veld Churned_predicted.
-
Label de meting Predicted to Churn.
-
Configureer de getalnotatie van het diagram met dezelfde instellingen als de eerste KPI.
-
Maak een derde leeg KPI-diagram. Voeg de volgende meting toe:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Dit berekent het aantal keren dat de waarde no werd weergegeven in het veld Churned_predicted.
-
Label de meting Predicted to Stay.
Histogram
U kunt de verdeling van voorspellingswaarschijnlijkheidswaarden visualiseren met een histogram.
Sleep een histogram naar het werkblad en geef het een titel. Voeg Churned_yes toe als de dimensie.
Gestapelde staafdiagrammen
Om voorspellingen te analyseren op basis van een categorisch veld, zoals plantype, kunt u een staafdiagram maken met individuele set-analyses die op elkaar zijn gestapeld.
Doe het volgende:
-
Sleep een staafdiagram naar het werkblad en geef het de titel Churn Predictions by Plan Type.
-
Voeg PlanType toe als een dimensie. Label het Plan Type.
-
Voeg de volgende meting toe:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Label de meting Predicted to Stay.
-
Voeg de volgende meting toe:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Label de meting Predicted to Churn.
-
Wijzig onder Uiterlijk > Presentatie de lay-out van Gegroepeerd naar Gestapeld.
-
Verwijder de schuifbalk en stel Waardelabels in op Aan.
-
Configureer Segmentlabels en Totaallabels op Auto.
Wanneer u klaar bent, kunt u een vergelijkbaar staafdiagram maken met dezelfde twee metingen, maar met een andere categorische dimensie, zoals NumberOfPenalties.
Spreidingsplot om individuele numerieke veldwaarden te analyseren
Een spreidingsplot kan worden gebruikt om voorspellingsgegevens te presenteren door een meting met diverse numerieke waarden. In deze sectie maakt u een diagram om churn-voorspellingen weer te geven op basis van het basistarief, met afzonderlijke groeperingen voor de servicebeoordeling van de klant.
Doe het volgende:
-
Sleep een spreidingsplot naar het werkblad en geef het de titel Churn Predictions by Base Fee and Service Rating.
-
Voeg AccountID toe als de dimensie voor de punten.
-
Voeg de volgende meting toe op de x-as:
=Avg(BaseFee) -
Voeg de volgende berekende dimensie toe op de y-as:
=Round(ServiceRating,2)Dit creëert groeperingen langs de y-as voor geschatte ServiceRating-waarden. Hoe hoger de waarde, hoe hoger de klant de kwaliteit van zijn service heeft beoordeeld.
-
Verklein onder Uiterlijk > Presentatie de Beldiameter tot 20 en schakel Jitter-punten in.
-
Stel in Kleuren en legenda Kleuren in op Aangepast.
-
Selecteer de optie om de gegevens te kleuren op basis van de volgende dimensie:
=Churned_predictedDit wijst één kleur toe voor elk van de waarden in het veld Churned_predicted. In dit geval worden er twee kleuren weergegeven.
-
Voeg labels toe aan de dimensie en de meting, en voeg het volgende label toe aan de aangepaste kleurinstelling: Predicted to Churn.
Vergelijkbare diagrammen kunnen worden gemaakt voor analyses van verschillende numerieke velden door andere veldaggregaties te vervangen in plaats van de meting BaseFee.
Configureer de visualisaties op het werkblad zodat ze eruitzien als de onderstaande afbeelding.
Werkblad voor voorspellingsanalyse

Tweede werkblad: Geaggregeerd SHAP-dashboard
Maak vervolgens een werkblad dat is gewijd aan het analyseren van de geaggregeerde SHAP-waarden.
Doe het volgende:
-
Maak een nieuw werkblad.
-
Geef het werkblad een titel (bijvoorbeeld Aggregated SHAP).
SHAP-belangrijkheidsrangschikking
Dit type diagram is vergelijkbaar met het automatisch gegenereerde diagram dat u mogelijk hebt gezien bij het configureren van uw experimentversies. Hier maken we er een voor de voorspelde gegevensset.
Het doel van dit type diagram is om de functies te tonen die het meest bijdragen aan de uitkomst die te zien is in de kolom Churned. We moeten ons ervan bewust zijn dat, aangezien we absolute waarden zullen gebruiken, de SHAP-resultaten positief (waarde van yes) of negatief (waarde van no) kunnen zijn. Als u wilt, kunt u ook een uitdrukking gebruiken die niet de absolute waarde berekent.
Doe het volgende:
-
Sleep een staafdiagram naar het lege werkblad.
-
Geef het diagram de titel SHAP Importance by Feature.
-
Voeg automl_feature toe als een dimensie en label het Feature.
Hiermee kunt u de geaggregeerde gegevens presenteren voor alle opgenomen functies.
-
Voeg de volgende berekende meting toe:
=fabs(Avg(SHAP_value)) -
Typ onder Label Average Absolute SHAP.
-
Verwijder in het eigenschappenvenster onder Uiterlijk > Presentatie de schuifbalk indien aanwezig, en stel de diagramoriëntatie in van Verticaal naar Horizontaal.
-
Sleep onder Sorteren de meting boven de dimensie als dit nog niet is gebeurd. Laat de sortering van elk veld op Auto staan.
Dit sorteert het diagram op meetwaarden in een aflopend patroon.
Trellis-container
U kunt een trellis-container maken om gegevens te filteren op specifieke veldwaarden binnen een dimensie. In dit geval kunnen we de SHAP-waarden uitsplitsen voor elk van de vier plantypen die aan klanten worden aangeboden.
Om een Trellis-object te maken, moet u een dimensie en een mastervisualisatie opgeven. We zullen de SHAP-belangrijkheidsrangschikking die we zojuist hebben gemaakt, converteren naar een mastervisualisatie.
Doe het volgende:
- Klik met de rechtermuisknop op het diagram Average Absolute SHAP in het werkblad en selecteer vervolgens
Toevoegen aan masteritems.
- Behoud de standaardnaam en klik op Toevoegen.
-
Sleep onder Aangepaste objecten > Qlik Visualization bundle in het bedrijfsmiddelenvenster een trellis-container naar het werkblad.
-
Voeg PlanType toe als een dimensie.
-
Klik op Mastervisualisatie toevoegen in het diagram en voeg vervolgens het diagram Average Absolute SHAP toe.
-
Schakel onder Uiterlijk > Algemeen in het eigenschappenvenster Titels tonen in en geef het diagram de titel SHAP Importance by Plan Type.
-
Wijzig de grootte van de trellis-container zodat deze breed genoeg is om de namen van functies in de diagrammen weer te geven. Als niet alle labels worden weergegeven, past u de zoom in het browservenster aan.
Als alternatief kunt u deze gegevens weergeven door individuele diagrammen te maken met set-uitdrukkingen voor elke dimensiewaarde die u wilt analyseren. In dit geval kunt u een afzonderlijk diagram maken voor elk van de vier plantypen.
Het filtervak hergebruiken
Het filtervak dat u op het eerste werkblad hebt gemaakt, kan op dit werkblad worden hergebruikt. Klik in de bewerkingsmodus van het werkblad met de rechtermuisknop op het filtervak en kopieer het. Plak het in het werkblad Aggregated SHAP.
Treemap
U kunt de uitsplitsing van de SHAP-waarden ook visualiseren met een treemap. Sleep een treemap naar het werkblad en voeg dezelfde dimensie en meting toe die u hebt gebruikt in de SHAP-belangrijkheidsrangschikking.
Configureer de visualisaties op het werkblad zodat ze eruitzien als de onderstaande afbeelding.
Werkblad Aggregated SHAP in analysemodus

De applicatie gebruiken
Nadat u klaar bent met het bouwen van de applicatie, is deze klaar om te worden gebruikt voor gegevensanalyse.
Klik op Werkblad bewerken om over te schakelen naar de analysemodus. In deze weergave kunt u selecties maken (in de filtervakken of elders in het werkblad) om de gegevens te filteren voor specifieke analyse van subsets van de gegevens. U wilt bijvoorbeeld een specifiek klantplantype of een specifieke regio analyseren en de bevindingen vergelijken met andere subsets van gegevens.
Bedankt!
U hebt het einde van deze tutorial bereikt. We hopen dat u een paar dingen hebt geleerd en u zich realiseert dat geautomatiseerde machine learning een snelle en gemakkelijke manier is om voorspellende modellen te genereren. Qlik Sense is een krachtige tool die het gemakkelijk maakt om uw voorspellingsgegevens te visualiseren en zinvolle inzichten in uw gegevens te geven.