Introduktionskurs – Generera och visualisera förutsägelsedata
I den här introduktionskursen lär du dig att använda Qlik AutoML för att träna och distribuera en maskininlärningsmodell för att göra förutsägelser. Du lär dig också att visualisera förutsägelsedata i en Qlik Sense-app.
Vi kommer att ta upp scenariot med kundförluster, ett klassiskt exempel på ett binärt klassificeringsproblem. Målet är att på ett tillförlitligt sätt kunna förutsäga om en kund kommer att säga upp sin prenumeration eller fortsätta att prenumerera på en tjänst. Det finns bara två utfall i denna typ av problem: sant eller falskt (förlust eller ingen förlust).
För att närma oss detta maskininlärningsproblem börjar vi med att behandla en uppsättning data som vi redan känner till resultatet för, och tillämpar sedan statistisk modellering som skapats från dessa data på nya data som vi vill förutsäga resultatet för.
Du börjar den här handledningen med att skapa ett experiment. Därifrån kommer du att träna modeller och distribuera en av dem till en ML-distribution. Denna ML-distribution kommer att användas för att göra prognoser som kan visualiseras i en Qlik Sense-app.
Vad du kommer att lära dig
När du har gått igenom den här handledningen har du förstått de olika stegen för att skapa och konfigurera ett experiment. Du kommer också att lära dig hur du tolkar modellpoäng. Slutligen kommer du att kunna distribuera en maskininlärningsmodell och förstå hur dina prognosdata kan användas för att skapa övertygande Qlik Sense-visualiseringar i Qlik Cloud-analys.
Denna handledning visar hur du manuellt itererar dina modeller genom att identifiera vanliga problem med din datauppsättning och dina träningsresultat. Som standard tränar Qlik AutoML dina modeller med intelligent modelloptimering. Med intelligent optimering sker automatisk förfining under träningen. Det ökar sannolikheten att dina modeller kommer att vara klara att distribueras efter en enda version som behöver minimalt med iteration. Se Exempel – Träningsmodeller med automatiserad maskininlärning för ett exempel på som visar hur du tränar modeller med intelligent optimering.
Målgrupp för denna handledning
Denna handledning är utformad för användare som vill ha en introduktion till automatiserad maskininlärning och datavisualisering i Qlik Cloud-analys. Grundläggande kunskaper i maskininlärning och Qlik Sense är till hjälp, men inget krav.
Du behöver följande när du går igenom denna handledning:
-
Användarrättighet Professional eller Full User
-
Säkerhetsrollerna Automl Experiment Contributor och Automl Deployment Contributor i Qlik Cloud-klientorganisationen.
-
Behörighet för godkännande av distribuerade modeller. Du måste ha något av följande:
-
Godkänna eller avvisa dina AutoML-modeller (användarbehörighet)
-
Godkänna eller avvisa AutoML-modeller (administratörsbehörighet)
-
-
De nödvändiga utrymmesrollerna i utrymmena där du kommer att arbeta. Se: Hantera behörigheter i delade utrymmen och Hantera behörigheter i hanterade utrymmen
Om du inte kan visa eller skapa ML-resurser betyder det antagligen att du inte har de nödvändiga rollerna, rättigheterna eller behörigheterna. Kontakta huvudadministratören för mer information
Se Vem kan arbeta med Qlik AutoML för mer information.
Vad du behöver göra innan du börjar
Först hämtar du handledningsmaterialet som är länkat nedan. Välj mellan arbetsflöden för CSV och QVD. Det är frivilligt att hämta den förkonfigurerade appen.
När du har hämtat ditt material packar du upp det på skrivbordet.
-
AutoMLTutorialDatasetsCSV: Contains tutorial data in CSV format. This option is easier for getting started quickly.
-
AutoMLTutorialDatasetsQVF: Innehåller handledningsdata i formatet .qvf -skript som kan köras för att skapa QVD. Detta alternativ tar lite längre tid än än CSV men passar som introduktion till att arbeta med dataformat och skript i Qlik.
-
AutoMLTutorialPreConfiguredApp: Detta är valfritt. Det är en provkopia av Qlik Sense-appen som du ska bygga under handledningen. Detta gör att du kan hoppa över skedena träning och distribution för att tidigare få praktisk erfarenhet av att utveckla prognosapp.
Mer information finns i Alternativt arbetsflöde: ladda upp förkonfigurerad app.
Träningsdatauppsättningen innehåller information om kunder vars tidsfrist för förnyelse har gått ut och som har fattat beslut om att säga upp sin prenumeration eller fortsätta att prenumerera på tjänsten.
Den tillämpade datauppsättningen innehåller uppgifter om en ny uppsättning kunder vars förnyelsedatum ännu inte har passerats. Det har ännu inte fastställts om dessa kunder kommer att säga upp sina tjänster eller inte. Målet med den här handledningen är att förutsäga vad de här kunderna kommer att göra, i hopp om att vi ska kunna minska sannolikheten för att de kommer att säga upp sina tjänster.
Alternativ 1: AutoML datauppsättningar för handledning (CSV)
Gör följande:
Öppna aktivitetscentret för Analyser.
Gå till sidan Skapa, välj Datauppsättning och välj sedan Ladda upp datafil.
Dra filen AutoML Tutorial - Churn data - training.csv till dialogrutan för uppladdning.
Dra sedan filen AutoML Tutorial - Churn data - apply.csv till dialogrutan för uppladdning.
Välj ett utrymme. Det kan vara ditt personliga utrymme eller ett delat utrymme om du vill att andra användare ska kunna få tillgång till dessa data.
Klicka på Ladda upp.
Nu när dina datauppsättningar laddats upp kan du fortsätta med att skapa ett experiment.
Alternativ 2: AutoML datauppsättningar för handledning (QVD)
Gör följande:
Öppna aktivitetscentret för Analyser.
Gå till sidan Skapa, välj Ladda upp och välj sedan Skript.
Dra filerna till dialogrutan för uppladdning.
AutoML Tutorial - Churn data - training.qvf
AutoML Tutorial - Churn data - apply.qvf
Välj ett utrymme. Det kan vara ditt personliga utrymme eller ett delat utrymme om du vill att andra användare ska kunna få tillgång till dessa data.
Klicka på Ladda upp.
Gör följande för varje uppladdat skript:
Öppna skriptet och växla till fliken Redigerare.
I redigeraren klickar du på Exportera data.
Datauppsättningen QVD skapas i samma utrymme som du laddade upp skriptet till.
Nu när dina datauppsättningar har skapats kan du fortsätta med att skapa ett experiment.
Lektioner i denna handledning
Avsnitten i introduktionskursen är avsedda att slutföras i ordning. Du kan dock när som helst lämna kursen och återvända senare.
Vill du lära dig mer?
- Om du vill lära dig mer finns det en uppsjö av möjligheter i Qlik.
- Onlinehjälpen för Qlik är tillgänglig.
- Utbildning, inklusive kostnadsfria onlinekurser, finns i Qlik Continuous Classroom.
- Diskussionsforum, bloggar med mera finns i Qlik Community.
Din åsikt är viktig
Vi tar tacksamt emot all din feedback. I avsnittet nedan kan du berätta vad du tycker om oss.