Skapa prognosdata
Efter att du har distribuerat och godkänt din modell kan du skapa prognoser för nya data. I den här introduktionskursen skapar vi en prognoskonfiguration inom ML-distributionen och använder den för att köra en batchprognos.
Hittills har vi använt befintliga kunddata för att skapa en modell för maskininlärning. Målet med den här processen har varit att identifiera mönster genom maskininlärning, med målet att applicera dem på nya data.
Det finns även ett användarfall för att endast analysera SHAP-värdena i träningsdata. Denna information är även mycket värdefull i sig.
Se Skapa prognoser för datauppsättningar för mer information om batchprognoser i Qlik Predict.
Det första steget i processen är att välja en datauppsättning på vilken du kommer att använda din modell för att generera prognoser. Därefter konfigurerar du önskade egenskaper för utdata och genererar filerna.
Gör följande:
-
I katalogen öppnar du din nya ML-distribution.
-
Klicka på Skapa prognos längst ner i högra hörnet.
I fönstret Prognoskonfiguration till höger, under Tillämpa data, klickar du på Välj tillämpa datauppsättning.
Välj filen tillämpa datauppsättning. Det blir någon av följande beroende på om du arbetar med CSV eller QVD:
ML - Churn data - apply.csv
ML - Churn data - apply.qvf
Jämför schemana för träningsdatauppsättningen och datauppsättningen för tillämpning. Eftersom du valde bort funktioner under träningen kommer din tillämpade datauppsättning att ha fler fält än träningsdatauppsättningen. Detta medför inga problem. När du genererar förutsägelser kommer Qlik Predict helt enkelt ignorera fält från den tillämpade datauppsättningen som inte finns i träningsdatauppsättningen.
I fönstret Konfiguration av förutsägelse klickar du på Namnge datauppsättning. Skriv in följande namn: ML - Prediction output. Vi kommer att använda standardformatet Parquet.
Välj ett utrymme och klicka på Bekräfta.
Under Alternativ för prognos konfigurerar du de ytterligare datauppsättningar du vill generera med prognosen. I detta fall ska du bekräfta att Koordinera SHAP är det enda valda alternativet. Låt AccountID användas som indexkolumn.
Klicka på ikonen bredvid Spara och stäng. Välj Spara och kör prognos nu.
Processen kan övervakas i Förutsägelser för datauppsättning. Du kan granska utdata i katalogen genom att klicka på Öppna i det fönster som visas.
När prognosen har körts kan du börja bygga en app med de nya datauppsättningarna. Gå till nästa ämne.