Gå till huvudinnehåll Gå till ytterligare innehåll

Förutsäga med tidsseriedistributionen

När du har distribuerat och godkänt din tidsseriemodell kan du skapa tidsspecifika prognoser. I den här introduktionskursen skapar vi en prognoskonfiguration inom ML-distributionen och använder den för att köra en batchprognos.

Hittills har vi använt dagliga försäljningsdata för att skapa en modell för maskininlärning. Målet med den här processen har varit att identifiera mönster genom maskininlärning, med målet att applicera dem på nya data.

Förstå prognoser med tidsseriemodeller

Det är viktigt att skilja på hur prognoser fungerar för tidsseriemodeller, eftersom det skiljer sig från prognoser för andra modelltyper. Stegen du slutför för att förbereda din tillämpade datauppsättning skiljer sig från stegen för andra modelltyper.

Med tidsseriemodeller läggs nya förutsägelser till som nya rader snarare än att läggas till som en separat kolumn.

Skapa en tillämpad datauppsättning

Detta delavsnitt beskriver hur du kan skapa din tillämpade datauppsättning för detta tidsserieproblem. Den faktiska processen att kompilera datasetraderna visas inte, men arbetsflödet visas.

Linjärt diagram som beskriver de nödvändiga komponenterna och tidslinjen för en tillämpad datauppsättning som används för att generera prognoser med en tidsserieprognosmodell.

Kolumnstruktur

Din tillämpade datauppsättning måste innehålla samma schema som tidsseriemodellen du distribuerade. Schemat finns när du öppnar ML-distributionen.

I vilket fall som helst bör din tillämpade datauppsättning innehålla samma kolumner som modellschemat – dvs. en kolumn för vart och ett av följande:

  • Datumindex

  • Mål

  • Grupper

  • Funktioner (kovariater)

Radstruktur

Din datauppsättning måste innehålla poster (rader) enligt följande:

  • Kolumner och kolumnrubriker för alla kolumner som ingår i träningsdatauppsättningen.

  • Samma tidssteg som träningsdatauppsättningen.

  • Lika många eller fler historiska dataposter (per mål och grupp) före prognosens bryttid som antalet poster i tillämpningsfönstret för modellen. Dessa måste vara fullständiga poster som innehåller det historiskt observerade datumet eller tidsstämpeln, målet och kovariatvärden. Tillämpningsfönstret bestäms av prognosfönstret och gapet som konfigurerats under träningen — ju längre in i framtiden du behöver förutsäga, desto mer historisk data behöver du i din tillämpningsdatauppsättning för att köra förutsägelser.

  • Poster för alla framtida tidssteg i din prognoshorisont. För dessa framtida poster, inkludera endast värdena för datumindexkolumnen, samt eventuella framtida funktioner. Lämna värdena för de andra kolumnerna tomma.

Andra ändringar

Du kan behöva göra andra ändringar i datauppsättningen så att den matchar modellschemat. I synnerhet transformeras grupperade funktioner, när de väljs som grupper under träningen, automatiskt till den kategoriska funktionstypen så att de kan användas som grupper. I dina tillämpningsdata, om du har funktioner som innehåller numeriska data som du använder som grupper, måste du transformera deras datatyp så att den identifieras som kategoriska data. Ett exempel på detta visas i Förbereda datauppsättningen.

Förbereda datauppsättningen

Den här självstudien innehåller en tillämpad datauppsättning som redan har konfigurerats med de nödvändiga kolumnerna och posterna. Den angivna tillämpade datauppsättningen innehåller dock en numerisk kolumn, store_nbr, som konfigurerades som en grupp i modellen. Därför måste du skapa ett skript för att omvandla den här kolumnen till strängdata.

  1. Gå till sidan Skapa i aktivitetscentret för Analyser och välj Skript.

  2. Ange ett namn för ditt skript, till exempel Omvandlade tillämpade data.

  3. Välj ett utrymme för ditt skript. Det måste vara samma utrymme där du lagrade den ursprungliga tillämpade datauppsättningen.

  4. Klicka på Skapa.

  5. I Skript, växla till Redigerare.

  6. Under Delavsnitt klickar du på Skapa nytt avsnitt för att lägga till ett nytt delavsnitt.

  7. Klistra in laddningsskriptet nedan i redigeraren.

  8. Klicka på Exportera data.

Kör skriptet för att exportera en ny version av den tillämpade datauppsättningen till Qlik Cloud Analytics.

Skriptredigerare med laddningsskript inklistrat i redigeraren och knappen "Exportera data" markerad

Efter att skriptet har körts, bör en ny tillämpad datauppsättning, Final transformed apply dataset.qvd, finnas i samma utrymme som den ursprungliga tillämpade datauppsättningen.

Skapa prognoser

Nu när du har en kompatibel tillämpad datauppsättning, ska du använda den för att skapa förutsägelser från din ML-distribution.

  1. I katalogen, öppna den Försäljningsprognosdistribution som du skapade i Distribuera en tidsseriemodell.

  2. Klicka på Skapa prognos längst ner i högra hörnet.

  3. I fönstret Prognoskonfiguration till höger, under Tillämpa data, klickar du på Välj tillämpa datauppsättning.

  4. Välj filen tillämpa datauppsättning: Final transformed apply dataset.qvd.

  5. Jämför schemana för träningsdatauppsättningen och datauppsättningen för tillämpning. Det bör inte finnas några schemamatchningsfel.

  6. I fönstret Konfiguration av förutsägelse klickar du på Namnge datauppsättning. Skriv in följande namn: ML - Sales predictions. Använd standardformatet Parquet.

  7. Välj ett utrymme och klicka på Bekräfta.

Prognoskonfiguration som visar schemajämförelser och konfigurationspanel.

ML-distribution med tidsseriemodell, som visar förutsägelsekonfigurationen med scheman

Klicka på ikonen Nedåtpil bredvid Spara och stäng. Välj Spara och kör prognos nu.

Processen kan övervakas i Förutsägelser för datauppsättning. Du kan granska utdata i katalogen genom att klicka på Öppna i det fönster som visas.

När prognosen har körts klart, skapa en app för att visa dina prognoser. Gå till nästa ämne.

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!