Skapa och konfigurera tidsserieexperimentet | Qlik CloudHjälp
Gå till huvudinnehåll Gå till ytterligare innehåll

Skapa och konfigurera tidsserieexperimentet

Det första steget är att skapa och konfigurera ett tidsserieexperiment. Du kommer att använda träningsdatasetet som du överförde tidigare för att träna modellen tills den är redo att distribueras för att göra förutsägelser.

Skapa ett nytt experiment

  1. Gå till sidan Skapa i Analyser aktivitetscenter och välj ML-experiment.

  2. Ange ett namn för ditt experiment, till exempel Försäljningsprognoser.

  3. Du kan även lägga till en beskrivning och taggar.

  4. Välj ett utrymme för ditt experiment. Det kan vara ditt personliga utrymme eller ett delat utrymme.

  5. Klicka på Skapa.

  6. Välj filen med träningsdatasetet ML - Multivariate forecasting - training.csv.

ML-experiment med valt träningsdataset för tidsserier.

Schemavy i nytt ML-experiment med valt träningsdataset för tidsserier

Konfigurera inställningar för tidsserieprognoser

Steg 1: Välj mål

Börja med att definiera en målkolumn. Vi vill göra prognoser för framtida försäljning, så välj den kolumnen som mål.

  • I Tabellrader Schemavy klickar du på alternativknappen bredvid sales. En målikon Mål ersätter knappen.

Välja målkolumnen för tidsserieexperimentet.

Välja målkolumnen för tidsserieexperimentet

Steg 2: Konfigurera experimentet till att vara ett tidsserieexperiment

  1. Klicka på Schema Visa konfiguration för att expandera panelen för experimentkonfiguration om den inte redan är öppen.

  2. Expandera Experimentinställningar.

  3. Under Experimenttyp väljer du Tidsserie. Det här alternativet visas endast efter att du har valt en numerisk kolumn med hög kardinalitet.

Steg 3: Välj ett datumindex

Därefter måste du välja vilken tidsserieindexkolumn som ska användas.

  1. Ett nytt delavsnitt, Tidsserieinställningar, visas i konfigurationspanelen. Under Datumindex klickar du på rullgardinsmenyn för att expandera den.

  2. Välj date.

Panelen för experimentkonfiguration med Tidsserie vald som experimenttyp och date vald som datumindexkolumn.

Välja experimenttyp och datumindex för experimentet

Steg 4: Ange prognosfönster och gap

När du har valt ditt datumindex visas ny information i panelen.

Gå till delavsnittet Baserat på dina data. Det här delavsnittet beskriver tidsintervallet för dina historiska data och låter dig konfigurera intervallet för framtida datum som du vill göra förutsägelser för.

Den Uppskattad maximal prognos är 180 dagar. Denna uppskattning baseras på tillgängliga historiska data, där prognosfönstret är en bråkdel av de totala tillgängliga historiska data. Det representerar det maximala antalet framtida tidssteg (i det här fallet dagar) för vilka du beräknas kunna förutsäga målet. Efter att ha kört en version av träningen kommer mer information att vara känd och denna uppskattning kommer att ersättas av en slutgiltig maximal prognos.

Den Önskad storlek på prognosfönster anger hur många tidssteg in i framtiden du vill förutsäga. Till exempel, i den här självstudiekursen skulle inställningen av prognosfönstret till 7 indikera att modellen ska förutsäga en vecka av framtida måldatum.

Den Storlek på prognosgap anger antalet tidssteg omedelbart efter slutet av dina träningsdata för vilka du inte vill ha förutsägelser. Du kanske till exempel bara vill förutsäga försäljning för datum tre eller fler dagar in i framtiden.

  1. I delavsnittet Baserat på dina data anger du Önskad storlek på prognosfönster till 7 tidssteg.

  2. Ange Önskad storlek på prognosgap till 3 tidssteg.

Anteckning om informationPrognoshorisonten är prognosfönstret plus storleken på prognosgapet, mätt i tidssteg. I det här fallet är prognoshorisonten 10, vilket indikerar att du vid tidpunkten för förutsägelsen gör en prognos 10 tidssteg framåt, även om inga faktiska värden har registrerats för det förutsägelsegapet.

Steg 4: Välj grupper

Träningsdatasetet för den här självstudiekursen är utformat för multivariat prognos. Med multivariat prognos är målet att förutsäga målvärden tillsammans med andra dimensioner som varierar direkt tillsammans med målet. Till exempel innehåller data i den här självstudiekursen försäljningsmått som spåras individuellt för varje butik och produktfamilj. Multivariat prognos gör att du kan kombinera var och en av dessa dimensioner – som annars skulle behöva tränas som separata modeller – till ett enda experiment, vilket gör att modeller kan lära sig mer om mönster och interaktioner mellan olika kohorter av data.

Du konfigurerar multivariata experiment genom att välja upp till två kolumner från träningsdata som ska användas som grupper.

Målet med den här självstudiekursen är träna modeller för att lära sig och förutsäga försäljning tillsammans med butiksnummer och produktfamilj, så välj dessa två kolumner som grupper.

  • Välj store_nbr och family som Grupper.

Anteckning om information Om ingen grupp väljs uttryckligen söker modellen automatiskt efter en lämplig gruppering med endast kategoriska funktioner. När en giltig grupp har identifierats fortsätter processen till träning. Om vi vill att systemet automatiskt ska identifiera store_nbr as a valid group column måste den därför markeras som en kategorisk funktion.

Steg 5: Konfigurera samvariabler (funktioner)

Termerna ”samvariabel” och ”funktion” används ofta synonymt inom maskininlärning, men vid tidsserieprognoser i Qlik Predict är termen ”samvariabel” vanligare och mer beskrivande. I en multivariat tidsserie-modell finns det tre typer av samvariabler: statiska, tidigare och framtida.

Statiska och tidigare samvariabler är bland de Funktioner som du inkluderar i experimentträningen, förutom grupper, datumindex och framtida funktioner. Statiska och tidigare samvariabler identifieras automatiskt av systemet. Du behöver inte konfigurera dessa utöver att inkludera dem som funktioner (och undvika att konfigurera dem som framtida funktioner).

Framtida samvariabler, eller framtida funktioner, avser också Funktioner som du inkluderar i träningen. Framtida samvariabler är funktioner som har framtida data som du kommer att känna till i förväg – i synnerhet har du tillgång till framtida värden för denna funktion som sträcker sig över din valda prognoshorisont. För framtida funktioner måste du också känna till datavärdena för det historiska tidsintervallet som modellen tränas på.

Förutom att inkludera en framtida funktion i listan över tränings-Funktioner måste du också konfigurera den som en framtida funktion i panelen för träningskonfiguration. Vid tidpunkten för förutsägelsen förväntar sig modellen framtida funktionsdata som sträcker sig över prognoshorisonten för att generera korrekta prognoser.

I träningsdata spårar funktionen onpromotion hur många produkter som är rabatterade till kampanjpriser för det angivna datumet. Detta är information som är känd i förväg, och det finns framtida data tillgängliga för den, så den kan användas som en framtida funktion.

  • Under rullgardinsmenyn Grupper expanderar du Framtida funktioner och väljer onpromotion.

Sammanfattningsvis:

  • onpromotion har valts som en framtida funktion.

  • Förutom datumindexet valdes inga andra samvariabler för träningen.

Panelen för experimentkonfiguration som visar konfigurerade grupper, framtida funktion och en sammanfattning av alla valda funktioner.

Panelen för experimentkonfiguration som visar konfigurerade grupper, framtida funktion och en sammanfattning av alla valda funktioner.

Följande diagram illustrerar begrepp för tidsserieprognoser och hur de förhåller sig till experimentkonfigurationen. Mer information om begrepp för tidsserieprognoser finns i Arbeta med multivariat tidsserieprognos.

Förenklad illustration som beskriver komponenterna i ett tidsserieprognosproblem i Qlik Predict.

Bekräfta andra inställningar

Nu när du har slutfört tidsseriekonfigurationerna granskar du de återstående träningsinställningarna i konfigurationspanelen.

  • Under Funktioner kan du se att fyra funktioner är valda.

  • Under Algoritmer kan du se att alla tillgängliga algoritmer är valda.

Träna experimentet

Konfigurationen är klar och vi är redo att starta träningen.

  • Klicka på Kör experiment.

När experimentet har körts klart kan vi gå vidare till nästa steg, vilket är att granska de resulterande modellmåtten.

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!