Arbeta med multivariat tidsserieprognostisering
Med Qlik Predict kan du träna maskininlärningsmodeller för att prognostisera tidsspecifika mätvärden. Med hjälp av neurala nätverksbaserade metoder lär sig modeller och förutsäger komplexa mönster som involverar tidsspecifika associationer, grupperad måldata, historiska funktioner och kända framtida variabler. För att skapa en tidsserieprognos, förbered en träningsdatauppsättning, använd den i ett tidsserieexperiment, distribuera en modell och skapa sedan tillämpningsdatauppsättningar som du kan använda för att generera prognoser.
Komponenter i ett tidsserieproblem
Med tidsserieprognostisering är målet att förutsäga målvärden för specifika datum i framtiden. Du kanske till exempel vill förutsäga försäljningen för nästa vecka, månad eller kvartal.
När du utvecklar ditt tidsserieproblem, definiera följande komponenter:
-
Mål och grupper
-
Dataindex
-
Prognoshorisont
-
Kovariater
Förenklad illustration som beskriver komponenterna i ett tidsserieprognosproblem i Qlik Predict.

Mål
Precis som med andra experimenttyper är målet den kolumn för vilken du vill att modellen ska förutsäga framtida värden. För tidsserieexperiment måste målet innehålla numeriska data—till exempel försäljning eller lager.
Om du använder grupper i tidsserieprognosen, kommer modeller att förutsäga ett målvärde per grupp per tidssteg i prognosfönstret. Om du inte använder grupper, kommer dina tränade modeller att förutsäga ett målvärde för varje tidssteg i prognosfönstret.
Datumindex
Datumindexet spårar tidsseriemåtten över ett kontinuerligt tidsintervall (tidssteg). Du måste bestämma ditt tidssteg i ett tidigt skede: hur ofta behöver du förutsäga framtida värden?
Närmare bestämt är datumindexet en kolumn som visas i dina tränings- och app-datauppsättningar för tidsserieproblem. Datumindexet bestämmer strukturen för båda dessa app-datauppsättningar—varje rad representerar ett steg i tiden (eller, med grupper, ett steg i tiden för varje unik gruppering).
När du lägger till din träningsdatauppsättning i ett tidsserieexperiment, identifieras möjliga datumindexkolumner automatiskt och presenteras för dig som Insikter på kolumnnivå. Du kan identifiera dem från Möjligt datumindex-insikten i schemavyn.
Grupper
Grupper är funktioner som innehåller kategorisk information för vilken du vill generera prognoser separat. Klassiska exempel på grupper inkluderar butiksnummer och produkt, som kunde ha använts för att organisera data för ett mål som försäljning. Genom att välja butiksnummer och produkttyp som grupper, kommer dina tidsseriemodeller att ge prognoser för varje enskilt värde i dessa kolumner. Till exempel, med försäljning som mål, om du har tre butiksnummer – 1, 2 och 3 – och två produkttyper – livsmedel och färskvaror – kommer din modell att generera försäljningsprognoser för varje unik kombination av dessa värden.
Du bör införliva grupper i ditt tidsserieproblem om du har data och behöver individuella prognoser per kategori. En annan fördel med grupper är att modeller kan lära sig globalt, och bättre förstå mönstren som finns mellan de olika grupperingarna du definierar.
Du kan konfigurera grupperna som ska användas för varje experimentversion. Om du inte anger grupper men grupper identifieras i din träningsdatauppsättning, kommer träningen att använda grupper.
Grupper identifieras av kopierade värden i datumindexkolumnen—till exempel, för ett datum 1/14/2025, har du två poster: en för butik A och den andra för butik B.
Varje grupp i ett tidsserieexperiment – inklusive enbart målet – betraktas som separata tidsserier inom din datamängd. Se Vad är en tidsserie?.
Prognoshorisont
Prognoshorisonten anger hur långt in i framtiden du vill prognostisera. Prognoshorisonten består av prognosfönstret (antalet tidssteg för vilka du behöver prognoser) och prognosglappet (ett valfritt antal tidssteg efter dina historiska data för vilka du inte vill ha prognoser).
Du anger prognosfönstret och gapstorleken när du konfigurerar en experimentversion. Dessa värden används både under modellträning och vid generering av förutsägelser från modeller distribuerade som ML-distributioner.
Prognosfönstret är antalet tidssteg som du vill förutsäga in i framtiden. Till exempel, om ditt tidssteg är en dag och du vill prognostisera försäljning för de kommande två veckorna, skulle du ställa in ditt prognosfönster till 14.
Prognosgapet är den tidsperiod i framtiden för vilken du inte behöver förutsägelser. Att ställa in ett prognosgap är valfritt, eftersom du kanske behöver ett eller inte. Prognosgapet börjar vid slutet av den inspelade historiska träningsdatan du har tillhandahållit. Prognosfönstret börjar där prognosgapet slutar.
Till exempel kanske du vill förutsäga framtida försäljning, men du är bara intresserad av framtida försäljning för datum som är senare än en vecka efter slutet av dina indata. I det här fallet, med ett tidssteg i dagar, skulle du kunna ställa in storleken på din prognoslucka till sju tidssteg.
Ditt valda prognosfönster, utöver hur mycket träningsdata du har, begränsar hur långt in i framtiden du kan prognostisera. För mer information, se Maximalt prognosfönster.
Kovariater
I tidsserieproblem kallas funktioner ofta kovariater. I likhet med andra maskininlärningsproblem är kovariater de andra variablerna som du misstänker har ett inflytande på målets utfall. Varje kovariat representeras som en enskild kolumn i din träningsdatauppsättning.
Inom tidsserieprognostisering finns det flera typer av kovariater och de har några viktiga skillnader:
-
Statiska kovariater: Kolumner som inte varierar under en tidsseries gång. Statiska kovariater är tillämpliga i tidsserieexperiment där grupper används. Anta till exempel att du har grupper för Produkt och Butiksnummer, och att det finns en funktion Standardrabatt. Om produkt A i butik 1 har en standardrabatt på 10% och produkt B i butik 2 har en standardrabatt på 20%, skulle standardrabatten vara en statisk kovariat. Det vill säga, det varierar inte inom datan för den grupp inom vilken det förekommer.
Statiska kovariater upptäcks automatiskt från historiska funktioner som du inkluderar i experimentet. Du behöver inte ange vilka funktioner som är statiska kovariater.
-
Tidigare kovariater: Tidsberoende variabler som endast är tillgängliga i historiska data, och som varierar över dessa data. Tidigare kovariater upptäcks automatiskt från historiska funktioner som du inkluderar i experimentet. Du behöver inte uttryckligen ange vilka funktioner som är tidigare kovariater.
-
Framtida kovariater: Framtida kovariater, även kända som framtida funktioner, är tidsberoende variabler för vilka du kommer att känna till de framtida värdena inom prognoshorisonten. När du använder framtida kovariater i träningen, måste du ange dem som framtida funktioner i träningskonfigurationen.
Framtida funktioner
Med framtida funktioner kan du tillhandahålla ytterligare data till dina modeller om framtida information som du redan känner till eller rimligen kan förvänta dig. I synnerhet har du tillgång till framtida värden för denna funktion som sträcker sig över din valda prognoshorisont. När du definierar framtida funktioner, behöver du tillhandahålla historiska såväl som framtida data.
Till exempel, för en modell som förutsäger mätvärden som skulle kunna påverkas av framtida rabatter som erbjuds av en butik, skulle du kunna inkludera de historiskt observerade rabatterna, samt rabatterna för framtida tidsperioder inom prognosfönstret. Andra exempel på framtida funktioner skulle kunna vara väder- eller kalenderinformation.
Andra viktiga begrepp
Detta delavsnitt beskriver begrepp som är relevanta för ditt tidsserieproblem, men som du inte konfigurerar direkt i ett experiment eller en ML-distribution. Dessa är egenskaper som definieras av dina data eller av andra egenskaper du konfigurerar för modellen.
Tidssteg
Tidssteget definieras av din träningsdatauppsättning och är viktigt för både träning och förutsägelser.
I din träningsdatauppsättning är tidssteget det intervall med vilket data i ditt datumindex registreras. Till exempel kan tidssteget vara dagligen, varje timme, varje minut eller varje sekund. Det minsta tidssteget som upptäckts är millisekunder.
Det är viktigt att vara medveten om tidssteget som används i din träningsdata. Andra experimentparametrar som du definierar, till exempel prognosfönster och prognosgapstorlek, kommer att följa detta tidsstegsintervall.
Efter att ha distribuerat din modell kommer de data du vill skapa förutsägelser för att behöva följa samma tidssteg som definierats i träningsdatauppsättningen.
Kvalitet
När du väljer en träningsdatauppsättning, härleder systemet det använda tidssteget. Om det finns saknade värden eller luckor i datumindexet kan kolumner som mål, grupper och kovariater interpoleras automatiskt av systemet. Dock, om dina data innehåller tidsintervall som är inkonsekventa till den grad att olika tidssteg upptäcks, måste data åtgärdas först. Till exempel, om du har flera månaders data som registrerats en gång dagligen, men det finns ett delavsnitt där data konsekvent registreras veckovis, kan datamängden inte användas eftersom flera tidssteg kommer att upptäckas.
Använd fönster
Tillämpningsfönstret, eller återblicksperioden, är den del av träningsdata som algoritmen kan använda för att tillhandahålla prognoserna för ditt angivna prognosfönster.
Tillämpningsfönstret beräknas och ställs in av systemet. Det mäts i tidssteg. Tillämpningsfönstret definieras av vad du anger som prognosfönstret och gapet (prognoshorisonten). Din apply-fönsterstorlek visas i experimentkonfigurationspanelen och Modellträningssammanfattning, efter att ha kört minst en experimentversion. Det visas också i ett ML-distributionsModellschema när du skapar eller redigerar en konfiguration för batchförutsägelse.
Tillämpningsfönstret identifieras automatiskt från din träningskonfiguration. För att generera prognoser för ett givet prognosfönster måste du tillhandahålla historiska data som täcker åtminstone ditt tillämpningsfönster. Detta tillhandahålls i din ansökningsdatauppsättning. Se Förbereder en tillämpningsdatauppsättning.
Maximalt prognosfönster
Det maximala prognosfönstret uppskattas när du konfigurerar ditt tidsserieexperiment. När du har kört en version av träningen bekräftas det maximala prognosfönstret med säkerhet. Det maximala prognosfönstret visas för dig som Beräknad maximal prognos eller Maximal prognos under Baserat på dina data, när du öppnar Mål och experimenttyp i panelen för experimentkonfiguration. Det maximala prognosfönstret är det maximala antalet tidssteg för vilka du kan generera prognoser, givet ditt valda prognosfönster, hur mycket historisk data du har tillhandahållit, och den minsta urvalsstorlek som förväntas av systemet. Ju mer historisk data du tillhandahåller, desto längre fram i tiden kommer du att kunna förutsäga. För att generera tillförlitliga prognoser är det dock viktigt att välja ett rimligt prognosfönster.
Det maximala prognosfönstret kan vara så stort som 180 tidssteg.
Prognosens bryttid
Prognosens bryttid är särskilt viktig när du definierar din app-datauppsättning under prediktioner. Prognosens bryttid är det sista datumet i ditt urval för vilket du har ett målvärde. I grund och botten är datum efter denna bryttid de datum för vilka du vill generera prognoser.
Vad är en tidsserie?
Inom Qlik Predict tidsserieprognostisering betraktas varje grupp – inklusive målet ensamt – som separata tidsserier inom träningsdatauppsättningen. Anta till exempel att din träningsdatauppsättning innehåller försäljningsmått. Dessa försäljningsmått definieras för varje butik och produkttyp. Med kolumnerna Butik och Produkttyp definierade som grupper finns det tre tidsserier i träningsdatauppsättningen.
Förbereder en träningsdatauppsättning
För prognoser för multivariata tidsserier måste din träningsdatauppsättning innehålla följande kolumner:
-
Dataindex
-
Målkolumn
-
Gruppera kolumner (valfritt)
-
Funktionskolumner (valfritt—utan funktioner, tränar du en univariat prognosmodell)
Illustrationer som visar de obligatoriska kolumnerna och datan för tidsserieträningsdatauppsättningar. Scenarier med inga grupper, en grupp och två grupper beskrivs.

Linjärt diagram som beskriver de nödvändiga komponenterna och tidslinjen för en träningsdatauppsättning för en prognosmodell för tidsserier.

Datumindexkolumn
Du behöver ett datumindex som innehåller fullständiga datum eller tidsstämplar. Denna kolumn är det kronologiska index längs vilket mål- och kovariatmåtten spåras. Datumindexkolumnen organiserar de tidsbaserade mätningarna sekventiellt längs ett konsekvent tidsintervall (det tidssteg).
Datumindexkolumnen är organiserad enligt följande, beroende på om du använder grupper eller inte:
-
Inga grupper: En enskild post för varje tidssteg. Till exempel, med en daglig prognos, representerar varje rad en enskild dag.
-
Med grupper: En eller flera kopierade poster för varje tidssteg beroende på vilka grupper som används.
Med ett multivariat träningsdataset kommer det att finnas en eller flera kopierade poster för varje tidssteg beroende på vilka grupper som används. Det finns flexibilitet i det tidssteg du använder — du kan till exempel registrera datum en eller flera gånger på daglig, veckovis eller månatlig basis, och så vidare.
Saknade eller inkonsekvent registrerade värden i den här kolumnen är ibland acceptabla, om de kan interpoleras. Däremot kan dina datumindexvärden inte innehålla flera olika tidssteg. Till exempel, om intervallet bestäms till en gång dagligen, men vid någon tidpunkt identifieras ett intervall på två gånger dagligen, kommer ett fel att uppstå under träningen.
Målkolumn och gruppkolumner
Ditt dataset behöver ha en målkolumn som innehåller ett numeriskt mått som du vill prognostisera. Ett vanligt exempel är försäljning.
Om du använder grupper anger du historiska målvärden för varje möjligt värde i grupper som du lägger till. Till exempel, om ditt mål är Försäljning och du lägger till en grupp Butiksnummer som innehåller data för Butik A och Butik B, måste din datamängd inkludera två separata poster för varje tidssteg: en med försäljningsvärdet för Butik A, och den andra med försäljningsvärdet för Butik B.
Funktionskolumner
Du kan träna en tidsseriemodell utan några kovariater. Men, om du inkluderar kovariater, ange en kolumn i datamängden för varje funktion. Funktionsdata bör generellt vara historiskt registrerade data om du inte lägger till framtida funktioner. Framtida funktionskolumner kan innehålla både historiska och framtida data. Du bör endast inkludera framtida funktionsdata i träningsdatauppsättningen om du är säker på att de framtida värdena för dessa kolumner kommer att vara kända när du skapar förutsägelser.
Håll koll på vilka funktioner du kommer att använda som framtida funktioner, eftersom du kommer att behöva välja dem som sådana i träningskonfigurationen.
Datavolym
Ditt dataset behöver innehålla tillräckligt många poster – datavolymen bestäms av tidsintervallet som delas mellan alla grupper. Endast data från denna överlappande period används för att träna experimentet.
Volymen av din historiska data spelar en roll i att avgöra hur långt in i framtiden du kan förutsäga. Ditt önskade prognosfönster påverkar också hur mycket historisk data du behöver.
Generellt är mer historisk data bättre än mindre. Datan måste dock vara av god kvalitet och fånga de önskade trenderna. Om datan innehåller irrelevant information eller felaktigheter är det inte till hjälp att ha den i modellen. Överväg en balans mellan att optimera volym och att bibehålla kvalitet och relevans.
Exempel
Förbereder en tillämpningsdatauppsättning
När du har distribuerat en tidsseriemodell, behöver du utveckla en datauppsättning för tillämpning för vilken förutsägelser kommer att göras.
Tillämpa datamängd — Krav och validering
För tidsseriemodeller behöver tillämpningsdatauppsättningen:
-
Kolumner och kolumnrubriker för alla kolumner som ingår i träningsdatasetet.
-
Samma tidssteg som träningsdatasetet.
-
Alla grupper och gruppvärden som fanns i träningsdatasetet.
-
Lika många eller fler historiska dataposter (per mål och grupp) före prognosens bryttidpunkt som antalet poster i tillämpningsfönstret för modellen. Dessa måste vara fullständiga poster som innehåller det historiskt observerade datumet eller tidsstämpeln, samt värden för mål och kovariat. Tillämpningsfönstret bestäms av prognosfönstret och luckan som konfigurerades under träningen – ju längre in i framtiden du behöver förutsäga, desto mer historiska data behöver du i ditt tillämpningsdataset för att köra prediktioner.
-
Poster för alla framtida tidssteg i din prognoshorisont. För dessa framtida poster ska du endast inkludera värdena för datumindexkolumnen, samt eventuella framtida funktioner. Lämna värdena för de andra kolumnerna tomma.
Illustrationer som visar de nödvändiga kolumnerna och datan för datauppsättningar som ska användas för att generera prognoser från tidsserieprognosmodeller. Scenarier med inga grupper, en grupp och två grupper beskrivs.

Linjärt diagram som beskriver de nödvändiga komponenterna och tidslinjen för en tillämpningsdatauppsättning som används för att generera prognoser med en tidsserieprognosmodell.
