Arbeta med multivariata tidsserieprognoser

Med Qlik Predict kan du träna maskininlärningsmodeller för att göra prognoser för tidsspecifika mätvärden. Med hjälp av neurala nätverksbaserade metoder lär sig och förutsäger modeller komplexa mönster som involverar tidsspecifika associationer, grupperade måldata, historiska funktioner och kända framtida variabler. För att skapa en tidsserieprognos förbereder du en träningsdatauppsättning, använder den i ett tidsserieexperiment, distribuerar en modell och skapar sedan tillämpningsdatauppsättningar som du kan använda för att generera förutsägelser.

Komponenter i ett tidsserieproblem

Med tidsserieprognoser är målet att förutsäga målvärden för specifika datum i framtiden. Du kanske till exempel vill förutsäga försäljningen för nästa vecka, månad eller kvartal.

När du utvecklar ditt tidsserieproblem definierar du följande komponenter:

Mål och grupper
Datumindex
Prognoshorisont
Kovariater

Detta ramverk beskriver hur man definierar en maskininlärningsfråga för tidsserieprognosproblem. För att definiera maskininlärningsfrågor för klassificerings- och regressionsproblem, se Definiera frågor för maskininlärning.

Klicka för att visa i full storlek — Förenklad illustration som beskriver komponenterna i ett tidsserieprognosproblem i Qlik Predict.

Mål

Precis som med andra experimenttyper är målet den kolumn för vilken du vill att modellen ska förutsäga framtida värden. För tidsserieexperiment måste målet innehålla numeriska data – till exempel försäljning eller lager.

Om du använder grupper i tidsserieprognosen kommer modeller att förutsäga ett målvärde per grupp och tidssteg i prognosfönstret. Om du inte använder grupper kommer dina tränade modeller att förutsäga ett målvärde för varje tidssteg i prognosfönstret.

Datumindex

Datumindexet spårar tidsseriemätvärdena över ett kontinuerligt tidsintervall (tidssteg). Du måste bestämma dig för ditt tidssteg i ett tidigt skede: hur ofta behöver du förutsäga framtida värden?

Specifikt är datumindexet en kolumn som visas i dina tränings- och tillämpningsdatauppsättningar för tidsserieproblem. Datumindexet bestämmer strukturen för båda dessa tillämpningsdatauppsättningar – varje rad representerar ett steg i tiden (eller, med grupper, ett steg i tiden för varje unik gruppering).

När du lägger till din träningsdatauppsättning i ett tidsserieexperiment identifieras möjliga datumindexkolumner automatiskt och presenteras för dig som Insikter på kolumnnivå. Du kan identifiera dem från insikten Möjligt datumindex i schemavyn.

Grupper

Grupper är funktioner som innehåller kategorisk information för vilken du vill generera förutsägelser separat. Klassiska exempel på grupper inkluderar butiksnummer och produkt, som kunde ha använts för att organisera data för ett mål som försäljning. Genom att välja butiksnummer och produkttyp som grupper kommer dina tidsseriemodeller att ge förutsägelser för varje enskilt värde över dessa kolumner. Till exempel, med ett mål för försäljning, om du har tre butiksnummer – 1, 2 och 3 – och två produkttyper – livsmedel och färskvaror – kommer din modell att generera försäljningsförutsägelser för varje unik kombination av dessa värden.

Du bör införliva grupper i ditt tidsserieproblem om du har data och behöver individuella förutsägelser per kategori. En annan fördel med grupper är att modeller kan lära sig globalt och bättre förstå de mönster som finns mellan de olika grupperingar du definierar.

Du kan konfigurera vilka grupper som ska användas för varje experimentversion. Om du inte anger grupper men grupper identifieras i din träningsdatauppsättning kommer träningen att använda grupper.

Grupper identifieras av dubblettvärden i datumindexkolumnen – till exempel, för datumet 2025-01-14 har du två poster: en för butik A och den andra för butik B.

Varje grupp i ett tidsserieexperiment – inklusive enbart målet – anses vara separata tidsserier inom din datauppsättning. Se Vad är en tidsserie?.

Primära och sekundära grupper

För tidsserieproblem med två gruppkolumner är en grupp den primära gruppen och den andra är den sekundära gruppen. För exempel, se Förbereda en träningsdatauppsättning, Exempel på träningsdatauppsättning – två grupper och Exempel på tillämpningsdatauppsättning – två grupper.

Den primära grupperingen definierar oberoende tidsserier. Till exempel blir varje butik sin egen separata tidsserie, vilket gör att modellen kan lära sig olika beteenden och mönster i olika butiker.

Den sekundära grupperingen behandlas annorlunda. Istället för att skapa helt separata serier pivoterar systemet dessa värden till ytterligare funktioner (kovariater), vilket gör att relaterade underserier kan ge kontextuell information till varandra.

Du behöver i allmänhet inte veta vilken grupp som är den primära och vilken som är den sekundära, även om du valfritt kan välja en primär grupp i ditt experiment. Vissa överväganden gäller för att förutsäga med distribuerade tidsseriemodeller – se Förbereda en tillämpningsdatauppsättning.

Alla primära grupper bör dela samma sekundära grupper. Till exempel, om butiker är primära grupper och produkter är sekundära grupper, bör varje butik innehålla samma uppsättning produkter. Saknade sekundära grupper skulle leda till inkonsekventa funktionsdimensioner över tidsserier.

Om du förväntar dig att sekundära gruppvärden inte stämmer överens med primära gruppvärden vid förutsägelsetillfället, är ett möjligt tillvägagångssätt att kombinera de ursprungliga primära och sekundära gruppvärdena till en ny grupperingskolumn och använda den som den primära gruppen när du tränar om modellen. I denna konfiguration är modellen inte längre beroende av sekundära grupper, men korrelerad information mellan grupper kan minska.

Prognoshorisont

Prognoshorisonten anger hur långt in i framtiden du vill göra prognoser. Prognoshorisonten består av prognosfönstret (antalet tidssteg för vilka du behöver förutsägelser) och prognosgapet (ett valfritt antal tidssteg efter dina historiska data för vilka du inte vill ha förutsägelser).

Du ställer in prognosfönstret och gapstorleken när du konfigurerar en experimentversion. Dessa värden används både under modellträning och när du genererar förutsägelser från modeller som distribuerats som ML-distributioner.

Prognosfönstret är antalet tidssteg för vilka du vill förutsäga in i framtiden. Till exempel, om ditt tidssteg är en dag och du vill göra en prognos för försäljningen för de kommande två veckorna, skulle du ställa in ditt prognosfönster på 14.

Prognosgapet är den tid i framtiden för vilken du inte kräver förutsägelser. Att ställa in ett prognosgap är valfritt, eftersom du kanske eller kanske inte behöver ett. Prognosgapet börjar i slutet av de registrerade historiska träningsdata du har angett. Prognosfönstret börjar där prognosgapet slutar.

Till exempel kanske du vill förutsäga framtida försäljning, men du är bara intresserad av framtida försäljning för datum senare än en vecka efter slutet av dina indata. I det här fallet, med ett tidssteg på dagar, kan du ställa in din prognosgapstorlek på sju tidssteg.

Ditt valda prognosfönster, utöver hur mycket träningsdata du har, begränsar hur långt in i framtiden du kan göra prognoser. För mer information, se Maximalt prognosfönster.

Kovariater

I tidsserieproblem kallas funktioner ofta för kovariater. I likhet med andra maskininlärningsproblem är kovariater de andra variabler som du misstänker har ett inflytande på målets utfall. Varje kovariat representeras som en enda kolumn i din träningsdatauppsättning.

Inom tidsserieprognoser finns det flera typer av kovariater och de har några viktiga skillnader:

Statiska kovariater: Kolumner som inte varierar under en tidsserie. Statiska kovariater är tillämpliga i tidsserieexperiment där grupper används. Anta till exempel att du har grupper för Produkt och Butiksnummer, och det finns en funktion Standardrabatt. Om Produkt A i Butik 1 har en standardrabatt på 10 % och Produkt B i Butik 2 har en standardrabatt på 20 %, skulle Standardrabatt vara en statisk kovariat. Det vill säga, den varierar inte inom data för den grupp inom vilken den visas.

Statiska kovariater upptäcks automatiskt från historiska funktioner som du inkluderar i experimentet. Du behöver inte ange vilka funktioner som är statiska kovariater.
Tidigare kovariater: Tidsberoende variabler som endast är tillgängliga i historiska data och som varierar över dessa data. Tidigare kovariater upptäcks automatiskt från historiska funktioner som du inkluderar i experimentet. Du behöver inte uttryckligen ange vilka funktioner som är tidigare kovariater.
Framtida kovariater: Framtida kovariater, även kända som framtida funktioner, är tidsberoende variabler för vilka du kommer att känna till de framtida värdena inom prognoshorisonten. När du använder framtida kovariater i träning måste du ange dem som framtida funktioner i träningskonfigurationen.

Framtida funktioner

Med framtida funktioner kan du förse dina modeller med ytterligare data om framtida information som du redan känner till eller rimligen kan förvänta dig. I synnerhet har du tillgång till framtida värden för denna funktion som spänner över din valda prognoshorisont. När du definierar framtida funktioner måste du tillhandahålla både historiska och framtida data.

Till exempel, för en modell som förutsäger mätvärden som kan påverkas av framtida rabatter som erbjuds av en butik, kan du inkludera de historiskt observerade rabatterna, liksom rabatterna för framtida tidsperioder inom prognosfönstret. Andra exempel på framtida funktioner kan vara väder- eller kalenderinformation.

Andra viktiga koncept

Detta avsnitt beskriver koncept som är relevanta för ditt tidsserieproblem, men som du inte konfigurerar direkt i ett experiment eller en ML-distribution. Dessa är egenskaper som definieras av dina data eller av andra egenskaper som du konfigurerar för modellen.

Tidssteg

Tidssteget definieras av din träningsdatauppsättning och är viktigt för både träning och förutsägelser.

I din träningsdatauppsättning är tidssteget det intervall med vilket data i ditt datumindex registreras. Till exempel kan tidssteget vara dagligen, varje timme, varje minut eller varje sekund. Det minsta tidssteget som upptäcks är millisekunder.

Det är viktigt att vara medveten om det tidssteg som används i dina träningsdata. Andra experimentparametrar som du definierar, såsom prognosfönster och prognosgapstorlek, kommer att följa detta tidsstegsintervall.

Efter att du har distribuerat din modell måste de tillämpningsdata för vilka du vill skapa förutsägelser följa samma tidssteg som definierats i träningsdatauppsättningen.

Kvalitet

När du väljer en träningsdatauppsättning härleder systemet det tidssteg som används. Om det saknas några värden eller finns luckor i datumindexet kan kolumner som mål, grupper och kovariater ofta interpoleras automatiskt av systemet. Återkommande luckmönster orsakade av saknade värden hanteras automatiskt och introducerar inte i sig ett nytt tidssteg. Men om dina data innehåller verkligt blandade registreringsintervall till den grad att olika inbyggda tidssteg upptäcks, måste data åtgärdas först. Till exempel, om du har flera månader av data som registrerats en gång dagligen, men det finns ett delavsnitt där data konsekvent registreras på veckobasis, kan datauppsättningen inte användas eftersom flera tidssteg kommer att upptäckas.

Tillämpningsfönster

Tillämpningsfönstret, eller tillbakablicksperioden, är den del av träningsdata som algoritmen kan använda för att ge förutsägelserna för ditt angivna prognosfönster.

Tillämpningsfönstret beräknas och ställs in av systemet. Det mäts i tidssteg. Tillämpningsfönstret definieras av vad du ställer in som prognosfönster och gap (prognoshorisont). Din tillämpningsfönsterstorlek visas i experimentkonfigurationspanelen och Modellträningssammanfattning, efter att ha kört minst en experimentversion. Det visas också i ett ML-distributions Modellschema när du skapar eller redigerar en batchförutsägelsekonfiguration.

Tillämpningsfönstret identifieras automatiskt från din träningskonfiguration. För att generera förutsägelser för ett givet prognosfönster måste du tillhandahålla historiska data som täcker åtminstone ditt tillämpningsfönster. Detta tillhandahålls i din tillämpningsdatauppsättning. Se Förbereda en tillämpningsdatauppsättning.

Maximalt prognosfönster

Det maximala prognosfönstret uppskattas när du konfigurerar ditt tidsserieexperiment. Efter att du har kört en version av träningen bekräftas det maximala prognosfönstret med säkerhet. Det maximala prognosfönstret visas för dig som Uppskattad maximal prognos eller Maximal prognos under Baserat på dina data, när du öppnar Mål och experimenttyp i experimentkonfigurationspanelen. Det maximala prognosfönstret är det maximala antalet tidssteg för vilka du kan generera prognoser, givet ditt valda prognosfönster, hur mycket historiska data du har tillhandahållit och den minsta urvalsstorlek som förväntas av systemet. Ju mer historiska data du tillhandahåller, desto längre fram i tiden kommer du att kunna förutsäga. För att generera tillförlitliga förutsägelser är det dock viktigt att välja ett rimligt prognosfönster.

Det maximala prognosfönstret kan vara upp till 180 tidssteg.

Prognosens bryttid

Prognosens bryttid är särskilt viktig när du definierar din tillämpningsdatauppsättning under förutsägelser. Prognosens bryttid är det sista datumet i ditt urval för vilket du har ett målvärde. I grund och botten är datum efter denna bryttid de datum för vilka du vill generera förutsägelser.

Vad är en tidsserie?

I Qlik Predict-tidsserieprognoser anses varje grupp – inklusive enbart målet – vara separata tidsserier inom träningsdatauppsättningen. Anta till exempel att din träningsdatauppsättning innehåller försäljningsmätvärden. Dessa försäljningsmätvärden definieras för varje butik och produkttyp. Med kolumnerna Butik och Produkttyp definierade som grupper finns det tre tidsserier i träningsdatauppsättningen.

Förbereda en träningsdatauppsättning

För multivariata tidsserieprognoser måste din träningsdatauppsättning innehålla följande kolumner:

Datumindex
Målkolumn
Gruppkolumner (valfritt)
Funktionskolumner (valfritt – utan funktioner tränar du en univariat prognosmodell)

Datumindexkolumn

Du behöver ett datumindex som innehåller fullständiga datum eller tidsstämplar. Denna kolumn är det kronologiska index längs vilket mål- och kovariatmätvärdena spåras. Datumindexkolumnen organiserar de tidsbaserade mätningarna sekventiellt längs ett konsekvent tidsintervall (tidssteget).

Datumindexkolumnen är organiserad enligt följande, beroende på om du använder grupper eller inte:

Inga grupper: En enda post för varje tidssteg. Till exempel, med en daglig prognos representerar varje rad en enda dag.
Med grupper: En eller flera dubblettposter för varje tidssteg beroende på vilka grupper som används.

Med en multivariat träningsdatauppsättning kommer det att finnas en eller flera dubblettposter för varje tidssteg beroende på vilka grupper som används. Det finns flexibilitet i det tidssteg du använder – du kan till exempel registrera datum en eller flera gånger på daglig, veckovis eller månatlig basis, och så vidare.

Saknade eller inkonsekvent registrerade värden i denna kolumn är ibland acceptabla, om de kan interpoleras, och återkommande luckmönster för saknade värden hanteras automatiskt. Dina datumindexvärden kan dock inte innehålla flera olika inbyggda tidssteg. Till exempel, om intervallet bestäms till en gång dagligen, men vid någon tidpunkt identifieras ett intervall på två gånger dagligen, kommer ett fel att inträffa under träningen.

Målkolumn och gruppkolumner

Din datauppsättning måste ha en målkolumn som innehåller ett numeriskt mätvärde som du vill göra en prognos för. Ett vanligt exempel är försäljning.

Om du använder grupper tillhandahåller du historiska målvärden för varje möjligt värde i grupper som du lägger till. Till exempel, om ditt mål är Försäljning och du lägger till en grupp Butiksnummer som innehåller data för Butik A och Butik B, måste din datauppsättning inkludera två separata poster för varje tidssteg: en med försäljningsvärdet för Butik A och den andra med försäljningsvärdet för Butik B.

Om du har två grupper, se till att alla primära grupper delar samma sekundära grupper. Se Primära och sekundära grupper.

Funktionskolumner

Du kan träna en tidsseriemodell utan några kovariater. Men om du inkluderar kovariater, tillhandahåll en kolumn i datauppsättningen för varje funktion. Funktionsdata bör i allmänhet vara historiskt registrerade data om du inte lägger till framtida funktioner. Framtida funktionskolumner kan innehålla både historiska och framtida data. Du bör endast inkludera framtida funktionsdata i träningsdatauppsättningen om du är säker på att de framtida värdena för dessa kolumner kommer att vara kända när du skapar förutsägelser.

Håll reda på vilka funktioner du kommer att använda som framtida funktioner, eftersom du måste välja dem som sådana i träningskonfigurationen.

Datavolym

Din datauppsättning måste innehålla tillräckligt med poster – datavolymen bestäms av det tidsintervall som delas över alla grupper. Endast data från denna överlappande period används för att träna experimentet.

Volymen av dina historiska data spelar en roll för att avgöra hur långt in i framtiden du kan förutsäga. Ditt önskade prognosfönster påverkar också hur mycket historiska data du behöver.

Generellt sett är mer historiska data bättre än mindre. Data måste dock vara av god kvalitet och fånga de önskade trenderna. Om data ger irrelevant information eller innehåller felaktigheter är det inte till hjälp att ha dem i modellen. Överväg en balans mellan att optimera volymen och att bibehålla kvalitet och relevans.

Exempel

Tabellen nedan är ett trunkerat exempel på en träningsdatauppsättning som inte använder några grupper.

I det här exemplet:

Vi vill förutsäga två veckors daglig försäljning, utan gap. Observera att denna önskade prognoshorisont och gapstorlek inte anges direkt i träningsdata, men vi tillhandahåller tillräckligt med poster så att denna prognoshorisont kan användas i konfigurationen.
Date är datumindexet, med ett tidssteg på 1 dag.
Sales är målet, som spårar den totala dagliga försäljningen.
Transactions Per Hour spårar det avrundade genomsnittliga antalet transaktioner som ägde rum per timme. Detta är en tidigare kovariat som endast innehåller historiska data. Denna information kommer inte att vara känd i framtiden.
On Promotion spårar hur många produkter som är rabatterade till kampanjpriser för det angivna datumet. Det kan användas som en framtida funktion, eftersom rabatter i det här fallet är kända och planerade i förväg. I det här fallet tillhandahåller vi endast historiska (tidigare) data.

Trunkerat exempel på träningsdatauppsättning som inte innehåller några gruppkolumner
ID	Date	On Promotion	Transactions per Hour	Sales
1	1/1/2024	0	301	90010.01
2	1/2/2024	100	291	19491.65
3	1/3/2024	0	163	70001.87
4	1/4/2024	14	499	50240.33
5	1/5/2024	55	211	106943.00
6	1/6/2024	2	309	131492.59
7	1/7/2024	1341	300	46349.49
8	1/8/2024	0	432	88203.08
9	1/9/2024	0	104	40254.95
10	1/10/2024	150	495	45964.44
11	1/11/2024	65	204	90185.50
12	1/12/2024	12	252	76340.25
13	1/13/2024	70	99	71311.11
14	1/14/2024	5	305	50396.70
...	...	...	...	...
610	9/1/2025	158	168	104205.33

Tabellen nedan är ett trunkerat exempel på en träningsdatauppsättning som använder två gruppkolumner.

I det här exemplet:

Vi vill förutsäga två veckors daglig försäljning, utan gap. Observera att denna önskade prognoshorisontstorlek inte anges direkt i träningsdata, men vi tillhandahåller tillräckligt med poster så att denna prognoshorisont kan användas i konfigurationen.
Date är datumindexet, med ett tidssteg på 1 dag.
Sales är målet, som spårar den totala dagliga försäljningen.
Store och Product är grupper. För varje unikt tidssteg i träningsdata inkluderas separata rader för varje butik och produkt.

I detta sammanhang är Store den primära gruppen och Product är den sekundära gruppen.
Transactions Per Hour spårar det genomsnittliga antalet transaktioner som äger rum per timme, för varje butik och produkt. Det är en tidigare kovariat som endast innehåller historiska data. Denna information kommer inte att vara känd i framtiden.
On Promotion spårar hur många produkter som är rabatterade till kampanjpriser för det angivna datumet, för varje butik och produkt. Det kan användas som en framtida funktion, eftersom rabatter i det här fallet är kända och planerade i förväg. I det här fallet tillhandahåller vi endast historiska (tidigare) data.

Trunkerat exempel på träningsdatauppsättning som innehåller två grupper
Date	Store	Product	On Promotion	Transactions per Hour	Sales
1/1/2024	Store 1	A	0	343	90010.01
1/1/2024	Store 2	A	100	545	19491.65
1/1/2024	Store 3	A	0	1004	70001.87
1/1/2024	Store 1	B	14	305	39522.11
1/1/2024	Store 2	B	55	700	91859.30
1/1/2024	Store 3	B	2	94	19583.55
1/1/2024	Store 1	C	1341	267	194863.00
1/1/2024	Store 2	C	0	630	140244.13
1/1/2024	Store 3	C	0	1143	76666.66
1/2/2024	Store 1	A	56	576	30593.55
1/2/2024	Store 2	A	3	403	10549.33
1/2/2024	Store 3	A	14	1303	100003.33
1/2/2024	Store 1	B	29	593	105893.99
1/2/2024	Store 2	B	100	305	80195.22
1/2/2024	Store 3	B	0	305	61051.13
1/2/2024	Store 1	C	5	105	55938.38
1/2/2024	Store 2	C	33	72	104823.33
1/2/2024	Store 3	C	15	1052	99105.99
1/3/2024	Store 1	A	5	521	130533.31
1/3/2024	Store 2	A	1	205	67676.73
1/3/2024	Store 3	A	36	302	52745.45
1/3/2024	Store 1	B	111	502	99642.10
1/3/2024	Store 2	B	350	693	34660.34
1/3/2024	Store 3	B	34	200	60345.44
1/3/2024	Store 1	C	93	205	44603.33
1/3/2024	Store 2	C	60	295	105844.44
1/3/2024	Store 3	C	10	76	150385.44
...	...	...	...	...	...
9/10/2025	Store 1	A	15	1058	159383.33
9/10/2025	Store 2	A	20	402	80119.11
9/10/2025	Store 3	A	20	191	106020.00
9/10/2025	Store 1	B	39	100	39581.34
9/10/2025	Store 2	B	109	190	76939.23
9/10/2025	Store 3	B	37	99	49548.42
9/10/2025	Store 1	C	75	1555	93150.77
9/10/2025	Store 2	C	190	1603	15923.49
9/10/2025	Store 3	C	0	403	159342.05

Förbereda en tillämpningsdatauppsättning

När du har distribuerat en tidsseriemodell måste du utveckla en tillämpningsdatauppsättning för vilken förutsägelser kommer att göras.

Tillämpningsdatauppsättning – Krav och validering

För tidsseriemodeller behöver tillämpningsdatauppsättningen:

Kolumner och kolumnrubriker för alla kolumner som ingår i träningsdatasetet.
Samma tidssteg som träningsdatasetet.
Alla grupper och gruppvärden som fanns i träningsdatasetet.

Anteckning om informationOm nya gruppvärden finns i tillämpningsdatasetet (som inte fanns i träningsdata) genereras inga prediktioner för dessa rader. Om prediktioner krävs för dessa nya gruppvärden rekommenderas det att du tränar om modellen med träningsdata som inkluderar dem.
Anteckning om information
Vid prediktionstillfället eller i tillämpningsdatasetet hanteras saknade gruppvärden på följande sätt:
- Det är tillåtet att värden för primärgrupp – som modellen tränas på – saknas.
- Saknade värden för sekundärgrupp är inte tillåtna. Prediktionen misslyckas med ett fel.
Det är bäst att samla in och tillhandahålla alla data för sekundärgrupper under prediktionen när det är möjligt. Men om sekundärgrupper förväntas saknas huvudsakligen vid prediktionstillfället är en möjlig lösning att helt undvika att använda sekundärgrupper.

Istället kan du kombinera de ursprungliga värdena för primär- och sekundärgrupp till en enda ny grupperingskolumn, använda den som den nya primärgruppen och träna om modellen baserat på den strukturen. I den här konfigurationen är den nya modellen endast beroende av de nyligen introducerade primärgrupperna.

Kompromissen är att du kan förlora en del av den korrelerade informationen mellan grupper, eftersom de nu kommer att behandlas som helt separata tidsserier snarare än relaterade underserier som ger kontextuell information till varandra.
Lika många eller fler historiska dataposter (per mål och grupp) före brytpunkten för prognosen som antalet poster i tillämpningsfönstret för modellen. Dessa måste vara fullständiga poster som innehåller det historiskt observerade datumet eller tidsstämpeln, mål och kovariatvärden. Tillämpningsfönstret bestäms av prognosfönstret och gapet som konfigurerades under träningen – ju längre in i framtiden du behöver göra prediktioner, desto mer historiska data behöver du i ditt tillämpningsdataset för att köra prediktioner.
Poster för alla framtida tidssteg i din prognoshorisont. För dessa framtida poster ska du endast inkludera värdena för datumindexkolumnen, samt eventuella framtida funktioner. Lämna värdena för de andra kolumnerna tomma.

De flesta kraven på historiska data för din tillämpningsdatauppsättning är till för att ange minsta acceptabla datavolymer. Du kan alltid tillhandahålla mer än vad som behövs. När modellen genererar prediktioner används endast de poster som behövs för att täcka tillämpningsfönstret.

Exempel

Anta att du har en tidsseriemodell som är konfigurerad på följande sätt:

Mål: Sales
Inga grupper
Datumindex: Date
Tidssteg: 1 dag
Prognosfönster på 7 dagar och prognoslucka på 14 dagar. Därför är prognoshorisonten 21 dagar.
Prognosens bryttidpunkt är den 1 september 2025. Detta är det sista datumet för vilket historiska data tillhandahölls.
En tidigare kovariat Transactions Per Hour som spårar det genomsnittliga antalet transaktioner som ägde rum per timme.
En framtida kovariat On Promotion som spårar hur många produkter som är rabatterade till kampanjpriser för det angivna datumet.

I det här exemplet antas det att det systemdefinierade tillämpningsfönstret är 63 dagar. Utöver 63 dagars historiska data (1 juli 2025 till 1 september 2025) tillhandahåller datauppsättningen framtida kovariatdata för den 21 dagar långa prognoshorisonten (2 till 22 september 2025).

Fullständigt exempel på tillämpningsdatauppsättning för modell som tränats utan grupper
ID	Date	On Promotion	Transactions per Hour	Sales
548	7/1/2025	0	343	90010.01
549	7/2/2025	100	545	19491.65
550	7/3/2025	0	1004	70001.87
551	7/4/2025	14	305	39522.11
552	7/5/2025	55	700	91859.30
553	7/6/2025	2	94	19583.55
554	7/7/2025	1341	267	194863.00
555	7/8/2025	0	630	140244.13
556	7/9/2025	0	1143	76666.66
557	7/10/2025	56	576	30593.55
558	7/11/2025	3	403	10549.33
559	7/12/2025	14	1303	100003.33
560	7/13/2025	29	593	105893.99
561	7/14/2025	100	305	80195.22
562	7/15/2025	0	305	61051.13
563	7/16/2025	5	105	55938.38
564	7/17/2025	33	72	104823.33
565	7/18/2025	15	1052	99105.99
566	7/19/2025	5	521	130533.31
567	7/20/2025	1	205	67676.73
568	7/21/2025	36	302	52745.45
569	7/22/2025	111	502	99642.10
570	7/23/2025	350	693	34660.34
571	7/24/2025	34	200	60345.44
572	7/25/2025	93	205	44603.33
573	7/26/2025	60	295	105844.44
574	7/27/2025	10	76	150385.44
575	7/28/2025	402	473	40963.10
576	7/29/2025	15	1058	159383.33
577	7/30/2025	20	402	80119.11
578	7/31/2025	20	191	106020.00
579	8/1/2025	39	100	39581.34
580	8/2/2025	109	190	76939.23
581	8/3/2025	37	99	49548.42
582	8/4/2025	75	1555	93150.77
583	8/5/2025	190	1603	15923.49
584	8/6/2025	0	403	159342.05
585	8/7/2025	32	430	20451.33
586	8/8/2025	436	1000	150314.44
587	8/9/2025	1	1532	15923.91
588	8/10/2025	40	99	15944.10
589	8/11/2025	42	1058	60000.01
590	8/12/2025	25	734	39583.55
591	8/13/2025	1	569	150333.65
592	8/14/2025	305	692	124594.13
593	8/15/2025	11	164	59303.13
594	8/16/2025	60	205	150333.31
595	8/17/2025	70	186	103483.53
596	8/18/2025	25	1483	105038.13
597	8/19/2025	30	999	201857.11
598	8/20/2025	30	1533	35439.33
599	8/21/2025	30	1583	51956.24
600	8/22/2025	0	350	55334.30
601	8/23/2025	33	1509	11111.12
602	8/24/2025	145	74	15493.33
603	8/25/2025	33	140	159334.14
604	8/26/2025	59	884	45603.39
605	8/27/2025	65	239	46593.34
606	8/28/2025	16	502	74747.74
607	8/29/2025	17	158	45491.34
608	8/30/2025	15	1693	34503.11
609	8/31/2025	36	1544	159334.13
610	9/1/2025	62	1999	193803.15
611	9/2/2025	45	-	-
612	9/3/2025	32	-	-
613	9/4/2025	52	-	-
614	9/5/2025	10	-	-
615	9/6/2025	0	-	-
616	9/7/2025	13	-	-
617	9/8/2025	99	-	-
618	9/9/2025	14	-	-
619	9/10/2025	56	-	-
620	9/11/2025	32	-	-
621	9/12/2025	13	-	-
622	9/13/2025	15	-	-
623	9/14/2025	70	-	-
624	9/15/2025	71	-	-
625	9/16/2025	17	-	-
626	9/17/2025	3	-	-
627	9/18/2025	0	-	-
628	9/19/2025	32	-	-
629	9/20/2025	4	-	-
630	9/21/2025	15	-	-
631	9/22/2025	0	-	-

Anta att du har en tidsseriemodell som är konfigurerad på följande sätt:

Mål: Sales
Datumindex: Date
Tidssteg: 1 dag
Store och Product är grupper. I det här sammanhanget är Store den primära gruppen och Product är den sekundära gruppen.
Prognosfönster på 3 dagar och prognoslucka på 1 dag. Därför är prognoshorisonten 4 dagar.
Prognosens bryttidpunkt är den 1 september 2025. Detta är det sista datumet för vilket historiska data tillhandahölls.
En tidigare kovariat Transactions Per Hour som spårar det genomsnittliga antalet transaktioner som äger rum per timme, för varje butik och produkt.
En framtida kovariat On Promotion som spårar hur många produkter som är rabatterade till kampanjpriser för det angivna datumet, för varje butik och produkt.

I det här exemplet antas det att det systemdefinierade tillämpningsfönstret är 12 dagar. Utöver 12 dagars historiska data (21 augusti till 1 september 2025) tillhandahåller datauppsättningen framtida kovariatdata för den 4 dagar långa prognoshorisonten (2 till 5 september 2025).

Fullständigt exempel på tillämpningsdatauppsättning för modell som tränats med två grupper
Date	Store	Product	On Promotion	Transactions per Hour	Sales
8/21/2025	Store 1	A	0	343	90010.01
8/21/2025	Store 2	A	100	545	19491.65
8/21/2025	Store 3	A	0	1004	70001.87
8/21/2025	Store 1	B	14	305	39522.11
8/21/2025	Store 2	B	55	700	91859.30
8/21/2025	Store 3	B	2	94	19583.55
8/21/2025	Store 1	C	1341	267	194863.00
8/21/2025	Store 2	C	0	630	140244.13
8/21/2025	Store 3	C	0	1143	76666.66
8/22/2025	Store 1	A	56	576	30593.55
8/22/2025	Store 2	A	3	403	10549.33
8/22/2025	Store 3	A	14	1303	100003.33
8/22/2025	Store 1	B	29	593	105893.99
8/22/2025	Store 2	B	100	305	80195.22
8/22/2025	Store 3	B	0	305	61051.13
8/22/2025	Store 1	C	5	105	55938.38
8/22/2025	Store 2	C	33	72	104823.33
8/22/2025	Store 3	C	15	1052	99105.99
8/23/2025	Store 1	A	5	521	130533.31
8/23/2025	Store 2	A	1	205	67676.73
8/23/2025	Store 3	A	36	302	52745.45
8/23/2025	Store 1	B	111	502	99642.10
8/23/2025	Store 2	B	350	693	34660.34
8/23/2025	Store 3	B	34	200	60345.44
8/23/2025	Store 1	C	93	205	44603.33
8/23/2025	Store 2	C	60	295	105844.44
8/23/2025	Store 3	C	10	76	150385.44
8/24/2025	Store 1	A	402	473	80195.22
8/24/2025	Store 2	A	15	1058	61051.13
8/24/2025	Store 3	A	20	402	55938.38
8/24/2025	Store 1	B	20	191	104823.33
8/24/2025	Store 2	B	39	100	11111.12
8/24/2025	Store 3	B	109	190	15493.33
8/24/2025	Store 1	C	37	99	159334.14
8/24/2025	Store 2	C	75	1555	45603.39
8/24/2025	Store 3	C	190	1603	19491.65
8/25/2025	Store 1	A	0	403	70001.87
8/25/2025	Store 2	A	32	430	45642.25
8/25/2025	Store 3	A	436	1000	25633.19
8/25/2025	Store 1	B	1	1532	19191.31
8/25/2025	Store 2	B	40	99	90010.01
8/25/2025	Store 3	B	42	1058	19491.65
8/25/2025	Store 1	C	25	734	70001.87
8/25/2025	Store 2	C	1	569	39522.11
8/25/2025	Store 3	C	305	692	91859.30
8/26/2025	Store 1	A	11	164	19583.55
8/26/2025	Store 2	A	60	205	194863.00
8/26/2025	Store 3	A	70	186	140244.13
8/26/2025	Store 1	B	25	1483	76666.66
8/26/2025	Store 2	B	30	999	30593.55
8/26/2025	Store 3	B	30	1533	10549.33
8/26/2025	Store 1	C	30	1583	100003.33
8/26/2025	Store 2	C	0	350	105893.99
8/26/2025	Store 3	C	33	1509	80195.22
8/27/2025	Store 1	A	145	74	61051.13
8/27/2025	Store 2	A	33	140	55938.38
8/27/2025	Store 3	A	59	884	104823.33
8/27/2025	Store 1	B	65	239	99105.99
8/27/2025	Store 2	B	16	502	130533.31
8/27/2025	Store 3	B	17	158	67676.73
8/27/2025	Store 1	C	15	1693	52745.45
8/27/2025	Store 2	C	36	1544	99642.10
8/27/2025	Store 3	C	62	1999	34660.34
8/28/2025	Store 1	A	45	343	60345.44
8/28/2025	Store 2	A	32	545	44603.33
8/28/2025	Store 3	A	52	1004	105844.44
8/28/2025	Store 1	B	10	305	150385.44
8/28/2025	Store 2	B	0	700	40963.10
8/28/2025	Store 3	B	13	94	159383.33
8/28/2025	Store 1	C	99	267	80119.11
8/28/2025	Store 2	C	14	630	106020.00
8/28/2025	Store 3	C	56	1143	39581.34
8/29/2025	Store 1	A	32	576	76939.23
8/29/2025	Store 2	A	13	403	49548.42
8/29/2025	Store 3	A	15	1303	93150.77
8/29/2025	Store 1	B	70	593	15923.49
8/29/2025	Store 2	B	71	305	159342.05
8/29/2025	Store 3	B	17	305	20451.33
8/29/2025	Store 1	C	3	105	150314.44
8/29/2025	Store 2	C	0	72	15923.91
8/29/2025	Store 3	C	32	1052	15944.10
8/30/2025	Store 1	A	4	521	60000.01
8/30/2025	Store 2	A	15	205	39583.55
8/30/2025	Store 3	A	0	302	150333.65
8/30/2025	Store 1	B	15	502	124594.13
8/30/2025	Store 2	B	20	693	59303.13
8/30/2025	Store 3	B	20	200	150333.31
8/30/2025	Store 1	C	39	205	103483.53
8/30/2025	Store 2	C	109	295	105038.13
8/30/2025	Store 3	C	37	76	201857.11
8/31/2025	Store 1	A	75	1058	35439.33
8/31/2025	Store 2	A	190	402	51956.24
8/31/2025	Store 3	A	0	191	55334.30
8/31/2025	Store 1	B	0	100	11111.12
8/31/2025	Store 2	B	100	190	15493.33
8/31/2025	Store 3	B	0	99	159334.14
8/31/2025	Store 1	C	14	1555	45603.39
8/31/2025	Store 2	C	55	1603	46593.34
8/31/2025	Store 3	C	2	403	74747.74
9/1/2025	Store 1	A	1341	158	45491.34
9/1/2025	Store 2	A	0	1693	34503.11
9/1/2025	Store 3	A	0	1544	159334.13
9/1/2025	Store 1	B	56	1999	193803.15
9/1/2025	Store 2	B	3	343	76666.66
9/1/2025	Store 3	B	14	545	30593.55
9/1/2025	Store 1	C	29	303	10549.33
9/1/2025	Store 2	C	100	154	100003.33
9/1/2025	Store 3	C	0	531	34351.42
9/2/2025	Store 1	A	5	-	-
9/2/2025	Store 2	A	33	-	-
9/2/2025	Store 3	A	15	-	-
9/2/2025	Store 1	B	5	-	-
9/2/2025	Store 2	B	1	-	-
9/2/2025	Store 3	B	36	-	-
9/2/2025	Store 1	C	111	-	-
9/2/2025	Store 2	C	350	-	-
9/2/2025	Store 3	C	34	-	-
9/3/2025	Store 1	A	93	-	-
9/3/2025	Store 2	A	60	-	-
9/3/2025	Store 3	A	10	-	-
9/3/2025	Store 1	B	465	-	-
9/3/2025	Store 2	B	22	-	-
9/3/2025	Store 3	B	249	-	-
9/3/2025	Store 1	C	50	-	-
9/3/2025	Store 2	C	15	-	-
9/3/2025	Store 3	C	25	-	-
9/4/2025	Store 1	A	1	-	-
9/4/2025	Store 2	A	0	-	-
9/4/2025	Store 3	A	112	-	-
9/4/2025	Store 1	B	50	-	-
9/4/2025	Store 2	B	75	-	-
9/4/2025	Store 3	B	130	-	-
9/4/2025	Store 1	C	139	-	-
9/4/2025	Store 2	C	136	-	-
9/4/2025	Store 3	C	168	-	-
9/5/2025	Store 1	A	155	-	-
9/5/2025	Store 2	A	73	-	-
9/5/2025	Store 3	A	19	-	-
9/5/2025	Store 1	B	103	-	-
9/5/2025	Store 2	B	54	-	-
9/5/2025	Store 3	B	23	-	-
9/5/2025	Store 1	C	24	-	-
9/5/2025	Store 2	C	134	-	-
9/5/2025	Store 3	C	193	-	-

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!

Lämna din feedback här